免费体验区试着一分,亚洲国产A∨无码中文777

原標(biāo)題：CVPR 2019：頻頻犯錯的無人車，可能缺了一個“域適應(yīng)”

即將在6月舉行的CVPR 2019，是機器視覺方向最重要的學(xué)術(shù)會議。評選結(jié)果已經(jīng)宣布，今年論文量增加了56%，與無人駕駛相關(guān)的論文和項目也是扎堆亮相。其中的一大亮點，就是以自動駕駛視覺為核心的CVPR WAD 挑戰(zhàn)賽。

今年的挑戰(zhàn)賽中，伯克利和滴滴將分別開放了自家的超大規(guī)模駕駛視頻數(shù)據(jù)集BDD100K和D2-City，BDD100K包含10萬個美國公開駕駛視頻，D2-City提供中國幾大城市的超過10000個視頻記錄。這些數(shù)據(jù)集都被標(biāo)注了好了所有道路物體，以及天氣、道路和交通條件等關(guān)鍵對象和數(shù)據(jù)，以此催生能夠改變無人駕駛安全隱憂的算法。

按照伯克利的規(guī)劃，這次挑戰(zhàn)將集中在目標(biāo)檢測與目標(biāo)跟蹤任務(wù)的域適應(yīng)上，并能夠在中美的不同城市場景中實現(xiàn)自動遷移。

那么，域適應(yīng)對自動駕駛的安全問題究竟有多重要？我們通過一篇文章來搶先了解一下。

論自動駕駛的倒掉與重生

在解釋“域適應(yīng)”之前，有必要先搞清楚，現(xiàn)在的自動駕駛技術(shù)都在頭痛哪些問題。

盡管無人駕駛測試車的上路里程和接管數(shù)據(jù)都越來越漂亮，但對于機器學(xué)習(xí)模型來說，如何在新的、未知的環(huán)境中也能和測試道路上表現(xiàn)的一樣優(yōu)秀，這仍然是一個公開的難題。

舉個例子，自動駕駛汽車可以利用在硅谷的道路測試數(shù)據(jù)集訓(xùn)練出一個表現(xiàn)良好的無人車模型。然而，同樣的模型如果被部署在波士頓這樣多雪天氣的地區(qū)，就可能表現(xiàn)得很糟糕，因為機器以前從來沒有見過雪。如何在差異化的環(huán)境中進行有效的自主操作，復(fù)用自己學(xué)到的經(jīng)驗，這仍然是機器學(xué)習(xí)的一個難點。

如果說波士頓和硅谷，由于氣候和路況上的巨大差異，在一年的任何時候，都可以被系統(tǒng)標(biāo)記為不同的域，可以通過不同的模型來解決。那么面對高度相似域，比如同樣是城市街景，但北京和重慶卻有著不同的道路設(shè)計，難度于是再一次升級了。

以往的解決方案是“吃一塹，長一智”。收集訓(xùn)練集（包括失敗范例）的數(shù)據(jù)，提取特征，然后讓機器依據(jù)經(jīng)驗誤差最小準(zhǔn)則學(xué)習(xí)分類器。但這樣容易產(chǎn)生三個問題：

一是域之間的遷移效果不穩(wěn)定。如果訓(xùn)練集和測試集分布一致，則模型的遷移效果較好。如果分布不一致，在源域過擬合，目標(biāo)域上則表現(xiàn)并不讓人滿意。

二是有限的變化性。通過標(biāo)注好的訓(xùn)練數(shù)據(jù)集所學(xué)會的策略，往往只能應(yīng)對特定的環(huán)境和物理系統(tǒng)。而真實的世界常常會遇到動態(tài)變化，比如異常光線、特殊氣候現(xiàn)象等等，這些都會改變域?qū)傩圆⒆専o人車不知所措。

三是社會輿論的高風(fēng)險性。要讓無人車系統(tǒng)從失敗中吸取經(jīng)驗，首先，它要先犯錯。但這在目前普通居民對無人車安全非常擔(dān)憂的大環(huán)境下，無人車碰撞、剮蹭、識別太慢等問題都會被拿出來質(zhì)疑，再采用依靠事故數(shù)據(jù)來學(xué)習(xí)如何避免錯誤的方法無疑是災(zāi)難性的。

顯然，我們需要借助其他方法來調(diào)教無人車，來減少它在陌生環(huán)境中失敗的次數(shù)?！坝蜃赃m應(yīng)”就是其中之一。

那么，到底什么是域自適應(yīng)學(xué)習(xí)？

先解釋兩個關(guān)鍵概念：

一是源域（source domain）表示與測試樣本不同的領(lǐng)域，但是有豐富的標(biāo)注數(shù)據(jù)。比如伯克利和滴滴的駕駛視頻數(shù)據(jù)集BDD100K，以及D2-City。

一個是目標(biāo)域（target domain）表示測試樣本所在的領(lǐng)域，無標(biāo)簽或者只有少量標(biāo)簽。當(dāng)一輛無人車測試車從硅谷變換到波士頓的道路上，它面對的就是一個全新的目標(biāo)域。

如何盡可能地復(fù)用它在源域數(shù)據(jù)集中得到的先驗知識，盡可能準(zhǔn)確地對目標(biāo)域物體實現(xiàn)檢測、跟蹤等學(xué)習(xí)任務(wù)，就成為無人車模型要面臨的一大問題。

我們再將任務(wù)分門別類梳理一下：

1.域適應(yīng)的可能性。簡單來說，就是滿足哪些條件才有可能實現(xiàn)域自適應(yīng)學(xué)習(xí)。這對模型的學(xué)習(xí)能力（算法也有學(xué)霸和學(xué)渣之分）、源域和目標(biāo)域的相關(guān)性（比如硅谷和重慶的路面差異）、算法的誤差界分析（源域和目標(biāo)域必須同時滿足最小近似誤差）、學(xué)習(xí)任務(wù)的先驗知識等，這四個問題的妥善解決，才能有效幫助機器進行域自適應(yīng)學(xué)習(xí)。

2.魯棒性。在域自適應(yīng)學(xué)習(xí)中，訓(xùn)練樣本和測試樣本之間的分布不一致，因此導(dǎo)致源域上訓(xùn)練的模型往往不適用于目標(biāo)域的學(xué)習(xí)。而域自適應(yīng)學(xué)習(xí)的魯棒性則能夠度量算法對訓(xùn)練樣本改變的敏感程度，從而克服目標(biāo)域泛化誤差界的“擾動”。簡單來說域自適應(yīng)學(xué)習(xí)模型就是一枚“暖男”，對誤差的包容性更強。

3.統(tǒng)計估計的一致性。在確保模型可以對目標(biāo)域進行學(xué)習(xí)之后，就需要解決域適應(yīng)學(xué)習(xí)有效性的問題了。

這往往依賴于有效的源域和目標(biāo)域的概率分布判斷也就是最考驗機器智商的一致性分析。使用盡可能少的樣本數(shù)，實現(xiàn)最小的誤差上界。好的域自適應(yīng)性學(xué)習(xí)算法是不允許“偏科”的，泛化能力得非常強才行。

說了這么多，不難看出域自適應(yīng)性學(xué)習(xí)本質(zhì)上和人類的學(xué)習(xí)模式極為相似：在課堂上學(xué)習(xí)前人總結(jié)好的科學(xué)知識，然后在與現(xiàn)實的交流過程中不斷擴充新的知識并進行探索，完成對復(fù)雜事物的認(rèn)知，從而達(dá)到自主學(xué)習(xí)、適應(yīng)新科目的目的。

無人車的域自適應(yīng)性學(xué)習(xí)也是同樣的邏輯：先利用已有的標(biāo)注數(shù)據(jù)進行初始化學(xué)習(xí)，然后在大量未標(biāo)注的數(shù)據(jù)中不斷依據(jù)先驗知識進行樣本挖掘，以增量地學(xué)習(xí)模型和適配未標(biāo)注數(shù)據(jù)，從而在陌生的道路環(huán)境中也能表現(xiàn)良好地完成學(xué)習(xí)任務(wù)。

目前看來，域自適應(yīng)性學(xué)習(xí)也是完成無人駕駛視覺任務(wù)成本效益較高的方式。

新的算法還在路上

既然“域適應(yīng)”對于無人駕駛來說如此重要，那么目前究竟有哪些比較值得一覽的算法呢？

目前看來，由于無人駕駛?cè)蝿?wù)自身的復(fù)雜性，往往需要從多數(shù)據(jù)源向目標(biāo)域進行遷移學(xué)習(xí)，這就必須考慮兩個難題：

一是多種源域數(shù)據(jù)本身之間具有偏差，比如伯克利的數(shù)據(jù)集BDD100K覆蓋了不同的時間、光照、天氣和地理位置，甚至包含了GPS和IMU以及對應(yīng)的時間戳信息；

二是多種源域數(shù)據(jù)間類別存在偏差。比如滴滴D2-City數(shù)據(jù)集中，將注釋了包圍框和跟蹤ID的道路對象分為12個不同的類別，而伯克利的數(shù)據(jù)集BDD100K中的GT框標(biāo)簽則只有10個類別。

這些都對算法性能提出了不少挑戰(zhàn)。在此，我們不妨列舉幾個具有代表性的算法，看看他們是如何解決無人駕駛相關(guān)技術(shù)難題的：

1.自適應(yīng)曝光算法。前面提到，不同城市和路面環(huán)境的光線強弱都是不同的，為保證無人駕駛車輛在各種光線環(huán)境都能夠獲取可靠的道路信息，有研究人員提出了一種自適應(yīng)曝光算法。利用光學(xué)傳感器將采集圖像轉(zhuǎn)化為灰度值，并逐行進行動態(tài)閾值比對處理，快速獲取下一周期正確曝光點。在道路實際的測試中，該算法能夠快速并有效獲取道路信息，后續(xù)的邊界處理較為清晰。

2.路面障礙物檢測。原理是利用已有的先驗知識，比如從源域圖像中學(xué)會辨識障礙物的顏色、邊緣、紋理特征等等，對目標(biāo)域道路上的不同車輛進行分析并快速提取出障礙物。

這方面的算法很多，比如Zielke等人利用馬路邊緣的對稱性與顯著性來提取馬路邊緣信息。Kuehnle等人基于圖像中車輪的對稱性來識別車的后輪。Crisman等人利用視覺圖像中的顏色信息實現(xiàn)了馬路跟隨等等，都從不同程度提升了無人駕駛目標(biāo)檢測的性能。

3.多源域數(shù)據(jù)遷移算法。商湯的研究人員提出了一種名為“雞尾酒”的網(wǎng)絡(luò)，以解決將知識從多源域的數(shù)據(jù)向目標(biāo)域遷移的問題，來幫助無人車模型更有效地識別新環(huán)境。

具體的做法是，利用共享特征網(wǎng)絡(luò)，對所有源域以及目標(biāo)域進行特征建模，然后利用多路對抗域適應(yīng)技術(shù)（類似于GAN生成器），每個源域分別與目標(biāo)域進行兩兩組合對抗，以此明確學(xué)習(xí)域的不變特征，極大程度地降低系統(tǒng)因數(shù)據(jù)偏差而對環(huán)境進行誤判。

歸根結(jié)底，“域自適應(yīng)”方法不僅降低了訓(xùn)練風(fēng)險，也有效地提升了系統(tǒng)的學(xué)習(xí)性能。從這個角度想，就更期待在CVPR 2019挑戰(zhàn)賽中見到新的黑馬了！

多說一點

現(xiàn)在看到“無人駕駛”這四個字，絕大多數(shù)人會想到什么？圈內(nèi)人可能會覺得“涼”，而普通民眾則是“反感”。

2019第一季度剛剛過去，關(guān)于無人駕駛的負(fù)面新聞層出不窮：

去年創(chuàng)下融資紀(jì)錄的RoadStar.ai星行科技死于內(nèi)訌，成為第一家倒下的無人車公司；蘋果自動駕駛部門裁員190人，無人車數(shù)量減少到62輛；有吳恩達(dá)背景的美國自動駕駛創(chuàng)業(yè)公司Drive.ai上個月也傳出了“賣身”的消息。

產(chǎn)業(yè)之所以受挫，實在是因為無人車的安全性難以完全說服民眾。

就在前兩天，有研究人員通過在路上貼貼紙之類的“物理攻擊”就讓特斯拉的自動駕駛汽車并入了反向車道，甚至還能在沒有車主授權(quán)的狀態(tài)下用Xbox 游戲手柄操控。

即便是在無人車最為成熟的灣區(qū)，也有不少當(dāng)?shù)鼐用裨サ脑?，拿槍的拿槍，讓人對無人駕駛的未來有點灰心。

而當(dāng)前景變得不再明朗的時候，或許，追求技術(shù)才是最終的續(xù)命之道。

以往在計算機視覺、機器學(xué)習(xí)等領(lǐng)域的頂級會議中，關(guān)于域適應(yīng)的研究都集中在圖像分類和語義分割方面，很少看到實例級任務(wù)上的應(yīng)用，如目標(biāo)檢測及跟蹤，盡管它們對于無人駕駛來說更加重要。

當(dāng)然，想要讓“域適應(yīng)”幫助無人車更有效的訓(xùn)練，只靠伯克利和滴滴在CVPR 2019中釋放的數(shù)據(jù)集或某一場比賽還遠(yuǎn)遠(yuǎn)不夠，還要為研究者提供更多元的支持，比如增強研究團隊與車企的聯(lián)系，圍繞真實需求進行配套研發(fā)等等。

在此之前，這項復(fù)雜的技術(shù)還是老老實實地待在實驗室和測試道路上吧。

免責(zé)聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請進一步核實，并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏，概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時，應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后，將會依法盡快聯(lián)系相關(guān)文章源頭核實，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

CVPR 2019：頻頻犯錯的無人車，可能缺了一個“域適應(yīng)”

下一篇

CVPR 2019：頻頻犯錯的無人車，可能缺了一個“域適應(yīng)”