特斯拉依舊頭鐵堅(jiān)持視覺(jué)路線,激光雷達(dá)會(huì)笑到最后嗎?

原標(biāo)題:特斯拉依舊頭鐵堅(jiān)持視覺(jué)路線,激光雷達(dá)會(huì)笑到最后嗎?

近日,馬斯克在特斯拉的AI日上大秀肌肉,人形機(jī)器人、超級(jí)計(jì)算機(jī) Dojo的亮相,純視覺(jué)路線工作原理的展示,無(wú)不透露著其技術(shù)信心。在一眾廠商都選擇激光雷達(dá)方案作為視覺(jué)感知路線時(shí),特斯拉依然堅(jiān)持純視覺(jué)路線并且旗幟拉得更高往深處走了。

我們知道自動(dòng)駕駛的底層原理是感知、決策、執(zhí)行三個(gè)步驟的結(jié)合,感知層運(yùn)用視覺(jué)傳感器獲得周圍路況信息,通過(guò)車身的設(shè)備端及云端處理數(shù)據(jù)并獲得執(zhí)行命令,使得汽車獲得自動(dòng)駕駛的能力。三個(gè)基本步驟中感知作為首要步驟,對(duì)后續(xù)的決策和執(zhí)行起著先決作用。在感知層面上市場(chǎng)中目前有兩種技術(shù)路線:視覺(jué)感知與激光雷達(dá)感知。

激光雷達(dá)派認(rèn)為,攝像頭做主導(dǎo)的視覺(jué)感知精度不夠,如果自動(dòng)駕駛要發(fā)展到L3級(jí)別以上,就應(yīng)當(dāng)采用激光雷達(dá)。視覺(jué)感知派認(rèn)為,攝像頭感知的環(huán)境信息數(shù)據(jù)豐富,并且可以對(duì)物體進(jìn)行分類后續(xù)方便標(biāo)注,最關(guān)鍵的是成本低廉,這些是激光雷達(dá)做不到的。

無(wú)論是從技術(shù)還是成本角度分析,兩種方案核心差異在于是否需要激光雷達(dá)的輔助,才有可能實(shí)現(xiàn)高級(jí)別自動(dòng)駕駛。到底孰優(yōu)孰劣,兩派爭(zhēng)論不休。那么,兩種技術(shù)路線究竟誰(shuí)能笑到最后?

激光雷達(dá)vs視覺(jué)感知性能比拼

激光雷達(dá)感知技術(shù)是以激光雷達(dá)為主導(dǎo),毫米波雷達(dá)、超聲波傳感器及攝像頭作為輔助。激光雷達(dá)感知環(huán)境的工作原理,是通過(guò)激光雷達(dá)發(fā)射激光束,測(cè)量激光在發(fā)射及收回過(guò)程其中的時(shí)間差、相位差,來(lái)確定車與物體之間的相對(duì)距離,實(shí)現(xiàn)環(huán)境實(shí)時(shí)感知及避障功能。

激光雷達(dá)具有較長(zhǎng)的探測(cè)距離與較高的精準(zhǔn)度,抗干擾能力強(qiáng),可以主動(dòng)檢測(cè)周圍多物體環(huán)境,獲取周圍環(huán)境點(diǎn)云構(gòu)建3D環(huán)境模型。即使夜間光線不好,也不會(huì)影響探測(cè)效果。雖然激光雷達(dá)不怕暗光但是對(duì)于天氣敏感,雨雪、沙塵、大霧天氣等影響激光雷達(dá)識(shí)別效果。激光雷達(dá)融合高精地圖方案可有效彌補(bǔ)視覺(jué)方案環(huán)境依賴度高、算力需求大的缺陷,其性能優(yōu)勢(shì)使得大多車廠將激光雷達(dá)列為面向L3級(jí)及以上級(jí)別自動(dòng)駕駛不可或缺的感知器件。

視覺(jué)感知是以攝像頭為主導(dǎo)的方案,攝像頭成本相較激光雷達(dá)優(yōu)勢(shì)極大。攝像頭的價(jià)格在幾十美元左右,而激光雷達(dá)在幾百美元,是其數(shù)倍。再者攝像頭技術(shù)逐漸成熟,高分辨率、高幀率成像技術(shù)使得感知的環(huán)境信息更為豐富,但攝像頭在黑暗環(huán)境中感知受限,精度及安全性有所下降。

例如特斯拉最為詬病的幽靈剎車故障,就是在一些隧道和大橋陰影處,因?yàn)閿z像頭的結(jié)構(gòu)原因,算法將突然出現(xiàn)的陰影當(dāng)做障礙物導(dǎo)致車輛會(huì)突然自動(dòng)減速,造成安全隱患。視覺(jué)方案中比較硬件性能,攝像頭功能被秒成渣渣。得益于軟件算法的加成,視覺(jué)方案才能依靠強(qiáng)大的算法保證圖像處理、決策執(zhí)行的功能正常進(jìn)行。

與激光雷達(dá)相比,視覺(jué)感知的弱點(diǎn)較為明顯:攝像頭依賴光線條件,感知方式精度較低,對(duì)算法、算力的依賴程度和要求極高,而數(shù)據(jù)的獲取及算法迭代壁壘高。性能方面激光雷達(dá)明顯勝出,特斯拉花費(fèi)巨大的成本在算力和算法上,投入不小,頭鐵一直挺身堅(jiān)持視覺(jué)感知路線,到底是有哪些角度的考量呢?

特斯拉專注純視覺(jué)路線邏輯

在馬斯克看來(lái),“純視覺(jué)感知才是通往真實(shí)世界 AI 的道路”,而這也是他解決問(wèn)題奉行

的底層思路——第一性原理,即回歸事物最基本的條件,將其拆分成各要素進(jìn)行結(jié)構(gòu)分析,從而找到實(shí)現(xiàn)目標(biāo)的最優(yōu)路徑。

在駕駛車輛的過(guò)程中,我們是通過(guò)眼睛收集路況信息輔以大腦處理的方式進(jìn)行,那自動(dòng)駕駛按理說(shuō)也能通過(guò)視覺(jué)感知輔以算法處理的方式進(jìn)行安全駕駛。特斯拉想要做的就是模仿人類視覺(jué)獲取信息的能力來(lái)實(shí)現(xiàn)自動(dòng)駕駛。既然視覺(jué)攝像頭的感知方式精度較低,那么就依靠特斯拉獨(dú)有的數(shù)據(jù)優(yōu)勢(shì)和構(gòu)建算力、算法的能力來(lái)抹平這個(gè)缺陷。

數(shù)據(jù)方面,當(dāng)其他自動(dòng)駕駛廠商還在路測(cè)階段收集數(shù)據(jù),特斯拉得益于在全球售出數(shù)百萬(wàn)輛有攝像頭的汽車,已經(jīng)積累了海量真實(shí)路況的數(shù)據(jù)。用于深度學(xué)習(xí)模型訓(xùn)練的數(shù)據(jù)讓特斯拉的算法早已建立起壁壘,而這些數(shù)據(jù)樣本的積累速度與算法的效率其他廠商無(wú)法復(fù)制,只能干瞪眼瞎著急。

算力方面,特斯拉新建立的超級(jí)計(jì)算機(jī) Dojo,擁有強(qiáng)大的算力,這個(gè)超級(jí)計(jì)算機(jī)就是為特斯拉的自動(dòng)駕駛系統(tǒng)設(shè)立,用來(lái)集中力量訓(xùn)練 Autopilot 在內(nèi)的整個(gè)自動(dòng)駕駛系統(tǒng)。

而在攝像頭的技術(shù)層面,特斯拉也進(jìn)行了技術(shù)的革新,使用“偽激光雷達(dá)”技術(shù)代替,對(duì)攝像頭中的像素進(jìn)行深度估計(jì),類似激光雷達(dá)的點(diǎn)云功能一般形成3D目標(biāo)檢測(cè),提高了深度估計(jì)的準(zhǔn)確性,激光雷達(dá)和相機(jī)之間的差距開(kāi)始縮小。

人們駕駛車輛的時(shí)候依賴視覺(jué),我們的神經(jīng)網(wǎng)絡(luò)可以處理視覺(jué)信息中的距離、速度等信號(hào),而特斯拉的神經(jīng)網(wǎng)絡(luò)似乎也可以逐漸做到。特斯拉的視覺(jué)感知路線,逐漸在縮小與激光雷達(dá)方案的差距,但是其背后所付出的代價(jià),讓后來(lái)者們無(wú)法跟隨復(fù)制,這也為特斯拉建立起強(qiáng)大的壁壘。純視覺(jué)方案以海量樣本數(shù)據(jù)訓(xùn)練學(xué)習(xí)和先進(jìn)的圖像處理算法算力支撐,注定是一個(gè)少數(shù)攀登者選擇的艱難路線。

特斯拉首席AI科學(xué)家Karpathy在今年CVPR 2021自動(dòng)駕駛研討會(huì)上表示,基于純視覺(jué)的自動(dòng)駕駛方案在技術(shù)實(shí)現(xiàn)上更加困難,因?yàn)樗枰窠?jīng)網(wǎng)絡(luò)僅基于視頻輸入就可以運(yùn)行得非常好。不過(guò)好處就是“一旦真正讓它工作起來(lái),它就是一個(gè)通用的視覺(jué)系統(tǒng),可以部署在地球上的任何地方”。

視覺(jué)感知系統(tǒng)未來(lái)不僅僅是部署在汽車上,也可以部署在任何需要視覺(jué)系統(tǒng)功能的其他產(chǎn)品上,比如機(jī)器人、無(wú)人機(jī)、AR/VR等,成為通用的能力,而這也是特斯拉的未來(lái)考量和野心。雖然特斯拉設(shè)想的未來(lái)美好,但是現(xiàn)實(shí)中,現(xiàn)下的視覺(jué)感知方案與激光雷達(dá)方案相比,還是有差距。我們?cè)谛侣勚腥匀粫?huì)看到,特斯拉汽車因識(shí)別感知出現(xiàn)問(wèn)題而發(fā)生車禍的安全事故,目前激光雷達(dá)派在安全方面還是笑著走在前面的。

激光雷達(dá)能笑到最后嗎?

兩個(gè)流派誰(shuí)能笑到最后,也是考量規(guī)模量產(chǎn)與視覺(jué)路線技術(shù)的迭代誰(shuí)的速度更快,我們可以通過(guò)數(shù)據(jù)發(fā)現(xiàn),新注冊(cè)雷達(dá)企業(yè)越來(lái)越多。數(shù)據(jù)顯示,目前我國(guó)雷達(dá)相關(guān)企業(yè)共有1.4萬(wàn)家,2020年新注冊(cè)企業(yè)2640家,同比增長(zhǎng)29.3%。而上市公司禾賽科技、巨頭華為等發(fā)布的低成本激光雷達(dá)產(chǎn)品,已經(jīng)準(zhǔn)備量產(chǎn)。

供應(yīng)端的增長(zhǎng)態(tài)勢(shì)發(fā)展來(lái)源于需求端的龐大需求,絕大部分從事L3、L4級(jí)別自動(dòng)駕駛的公司,包括初創(chuàng)公司和大公司,都采用了激光雷達(dá),并且大多數(shù)都是購(gòu)買激光雷達(dá)而不是自研的方式。

激光雷達(dá)方案,因?yàn)橛布呔刃阅軒?lái)的安全優(yōu)勢(shì),暫時(shí)的成本高也能被市場(chǎng)接受。大部分玩家接受激光雷達(dá)方案,使得需求端大,其產(chǎn)能也跟著擴(kuò)大,規(guī)模量產(chǎn)在路上,而未來(lái)的成本也會(huì)因?yàn)橐?guī)模優(yōu)勢(shì)進(jìn)一步降低,建立良性循環(huán)。

經(jīng)過(guò)超過(guò)10年的發(fā)展,激光雷達(dá)被證明了是實(shí)現(xiàn)高級(jí)別自動(dòng)駕駛的必備傳感器,特斯拉在這一態(tài)勢(shì)下也在著急研發(fā),同時(shí)秀肌肉招人。此前,特斯拉與激光雷達(dá)技術(shù)公司Luminar簽訂了一份使用激光雷達(dá)進(jìn)行測(cè)試和開(kāi)發(fā)的合同的消息,引來(lái)大家伙的猜度。雖然后來(lái)特斯拉澄清自己會(huì)堅(jiān)持純視覺(jué)路線一條道走到底,但是其使用激光雷達(dá)行為居心難測(cè)。

純視覺(jué)路線,攝像頭便宜但安全性堪憂,與算法、算力能力掛鉤,特斯拉依賴自有海量數(shù)據(jù)與超級(jí)計(jì)算機(jī),這種優(yōu)勢(shì)無(wú)人能模仿。而這也就意味著純視覺(jué)路線要么一騎絕塵,要么平分秋色,但市場(chǎng)其他企業(yè)無(wú)論結(jié)果如何都無(wú)法跟隨視覺(jué)感知路線,沒(méi)有兩把刷子參與進(jìn)去,玩的就是心跳了。

兩種視覺(jué)感知路線長(zhǎng)期來(lái)看,仍會(huì)因?yàn)槌杀九c安全存在爭(zhēng)議,現(xiàn)在激光雷達(dá)規(guī)模發(fā)展速度與特斯拉的純視覺(jué)技術(shù)發(fā)展速度未見(jiàn)分曉,激光雷達(dá)能不能笑到最后不好說(shuō)。但在現(xiàn)下,與未知的視覺(jué)感知技術(shù)發(fā)展相比,激光雷達(dá)方案已經(jīng)在規(guī)模量產(chǎn)的路上,其美好態(tài)勢(shì)的發(fā)展讓這個(gè)派別有底氣去笑著迎接未來(lái)。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2021-08-25
特斯拉依舊頭鐵堅(jiān)持視覺(jué)路線,激光雷達(dá)會(huì)笑到最后嗎?
性能方面激光雷達(dá)明顯勝出,特斯拉花費(fèi)巨大的成本在算力和算法上,投入不小,頭鐵一直挺身堅(jiān)持視覺(jué)感知路線,到底是有哪些角度的考量呢? 視覺(jué)感知系統(tǒng)未來(lái)不僅僅是部署在汽車上,也可以部署在任何需要視覺(jué)系統(tǒng)功能

長(zhǎng)按掃碼 閱讀全文