撰文 | 小不董
編輯 | 李信馬
題圖 | 毫末智行
自動駕駛也安排上“GPT”了。
4月11日,毫末智行正式官宣首個應(yīng)用GPT模型和技術(shù)邏輯的自動駕駛算法模型,中文名“雪湖·海若”。
微軟CEO納德拉曾說:“深度學(xué)習(xí)在過去20年或10年取得了巨大進展,大模型將是下一個大事件。”當下國內(nèi)外人工智能技術(shù)大爆發(fā),大模型正在迅速向我們的生活中拓展延伸,相對來說,國外科技巨頭的步伐更快一步,但在自動駕駛領(lǐng)域,毫末智行所發(fā)布的DriveGPT,卻是全球首個自動駕駛生成式大模型,這在讓人欣喜的同時,也不禁產(chǎn)生疑問:自動駕駛也需要GPT嗎?DriveGPT是真的“為天下先”,還是噱頭居多?
I、何為“雪湖·海若”?
海若,出自《莊子·秋水》,河伯請教北海若,何謂大小之分,北海若教導(dǎo),不因天地而覺大,不因毫末而覺小。因此,毫末把DriveGPT中文名命名為“雪湖·海若”,寓意智慧包容、海納百川。
要回答上面兩個問題,首先要回答,雪湖·海若是不是“GPT”?
GPT,全稱Generative Pre-trained Transformer,即生成式預(yù)訓(xùn)練大模型,本質(zhì)上是在求解下一個詞出現(xiàn)的概率,這是它的數(shù)學(xué)原理,每一次調(diào)用都是從概率分布中抽樣并生成一個詞,這樣不斷地循環(huán),就能生成一連串的字符,用于各種下游任務(wù)。
其實在ChatGPT大火之前,GPT就已經(jīng)用在了其他領(lǐng)域,比如2021年7月的CodeX,也就是CodeGPT,可以用于代碼生成,提升寫代碼的效率,還有2021年12月發(fā)布的WebGPT,可以讓GPT利用搜索引擎,主動搜索結(jié)果并匯總整理出答案,也就是近期微軟發(fā)布的New Bing搜索。所以,GPT本身是一種非常通用的建模范式,能應(yīng)用的領(lǐng)域非常之多。
DriveGPT整體的訓(xùn)練邏輯和使用的算法,與ChatGPT大體相似,不過由于領(lǐng)域不同,所以只在自己的特定條件下實行,性質(zhì)不完全相同,但仍是“GPT”。
自動駕駛也需要GPT嗎?
這個問題其實在數(shù)年前就有企業(yè)進行了探索。當前,全球范圍內(nèi)有機會沖擊1億公里級運營里程俱樂部的有兩家企業(yè):一個是特斯拉,基于百萬級車主的參與,其FSD累積行駛里程將沖向1億英里;另一個就是毫末智行。
2019年,時任特斯拉AI總負責(zé)人安德魯·卡帕西(Andrej Karpathy)提出,特斯拉自動駕駛要像人一樣開車,要在2021年取消激光雷達,并引入“大模型”對特斯拉的自動駕駛系統(tǒng)進行訓(xùn)練,同年發(fā)布了Dojo超級計算系統(tǒng)(Dojo是特斯拉自研的超級計算機系統(tǒng),能夠利用海量視頻數(shù)據(jù),完成“無人監(jiān)管”的標注和訓(xùn)練)。
2020年,特斯拉宣布將基于深度神經(jīng)網(wǎng)絡(luò)的大模型引入其自動駕駛之中,到現(xiàn)在已實現(xiàn)了純視覺FSD Beta的大規(guī)模公測。特斯拉FSD系統(tǒng)即全自動駕駛系統(tǒng),包括了自動駕駛導(dǎo)航、自動變道、自動泊車、召喚和交通燈以及停車標志控制等功能。截止到2022AI DAY,特斯拉已在超過16萬輛車上進行了FSD Beta版系統(tǒng)測試,僅一年內(nèi)就訓(xùn)練了7.5萬個神經(jīng)網(wǎng)絡(luò)模型。
在國內(nèi),毫末智行率先引入了Transformer的技術(shù),之后也是最早建立自己超算中心的自動駕駛企業(yè)。2021年,毫末智行在推出數(shù)據(jù)智能體系MANA的同時,也宣布要借助大模型提升數(shù)據(jù)處理能力,從而加速HPilot智能輔助駕駛產(chǎn)品的進化。
今年1月5日,毫末智行舉辦AI DAY,在自動駕駛數(shù)據(jù)智能體系MANA(雪湖)的基礎(chǔ)上,推出了新的智算中心MANA OASIS(雪湖·綠洲)。毫末智行董事長張凱在現(xiàn)場說到:“隨著自動駕駛企業(yè)向3.0時代邁進,大模型+大數(shù)據(jù)的數(shù)據(jù)驅(qū)動模式,成為自動駕駛技術(shù)進化的關(guān)鍵,而驅(qū)動大模型和海量數(shù)據(jù)訓(xùn)練的超算中心將成為自動駕駛企業(yè)的入門配置。”
2、加速進入自動駕駛3.0時代
如果將自動駕駛的發(fā)展分為三個階段,那么在自動駕駛3.0時代,DriveGPT可以說是應(yīng)運而生。
1.0時代是硬件驅(qū)動的,從谷歌等科技巨頭的初代無人車開始的自動駕駛1.0時代,這一階段硬件就是自動駕駛的能力上限,特別是雷達傳感器,其數(shù)量越多、性能越強,對應(yīng)的自動駕駛智能化程度就越高。其明顯問題就是,整車成本居高不下,改造成本動輒上百萬;以及智能化程度較低,行駛里程較短,在100萬公里內(nèi)。
2.0時代是軟件驅(qū)動的,自2016年AlphaGo戰(zhàn)勝李世石后,掀起了一陣以深度學(xué)習(xí)為基礎(chǔ)的AI技術(shù)潮,大幅降低了單車成本的同時,自動駕駛里程逐漸增加至上千萬公里。
圖片來源:IC Photo
而3.0時代是數(shù)據(jù)驅(qū)動的,AI依然是核心技術(shù),不同就在于AI對數(shù)據(jù)的要求發(fā)生了質(zhì)變,“大模型”成為新的技術(shù)基石。
工信部數(shù)據(jù)顯示,2022上半年L2 級輔助駕駛乘用車新車市場滲透率達到 30%,同比增加 12.7%。中國自動駕駛在多方也取得了突破,來自2022世界智能網(wǎng)聯(lián)汽車大會的消息顯示,全國開放各級測試公路超過7000公里,實際道路測試里程超過1500萬公里,自動駕駛出租車、無人巴士、自主代客泊車、干線物流以及無人配送等多場景示范應(yīng)用有序開展。
技術(shù)方面呈現(xiàn)了一個新的趨勢:不再是硬件或者軟件驅(qū)動,不再是測試道路下的數(shù)據(jù)驅(qū)動,而是以真實道路行駛場景為核心的數(shù)據(jù)驅(qū)動,這便是自動駕駛3.0。
隨著用戶更高頻地開啟輔助駕駛功能,智駕行駛的行駛里程和使用頻率呈現(xiàn)指數(shù)級提升,足夠規(guī)模和多樣化的數(shù)據(jù)帶來數(shù)據(jù)積累的優(yōu)勢,可以更好驅(qū)動自動駕駛技術(shù)的快速迭代升級。生成式大模型已成為自動駕駛系統(tǒng)進化的關(guān)鍵,基于Transformer大模型訓(xùn)練的感知、認知算法,將逐步在車端進行落地部署?;谧詣玉{駛數(shù)據(jù)的大規(guī)模增長,以及大模型的深入應(yīng)用,也讓智算中心成為自動駕駛行業(yè)的“新基建”。
3、DriveGPT是怎樣煉成的?
DriveGPT自動駕駛認知大模型也采用了RLHF(人類反饋強化技術(shù))算法,通過不斷輸入真實人駕接管數(shù)據(jù),持續(xù)優(yōu)化自動駕駛決策模型,簡單來說就是它會借鑒海量真實駕駛數(shù)據(jù),從而做出自己的最優(yōu)解。
不同路況、天氣和變量下,自動駕駛?cè)绾螒?yīng)變?這就需要一個強大的模擬人類思維的模型,GPT相關(guān)的AI軟件就是為此而生。
首先,把感知和認知相關(guān)大模型能力統(tǒng)一整合到DriveGPT——也就是自動駕駛生成式大模型中;其次,計算基礎(chǔ)服務(wù)針對大模型訓(xùn)練在參數(shù)規(guī)模、穩(wěn)定性和效率方面做了專項優(yōu)化,并集成到OASIS當中。增加了使用NeRF技術(shù)的數(shù)據(jù)合成服務(wù),降低Corner Case數(shù)據(jù)的獲取成本;另外,毫末智行還針對多種芯片和多種車型的快速交付難題,優(yōu)化了異構(gòu)部署工具和車型適配工具。
自動駕駛中不可或缺的視覺感知上,其核心目的就是恢復(fù)真實世界的動靜態(tài)信息和紋理分布,毫末智行對視覺自監(jiān)督大模型做了一次架構(gòu)升級,將預(yù)測環(huán)境的三維結(jié)構(gòu),速度場和紋理分布融合到一個訓(xùn)練目標里面,強迫模型練好內(nèi)功,之后面對各種具體任務(wù)都能“胸有成竹”。
據(jù)現(xiàn)場演講介紹,DriveGPT雪湖·海若具有三個能力:
可以按概率生成多個場景序列,每個場景都是一個全局的場景,都是未來有可能發(fā)生的一種實際情況。能把場景中用戶最關(guān)注的自車行為軌跡量化,也就是生成場景的同時,便會產(chǎn)生自車未來的軌跡信息。DriveGPT雪湖·海若也很好地繼承了這種特性,在生成場景序列、軌跡的同時,也會把整個決策邏輯鏈給輸出。DriveGPT雪湖·海若的一個關(guān)鍵設(shè)計,就是場景的Token化表達,毫末智行把這種方式叫做Drive Language。
目前毫末智行Token的詞表空間是50萬個左右,DriveGPT雪湖·海若就像一部推理機器,你告訴它過去發(fā)生了什么,它按概率推理出未來多個可能。通過對于不同場景“優(yōu)勝劣汰”,DriveGPT最后把參數(shù)更新到一個備份模型(Active Model)中,通過強化學(xué)習(xí)的方式,生成的效果就會有一個明顯地提升。
圖片來源:毫末智行
相比特斯拉FSD的百萬+量產(chǎn)車下線,中國企業(yè)與之的距離相去甚遠。要突破自動駕駛的長尾效應(yīng),就要不斷擴大道路行駛場景。毫末智行CEO顧維灝在現(xiàn)場說到:“DriveGPT雪湖·海若可以逐步應(yīng)用到城市NOH、捷徑推薦、智能陪練以及脫困場景中。有了DriveGPT的加持,車輛行駛會更安全;動作更人性、更絲滑,并有合理的邏輯告訴駕駛者,車輛為何選擇這樣的決策動作。對于普通用戶來說,車輛越來越像老司機。”
4、大考之年,枕戈待旦
2022年,中國市場乘用車高級別輔助駕駛前裝搭載率升至29.40%,前裝標配交付585.99萬輛。毫末智行曾在去年預(yù)估,到2025年高級別輔助駕駛搭載率超過70%。這意味著從今年開始,智駕產(chǎn)品進入一個快速增長的全線爆發(fā)期。
這也說明,城市導(dǎo)航輔助駕駛產(chǎn)品在2023年將圍繞量產(chǎn)交付發(fā)力,幾個主要玩家的城市導(dǎo)航輔助駕駛產(chǎn)品將會進入到真實用戶交付和多城市并行落地的比拼中。其次,行泊一體和無人車的商業(yè)化將成為自動駕駛公司深耕的重點。搭載低成本行泊一體功能的智駕產(chǎn)品將迎來一個前裝量產(chǎn)的高潮,高速導(dǎo)航輔助駕駛、自主泊車等產(chǎn)品的體驗也會迎來全面升級,車主的使用頻率和滿意度將成為產(chǎn)品競爭力的主要衡量標準。
在這些趨勢之下,毫末智行迎來了它的沖刺大考之年。
圖片來源:毫末智行
據(jù)了解,毫末智行DriveGPT雪湖·海若大模型的成果將首發(fā)落地在搭載毫末智行HPilot3.0的新摩卡DHT-PHEV上,此款車型上市后,我們就能看到,DriveGPT是否真的能提供優(yōu)秀的駕駛體驗。
圖片來源:毫末智行
“很多人問我,為什么毫末智行要探討雪湖·海若?背后是毫末智行踏踏實實的在做技術(shù),踏踏實實的實現(xiàn)未來。毫末智行成立到現(xiàn)在接近三年半時間。這三年多時間,很多事物都發(fā)生了變化,但是毫末智行對技術(shù)的堅定投入始終未變。我們始終熱愛技術(shù),枕戈待旦,全力沖刺。再難,我們都不會放棄?!鳖櫨S灝總結(jié)道。
- 特斯拉CEO馬斯克身家暴漲,穩(wěn)居全球首富寶座
- 阿里巴巴擬發(fā)行 26.5 億美元和 170 億人民幣債券
- 騰訊音樂Q3持續(xù)穩(wěn)健增長:總收入70.2億元,付費用戶數(shù)1.19億
- 蘋果Q4營收949億美元同比增6%,在華營收微降
- 三星電子Q3營收79萬億韓元,營業(yè)利潤受一次性成本影響下滑
- 賽力斯已向華為支付23億,購買引望10%股權(quán)
- 格力電器三季度營收同比降超15%,凈利潤逆勢增長
- 合合信息2024年前三季度業(yè)績穩(wěn)?。籂I收增長超21%,凈利潤增長超11%
- 臺積電四季度營收有望再攀高峰,預(yù)計超260億美元刷新紀錄
- 韓國三星電子決定退出LED業(yè)務(wù),市值蒸發(fā)超4600億元
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。