123,123,123

4月11日消息，在HAOMO AI DAY上，HAOMO發(fā)布業(yè)內(nèi)首個自動駕駛生成式大模型DriveGPT，中文名“雪湖?海若”，毫末智行CEO顧維灝表示，DriveGPT將重塑汽車智能化技術(shù)路線。據(jù)介紹，DriveGPT雪湖?海若首發(fā)車型是新摩卡DHT-PHEV，即將量產(chǎn)上市。

毫末智行董事長張凱表示：“2023年智駕產(chǎn)品進入全線爆發(fā)期，大模型開啟在車端的落地應(yīng)用，車主的使用頻率和滿意度成為產(chǎn)品競爭力的重要衡量標準。”

顧維灝介紹，DriveGPT通過引入駕駛數(shù)據(jù)建立RLHF（人類反饋強化學習）技術(shù)，對自動駕駛認知決策模型進行持續(xù)優(yōu)化，現(xiàn)階段主要用于解決自動駕駛的認知決策問題，終極目標是實現(xiàn)端到端自動駕駛。

目前，毫末DriveGPT雪湖?海若實現(xiàn)了模型架構(gòu)與參數(shù)規(guī)模的升級，參數(shù)規(guī)模達到1200億，預(yù)訓練階段引入4000萬公里量產(chǎn)車駕駛數(shù)據(jù)，RLHF階段引入 5萬段人工精選的困難場景接管Clips。

DriveGPT雪湖?海若的底層模型采用GPT（Generative Pre-trained Transformer）生成式預(yù)訓練大模型，與ChatGPT使用自然語言進行輸入與輸出不同，DriveGPT輸入是感知融合后的文本序列，輸出是自動駕駛場景文本序列，即將自動駕駛場景Token化，形成“Drive Language”，最終完成自車的決策規(guī)控、障礙物預(yù)測以及決策邏輯鏈的輸出等任務(wù)。

顧維灝進一步闡釋，DriveGPT雪湖?海若具有三個能力：

1. DriveGPT雪湖?海若可以按概率生成很多個場景序列，每個場景都是一個全局的場景，每個場景序列都是未來有可能發(fā)生的一種實際情況；

2.在所有場景序列都產(chǎn)生的情況下，DriveGPT雪湖?海若能把場景中最受關(guān)注的自車行為軌跡量化出來，也就是生成場景的同時，會產(chǎn)生自車未來的軌跡信息；

3. 有了自車未來的軌跡信息之后，希望這條軌跡是可解釋的，而GPT模型最擅長的領(lǐng)域便是對話和推理，DriveGPT雪湖?海若也很好地繼承了這種特性，在生成場景序列、軌跡的同時，也會把整個決策邏輯鏈給輸出。

顧維灝介紹，毫末在2023年1月發(fā)布的中國自動駕駛行業(yè)最大的智算中心MANA OASIS（雪湖? 綠洲）此次從算力優(yōu)化等層面升級了三大能力，進一步支持DriveGPT雪湖?海若的算力。

首先，毫末與火山引擎全新搭建了“全套大模型訓練保障框架”，實現(xiàn)了異常任務(wù)分鐘級捕獲和恢復(fù)能力，可以保證千卡任務(wù)連續(xù)訓練數(shù)個月沒有任何非正常中斷,有效保證了大模型訓練穩(wěn)定性；

其次，毫末研發(fā)出以真實數(shù)據(jù)回傳為核心的增量學習技術(shù)，并將其推廣到了大模型訓練，構(gòu)建了一個大模型持續(xù)學習系統(tǒng)，自主研發(fā)任務(wù)級彈性伸縮調(diào)度器，分鐘級調(diào)度資源，集群計算資源利用率達到95%；

最后，MANA OASIS通過提升數(shù)據(jù)吞吐量來降本增效，滿足Transformer大模型訓練效率，通過引入火山引擎提供的Lego算子庫實現(xiàn)算子融合，端到端吞吐提升84%。

談到DriveGPT雪湖?海若的實現(xiàn)過程，顧維灝介紹稱，首先在預(yù)訓練階段通過引入量產(chǎn)駕駛數(shù)據(jù)，訓練初始模型，再通過引入駕駛接管Clips數(shù)據(jù)完成反饋模型（Reward Model）的訓練，然后再通過強化學習的方式，使用反饋模型去不斷優(yōu)化迭代初始模型，形成對自動駕駛認知決策模型的持續(xù)優(yōu)化。

DriveGPT雪湖?海若的一個關(guān)鍵設(shè)計，就是場景的Token化表達，顧維灝把這種方式叫做Drive Language。

同時，DriveGPT雪湖?海若還會根據(jù)Drive Language輸入端的提示語以及毫末CSS自動駕駛場景庫的決策樣本去訓練模型，讓模型學習推理關(guān)系，從而將完整駕駛策略拆分為自動駕駛場景的動態(tài)識別過程，完成可理解、可解釋的推理邏輯鏈生成。

另外，顧維灝提到，DriveGPT雪湖?海若可以逐步應(yīng)用到城市NOH、捷徑推薦、智能陪練以及脫困場景中。有了DriveGPT雪湖?海若的加持，車輛行駛會更安全；動作更人性、更絲滑，并有合理的邏輯告訴駕駛者，車輛為何選擇這樣的決策動作。對于普通用戶來說，車輛越來越像老司機，用戶對智能產(chǎn)品的信任感會更強，理解到車輛的行為都是可預(yù)期、可理解的。

當前，毫末在使用數(shù)據(jù)過程中，逐步建立起一套基于4D Clips駕駛場景識別方案，具備極高性價比。在行業(yè)上，給出正確的標注結(jié)果，一張圖片需要約5元；如果使用DriveGPT雪湖?海若的場景識別服務(wù)，一張圖片的價格將下降到0.5元。單幀圖片整體標注成本僅相當于行業(yè)的1/10。接下來，毫末會將圖像幀及4D Clips場景識別服務(wù)逐步向行業(yè)開放使用，這將大幅降低行業(yè)使用數(shù)據(jù)的成本，提高數(shù)據(jù)質(zhì)量，從而加速自動駕駛技術(shù)的快速發(fā)展。

目前，毫末DriveGPT雪湖?海若已正式對外開放，開啟對限量首批客戶的合作，北京交通大學計算機與信息技術(shù)學院、高通、火山引擎、華為云、京東科技、四維圖新、魏牌新能源、英特爾等已經(jīng)加入。毫末DriveGPT雪湖?海若大模型的成果將首發(fā)落地在搭載毫末HPilot3.0的新摩卡DHT-PHEV上。

顧維灝表示，毫末DriveGPT雪湖?海若將攜手生態(tài)伙伴率先探索四大應(yīng)用能力，包括智能駕駛、駕駛場景識別、駕駛行為驗證、困難場景脫困。

免責聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性，但不保證有關(guān)資料的準確性及可靠性，讀者在使用前請進一步核實，并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏，概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時，應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明，并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后，將會依法盡快聯(lián)系相關(guān)文章源頭核實，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

HAOMO發(fā)布自動駕駛生成式大模型DriveGPT

下一篇