TechWeb 文/卞海川
把GPT“吹”上車,真的能給用戶帶來實際價值嗎?
眾所周知,ChatGPT已經成為全球最快用戶破億的應用,各大科技巨頭陸續(xù)發(fā)布了“類ChatGPT”AI大模型。這其中,AI大模型在智能汽車領域的應用更成為整個汽車行業(yè)集體關注的焦點,尤其是國內車企更是趨之若鶩。
車企盡上GPT
據不完全統(tǒng)計,目前僅接入文心一言的車企就包括長安、集度、吉利、嵐圖、紅旗、長城、東風日產、零跑等。除了國內車企,奔馳、微軟宣布將在美國奔馳汽車上增加GPT功能。借助OpenAI和微軟的技術,奔馳原有車載語音助手將得到升級。
與此同時,國內諸如蔚來汽車、小鵬汽車、理想汽車、奇瑞汽車均申請了GPT相關商標。如蔚來汽車申請“NIOGPT”、小鵬汽車申請“XPGPT”、理想汽車申請“MindGPT”等。 尤其是理想,不久前已經發(fā)布了自研Mind GPT,并將AI技術引入到車機“理想同學”中。
可以說,國內的車圈也已經進入了大模型的混戰(zhàn)階段,那么問題來了,這些大模型究竟有何本領?與此前車企們吹捧的智能座艙和智能駕駛又有何區(qū)別呢?
GPT上車 價值在哪?
由于接入百度文心一言的車企較多,所以這里我們就以它為例,看看大模型上車到底帶來了什么?
結合媒體及官方信息,我們知道,與智能座艙結合,最直觀的體現就是在交互上。例如更聰明能聽懂人話,包括那些模糊的指代命令,可以和人對話;能通過搜索分析,給出更貼切的反饋;能夠提供個性化、擬人化的服務;甚至在文字、語音、圖片之間的轉換等。
具體到應用場景,包括超級閑聊、靈感畫畫、百變人設、AI新車導購等。以超級閑聊為例,就是把車內變成一個交流場景,通過與語音助手對話式交互,規(guī)劃行程、答疑解惑、閑聊,就像人與人交流一樣自然。
同時,基于大模型本地化技術,小度車載語音 SDK 支持流暢的免喚醒多路同時交互、全頁面所見所說、全域毫秒級響應,這些都讓細節(jié)的體驗升級。特別是真多路同時對話能力,最大支持 8 路同時交互精確處理,覆蓋整個座艙內外,可以實現多路同時、快速、連續(xù)對話的極限挑戰(zhàn),就算坐在駕駛位、副駕駛位和后排的一家人同時開口,語音助手也能滿足每一個人的訴求。
再看理想的Mind GPT ,聲稱和“理想同學”結合后,支持聲紋識別、內容識別、方言識別、出行規(guī)劃,AI 繪畫、AI 計算等功能。
不知道業(yè)內看到這些作何感想?在我們看來,除了某些應用場景(例如超級閑聊、多路對話能力、)影響駕車安全,且并非剛需,其他所謂的場景基本上也是此前智能語音的升級,至于到了用戶體驗上能有多大的提升,還需時間的檢驗。
其實不止是百度文心一言,目前上車的大模型在智能駕駛座艙方面(基本都是原有語音理解和交互的提升)都是大同小異,很難形成差異化的競爭力和用戶體驗。
思必馳汽車事業(yè)部產品總監(jiān)葛付江對TechWeb表示,ChatGPT目前是以文本交互機器人的形式呈現的,適用多種文本處理任務,常用于智能問答和對話、文本創(chuàng)作等領域;車載語音以對話交互為主,多用于進行例如“導航去XXX?打開音樂”有明確指令的行動,“語音助手”用高度擬人化的語音輸出來回應車主訴求。車載語音交互用于解放駕駛員雙手,聚焦其注意力帶來更安全、便利的駕駛體驗。未來車內有了ChatGPT技術的應用,不僅是完成固定指令的任務型對話,車、人能進行更高效、更直接、高靈活度的出行、知識和閑聊交流。
可以看到,目前GPT上車的價值主要還是局限在智能座艙的語義識別,可是目前國內車企的智能語音助手相對成熟,GPT賦能下的智能座艙很難在帶給用戶更大提升。況且,一個新的技術或者產品能否最終落地得到規(guī)模的應用,除了技術因素外,還會受到其所處產業(yè)或者市場的產業(yè)鏈、市場競爭強弱、市場空間等諸多因素密切相關。
具體到車載智能語音系統(tǒng),雖然ChatGPT在“智能”上表現出色,但其在整個產業(yè)鏈條中比較偏后段,需要依賴很長的前端鏈條,比如信號處理、語音識別、文字輸出之后才會用到它,前端鏈條上的因素對后端流程都會產生影響,例如信號處理會影響語音識別,語音識別如果出錯就會影響NLP的判斷,鏈條上每個模塊都需要提高可靠性,才能保證最后出來的整體結果可靠。
也就是說,ChatGPT在“智能”能力的輸出上,并非完全取決于自身的能力,其產業(yè)鏈上任何一個環(huán)節(jié)都會對其造成正或負的影響。
綜上所述,無論是從體驗提升還是其它因素制約來考慮,GPT在智能座艙層面“加持”有限。
除了上述智能座艙外,值得注意的是,智能駕駛是最早被提出的AI應用場景之一,而自動駕駛需要大量的數據處理和分析,同時自動駕駛的應用也需要長期仿真測試以及道路測試,而AI大模型的加速發(fā)展將縮短自動駕駛開發(fā)進程,進一步推動產業(yè)成熟。
業(yè)內知道,早在2019年,特斯拉就將基于深度神經網絡Transformer大模型引入到感知預測中,并在2021年8月的特斯拉AI DAY 上展示了基于Transformer的BEV(鳥瞰視角) 感知方案,這是大模型技術首次被應用到自動駕駛行業(yè),也是FSD實現“重感知,輕地圖”純視覺路線的關鍵所在。
雖然從極少數的內測到如今面向北美所有購買用戶推送,最新駕駛里程接近2億英里,并被認為是目前最先進的自動駕駛系統(tǒng)之一。但時至今日,其在實際的應用中依然是事故頻發(fā),遠未達到自動駕駛應有的體驗。
領先的特斯拉尚且如此,何況現在才開始利用大模型的其他廠商。
寫在最后
車企們爭相獨立布局語言大模型技術以提升汽車智能化(例如智能座艙、智能駕駛等),的舉措無可厚非。但從目前幾乎主流車企,尤其是國內車企扎堆推出各GPT后的應用場景和體驗看,依然缺乏與此前未采用大模型的差異化,而這也讓我們不禁發(fā)問,車企們在力推語言大模型的時候,到底只是為“亂花迷人眼”,還是應該本質性地提升用戶的體驗為先?
(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )