123,123,123

大模型賦能智能座艙“能聽會(huì)看”，NVIDIA 深度適配通義千問大模型

人閱讀

2024-09-20 11:08:50

來源：極客網(wǎng)
相關(guān)關(guān)鍵詞
- 通義千問大模型
- NVIDIA

極客網(wǎng)·人工智能（杭州）9月20日杭州云棲大會(huì)消息， NVIDIA DRIVE Orin系統(tǒng)級(jí)芯片實(shí)現(xiàn)了與阿里云通義千問多模態(tài)大模型Qwen2-VL的深度適配。阿里云、斑馬智行聯(lián)合NVIDIA英偉達(dá)推出艙駕融合大模型解決方案，基于通義大模型開發(fā)“能聽會(huì)看”的智能座艙助理，讓車內(nèi)人員通過語音交流就能操作座艙內(nèi)的各類應(yīng)用，享受極致豐富的交互體驗(yàn)。

AI大模型正在引領(lǐng)新一輪產(chǎn)業(yè)變革，汽車行業(yè)是最受關(guān)注的大模型應(yīng)用領(lǐng)域之一。作為“大模型上車”的重要切入點(diǎn)，汽車座艙的智能進(jìn)化廣受期待。大模型接入智能座艙，有望為乘客提供座艙環(huán)境控制、車內(nèi)休閑娛樂、駕駛行為監(jiān)測(cè)等擬人化的服務(wù)。

圖片8.jpg

通義大模型的智能座艙解決方案，能為座艙配備一位具備感知、思考、決策能力的“智能助理”，它不僅能觀察理解用戶的語音、手勢(shì)，還能根據(jù)環(huán)境信息和常識(shí)判斷做出自主決策。乘客無需物理按鍵，只要?jiǎng)觿?dòng)嘴巴，就能讓智能助理完成各種任務(wù)。

這個(gè)解決方案以通義大模型為“大腦”，集成了通義大語言模型Qwen2-7B和通義多模態(tài)模型Qwen2-VL。Qwen2-VL是阿里通義實(shí)驗(yàn)室研發(fā)的新一代視覺語言模型，具備業(yè)界最強(qiáng)的圖片識(shí)別能力和視覺智能體能力，在多個(gè)國際權(quán)威測(cè)評(píng)中創(chuàng)下同等尺寸最優(yōu)成績(jī)。Qwen2-VL的2B和7B參數(shù)模型因其性能和尺寸的“極致性價(jià)比”，尤其適合汽車等端側(cè)場(chǎng)景。同時(shí)，通義實(shí)驗(yàn)室最新發(fā)布的 Mobile Agent V3 首次落地汽車座艙場(chǎng)景，提供座艙屏幕感知、復(fù)雜任務(wù)規(guī)劃以及座艙應(yīng)用 UI的操作決策能力，大大擴(kuò)展座艙智能助理的能力邊界。

圖片7.jpg

跑在NVIDIA DRIVE Orin芯片上的Qwen-VL，可以自動(dòng)識(shí)別右側(cè)畫面信息，并回答用戶的提問，如“我可以在這停車嗎？”

本次解決方案基于端云一體架構(gòu)，端側(cè)通義大模型經(jīng)NVIDIA 英偉達(dá)自動(dòng)駕駛和座艙芯片NVIDIA DRIVE Orin加速。NVIDIA英偉達(dá)提供了強(qiáng)大的芯片適配技術(shù)支持，通過優(yōu)化GPU 架構(gòu)和驅(qū)動(dòng)軟件，確保充分發(fā)揮大模型的性能潛力。NVIDIA的模型加速技術(shù)有效降低了大模型在實(shí)時(shí)處理復(fù)雜任務(wù)時(shí)的計(jì)算成本和時(shí)間延遲，為用戶創(chuàng)造了流暢無阻的智能體驗(yàn)。未來，通義大模型還將采用 NVIDIA DRIVE Thor新一代集中式車載計(jì)算平臺(tái)。

阿里旗下的智能出行解決方案提供商斑馬智行，為艙駕融合多模態(tài)大模型解決方案的落地提供了工程環(huán)境，將大模型能力絲滑嵌入汽車座艙、匹配用戶操作習(xí)慣。

（免責(zé)聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請(qǐng)進(jìn)一步核實(shí)，并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏，概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí)，應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后，將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí)，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。）