ChatGPT 標志著生成式 AI 的大爆炸時刻正在開啟。在剛剛過去的CES2025上,NVIDIA (英偉達)創(chuàng)始人兼CEO黃仁勛在演講中提到,人形機器人的時代即將到來。
作為全球領先的算力提供商,NVIDIA在機器人領域投入布局巨大,著手迎接“通用機器人的ChatGPT時刻”。
當前,生成式 AI 發(fā)展火熱,但 AI 在人形機器人、工廠和其它工業(yè)系統(tǒng)設備中的具象化體現(xiàn)尚未達到突破點。這阻礙了運輸和移動、制造業(yè)、物流和機器人等行業(yè)的發(fā)展。
三大驅(qū)動力:機器人技術(shù)需求的源泉
相關(guān)數(shù)據(jù)顯示,未來二十年,預計人形機器人市場將達到 380 億美元。為了滿足這一巨大需求,尤其是工業(yè)和制造業(yè)領域的需求,NVIDIA 發(fā)布了一系列機器人基礎模型、數(shù)據(jù)管線和仿真框架,以加速下一代人形機器人的開發(fā)進程。
在2025年的技術(shù)浪潮中,機器人正迅速成為解決社會和產(chǎn)業(yè)需求的關(guān)鍵工具。NVIDIA機器人與邊緣計算副總裁Deepu Talla在近期分享中,深刻闡述了機器人技術(shù)發(fā)展的驅(qū)動力、技術(shù)突破與未來應用,揭示了這一領域的巨大潛力與挑戰(zhàn)。
Deepu Talla認為,指出,機器人技術(shù)的快速發(fā)展背后有三大核心驅(qū)動力:
1. 危險工作:在采礦等高危環(huán)境中,機器人可以替代人類承擔風險,確保人員安全。
2. 勞動力短缺:社會職業(yè)結(jié)構(gòu)的變化導致勞動力逐步減少,機器人可以填補這一空白。
3. 養(yǎng)老需求:隨著全球平均壽命的延長,對護理和陪伴機器人的需求日益增長,機器人能夠成為有效的“社會伴侶”。
這三大需求共同推動機器人技術(shù)成為現(xiàn)代社會不可或缺的組成部分。
關(guān)鍵突破:機器人技術(shù)發(fā)展的轉(zhuǎn)折點
Deepu Talla強調(diào),過去12個月中,機器人技術(shù)經(jīng)歷了兩大關(guān)鍵突破:
1. 生成式AI(GenAI)的引入:兩年前,大型語言模型(LLMs)顛覆了數(shù)字應用,如今這些技術(shù)被應用到機器人領域,成功連接了數(shù)字與物理應用。
2. 仿真環(huán)境的成熟:以NVIDIA Omniverse為代表的仿真技術(shù)提供了高精度的虛擬環(huán)境,使機器人測試從依賴真實世界轉(zhuǎn)向虛擬測試,大幅降低了成本和時間消耗。
這些技術(shù)突破顯著加快了機器人開發(fā)的進程,也為更多企業(yè)投入機器人研發(fā)提供了契機。
三臺計算機,解決機器人挑戰(zhàn)
為了真正解決機器人領域的挑戰(zhàn),我們需要三臺計算機?!?Deepu Talla如是說。
第一臺計算機用于訓練:這是用于訓練AI模型的系統(tǒng)。訓練通常在云端、數(shù)據(jù)中心或像NVIDIA DGX這樣的強大系統(tǒng)上進行。這是構(gòu)建機器人“大腦”的關(guān)鍵步驟。
第二臺計算機用于仿真:一旦訓練完成,就需要進行測試。以往的標準是物理測試,但這種方式既慢又昂貴,還存在風險。更好的解決方案是引入一個“仿真層”,即“數(shù)字孿生”(Digital Twin),在虛擬環(huán)境中完成測試。仿真允許在大規(guī)模、快速且安全的條件下運行數(shù)千種場景測試,無需受到真實世界時間或成本的限制。
第三臺計算機用于部署:它安裝在機器人內(nèi)部,就是操作物理機器人的“大腦”。對NVIDIA來說,這可以通過像Jetson或AGX這樣的系統(tǒng)來實現(xiàn)。
通過將訓練、仿真、部署的循環(huán)過程,使得機器人技術(shù)進步從50年縮短到了5年,顯著縮短機器人的開發(fā)周期。Deepu Talla對此解釋,在將機器人部署至現(xiàn)實世界前,利用仿真系統(tǒng)開展成千上萬次測試,可有效加速整個開發(fā)流程。倘若某個設計在現(xiàn)實應用中表現(xiàn)欠佳,便可返回仿真環(huán)境對模型進行優(yōu)化,之后再次測試。
這種開發(fā)方法也解釋了機器人技術(shù)相較于自動駕駛技術(shù)難度更高的原因。自動駕駛主要聚焦于躲避障礙物和保障行駛安全,無需與物理物體產(chǎn)生直接交互。而機器人領域則涉及與物體的接觸、碰撞以及復雜的物理互動,這些環(huán)節(jié)的測試與優(yōu)化難度極大。
仿真并非一個新概念。在芯片領域,仿真就早已進入了大規(guī)模生產(chǎn)之中,因為芯片設計一旦出現(xiàn)錯誤,可能會導致項目延誤數(shù)月,造成數(shù)百萬甚至數(shù)十億美元的損失。所以,這樣來看,給機器人仿真,也具備一定可行性。
不過,在機器人領域,仿真的主要的挑戰(zhàn)在于 “仿真與現(xiàn)實的差距”(sim-to-real gap),即仿真結(jié)果與實際表現(xiàn)之間存在差異。在過去,由于仿真技術(shù)精度有限,該技術(shù)并未得到廣泛應用。然而,諸如 Omniverse 等技術(shù)的出現(xiàn),顯著縮小了這一差距。盡管目前這一差距尚未完全消除,但技術(shù)的改進程度已足以使仿真成為機器人開發(fā)中可行且有效的工具。
據(jù)了解, NVIDIA 并不直接參與機器人的制造環(huán)節(jié),而是選擇與所有投身于機器人制造以及機器人解決方案開發(fā)的專業(yè)人員展開合作。當前,NVIDIA 正在搭建一個綜合性平臺,該平臺涵蓋了訓練、仿真、部署三種計算系統(tǒng),以及與之相關(guān)的軟件工具和工作流程。其目的在于助力機器人專家、研究人員、機械工程師和測試人員能夠更為便捷地開發(fā)機器人解決方案,通過簡化流程和提高效率,加速機器人技術(shù)的研發(fā)進程。
機器人技術(shù)的另一個核心挑戰(zhàn)在于數(shù)據(jù)的獲取與生成。Deepu指出,與自動駕駛汽車依賴現(xiàn)有車輛生成海量數(shù)據(jù)不同,當前機器人的數(shù)量遠不足以滿足訓練需求。為此,NVIDIA采用了以下解決方案:
1. 合成數(shù)據(jù)生成:通過工具(如NVIDIA Cosmos)創(chuàng)建逼真的虛擬環(huán)境,生成多樣化的機器人交互數(shù)據(jù)。
2. 結(jié)合真實與合成數(shù)據(jù):整合少量真實數(shù)據(jù)與大規(guī)模合成數(shù)據(jù),形成高效的數(shù)據(jù)工作流,滿足訓練與測試需求。
3. 仿真與現(xiàn)實結(jié)合的優(yōu)化:克服“仿真與現(xiàn)實的差距”(sim-to-real gap),通過高精度仿真提升現(xiàn)實應用的準確性。
這一數(shù)據(jù)生成與整合方案不僅解決了數(shù)據(jù)稀缺問題,還大幅加快了機器人技術(shù)的開發(fā)進程。
在分享會上,銀河通用創(chuàng)始人、CTO王鶴分享了其在與英偉達合作取得的進展。他表示,我們使用NVIDIA Isaac系列以及現(xiàn)在的Omniverse等,積極探索使用仿真器合成大量的機器人操作數(shù)據(jù),并將其轉(zhuǎn)化為機器人的模型。我們將各種 3D 固體資產(chǎn)、環(huán)境以及各類材質(zhì)和紋理素材相互融合,模擬機器人的運行場景,探討機器人如何操作物體。
銀河通用憑借具身大模型,已經(jīng)成功涉足眾多行業(yè),涵蓋零售、酒店、接待、養(yǎng)老以及工業(yè)制造等領域。在北京奔馳的工廠里,我們可以看到銀河通用的人形機器人在人工裝載天窗玻璃及轉(zhuǎn)運過程中發(fā)揮著重要作用。在這個過程中,天窗玻璃在吸起和放下時容易出現(xiàn)錯誤擺放,一旦出現(xiàn)這種情況,以往需要人工終止轉(zhuǎn)運并進行修正。而現(xiàn)在,人形機器人基于視覺閉環(huán)和從仿真中學到的操作技能,經(jīng)過良好訓練后,能夠快速發(fā)現(xiàn)錯誤并進行有目的的糾正。大家可以觀看這個視頻,視頻中人形機器人在搬運場景中的表現(xiàn)十分出色,面對 3×3×327 箱緊密排列的設備,人形機器人能夠在貨箱間高效搬運。
- 獨家對話尚網(wǎng)網(wǎng)絡CEO朱立華:再造線下經(jīng)濟新繁榮
- 消息稱智譜管理層變動 2名高管離職
- SM娛樂單方面通知網(wǎng)易云音樂不續(xù)約 行業(yè)預估波及數(shù)百萬用戶
- 特斯拉中國召回超120萬輛進口及國產(chǎn)汽車
- 小米首次召回3.1萬輛SU7標準版車型 OTA升級即可解決
- 解碼機器人技術(shù)未來:英偉達推動智能與產(chǎn)業(yè)融合
- 網(wǎng)易云音樂或?qū)⑾录躍M娛樂版權(quán)歌曲 行業(yè)預估波及數(shù)百萬用戶
- 百川智能發(fā)布全場景深度思考模型Baichuan-M1-preview:聚齊三大推理能力,解鎖醫(yī)療循證模式
- 抖音上線打車服務 目前僅高德打車一家入駐
- 好未來2025財年第三季度凈利潤2310萬美元,同比扭虧
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。