中國首個擁有真正意義多任務(wù)連續(xù)泛化具身模型的機器人,誕生了!這個機器人,是真正由模型訓(xùn)練出來的,據(jù)了解,截止目前除了Figure 01,國內(nèi)似乎還沒有第二家能做到這種級別的泛化能力,即使被百般刁難,都能完成任務(wù)。清華校友下場創(chuàng)業(yè),才4個月就已融資近2億。
剛結(jié)束的世界機器人大會,余熱未消。
各家機器人展示的花活,令人眼花繚亂。
然而大概所有逛展的人都有這樣一個感觸:目前全世界范圍內(nèi),真正擁有強大泛化能力、能應(yīng)對各個場景的機器人,依然寥寥無幾。
中國廠商中是否有哪家機器人,能夠?qū)崿F(xiàn)真正的多任務(wù)連續(xù)泛化能力?
還真有!消息靈通的我們打聽到,一家名為「千尋智能 Spirit AI」的具身智能公司,已經(jīng)首次展示出了強大的多任務(wù)連續(xù)泛化能力。
據(jù)說這家神秘的公司成立時間并不長,卻展示出了如此級別的技術(shù)進步,他們究竟是怎么做到的?
最近,我們?nèi)ヌ搅藗€廠,詳細記錄下了那些驚掉我們下巴的瞬間。
所有動作均由神經(jīng)網(wǎng)絡(luò)自動生成
怎么刁難都不怕,動作無比絲滑
在研究人員的配合下,我們現(xiàn)場錄制了一番demo。
拿著白色紙杯的小哥走近機器人,并發(fā)出請求「一杯意式濃縮」,忙于看手機信息的同時,他卻不小心把杯子弄翻了。
來看看,千尋的機器人會怎么做?
只見,它自如地用一只手將紙杯擺正。
所有動作均由神經(jīng)網(wǎng)絡(luò)自動生成
然后用另一只手將其放在咖啡機上,按下功能鍵。
所有動作均由神經(jīng)網(wǎng)絡(luò)自動生成
等咖啡做好之后,再將盛滿咖啡的杯子放到桌子中間,任務(wù)就大功告成了。
所有動作均由神經(jīng)網(wǎng)絡(luò)自動生成
接下來過來的這位小哥,想要一杯卡布奇諾。
不過這次,換的是一個透明的玻璃杯。
而就在機器人快要夠到杯子時,小哥還有意「刁難」它,快速把杯子移走了。
所有動作均由神經(jīng)網(wǎng)絡(luò)自動生成
面對這種刁難,機器人表示完全沒問題!
端到端神經(jīng)網(wǎng)絡(luò)強大的泛化能力,讓機器人能精準識別透明反光物體,無論杯子放到哪里,它的「夾子」手都能輕松hold住。
接下來,我們出場了,決定給它來個高難度的任務(wù)。
先隨手在機器人一只手旁擺放一個紙巾盒,再將紙杯子緊挨紙巾盒放置,并要求「來一杯美式」。
沒想到,它一眼識別出身旁的障礙物,并將其移到一旁,成功取到了杯子。
所有動作均由神經(jīng)網(wǎng)絡(luò)自動生成
最后,我們喝到了機器人制作的美式。
更驚喜的是,我們還在現(xiàn)場意外地發(fā)現(xiàn):千尋機器人的「夾子」手也可以更換成靈巧手!
它不僅精準拿起蘋果,還可以將其顛起,精準拿住。
而且,據(jù)稱無論是什么樣的手——兩指、三指、五指,都可以實現(xiàn)連續(xù)多任務(wù)泛化。
看到這兒之后,我們瞬感驚艷,可以暢想出千尋機器人走進家庭的未來,憑借強大的泛化能力,幫助人們完成各種各樣的任務(wù)。
所有動作均由神經(jīng)網(wǎng)絡(luò)自動生成
緊接著,我們紛紛涌向會議室,好奇地問道,「千尋機器人究竟是如何實現(xiàn)如此完美地連續(xù)泛化能力」?
豪華創(chuàng)業(yè)團隊,全棧AI配齊
這家堪稱「中國Figure」的具身智能公司,智囊團在世界范圍內(nèi)也算是極其稀缺的。
幕后技術(shù)團隊紛紛出自UC Berkeley、CMU、NTU、清華、北大、浙大、華為、騰訊、大疆、小米等國內(nèi)外頂尖高校、企業(yè)。
在具身大模型、機器人研發(fā),以及實際落地上,這支融合學(xué)術(shù)精英與業(yè)界翹楚的團隊,展現(xiàn)出了卓越的實力。
他們不僅有著基座模型預(yù)訓(xùn)練、RL、IL等核心技術(shù)力,還在機械臂系統(tǒng)設(shè)計、機器人安全、控制架構(gòu)等方面身處行業(yè)前沿。
正因如此,千尋智能才得以具備全棧的AI工程化能力。
一起來認識下,這支星光熠熠的領(lǐng)軍團隊,都有哪些關(guān)鍵人物。
創(chuàng)始人兼CEO韓峰濤
創(chuàng)始人兼CEO韓峰濤,師從機器人學(xué)術(shù)泰斗丁漢院士,在機器人領(lǐng)域中深耕十余年。
他曾任珞石機器人聯(lián)合創(chuàng)始人&CTO,是國內(nèi)高性能輕型工業(yè)機器人領(lǐng)軍者和國內(nèi)力控協(xié)作量產(chǎn)交付第一人,帶隊成功交付數(shù)十款型號的產(chǎn)品超20000臺。
值得一提的是,這些產(chǎn)品還獲得了43項國內(nèi)外認證,其中包括全球僅有兩家、國內(nèi)唯一的醫(yī)療方向IEC60601安全認證。
而且,整機的自主化率達到了90%以上。
在產(chǎn)品應(yīng)用方面,韓峰濤博士帶領(lǐng)團隊落地20+行業(yè)、100+場景,1000+客戶的商業(yè)化成果轉(zhuǎn)化。
除了豐富的實踐經(jīng)驗,他還積極參加許多國家級科研項目。
今年2月,韓峰濤博士創(chuàng)辦了千尋智能Spirit AI,致力于打造行業(yè)領(lǐng)先的通用機器人AI系統(tǒng)與人形機器人。
首席科學(xué)家高陽
而在AI能力方面,就不得不提另一位核心人物——首席科學(xué)家高陽,也是千尋智能的聯(lián)合創(chuàng)始人。
他本科就讀于清華計算機系,師從國內(nèi)ML領(lǐng)域享有盛譽的著名學(xué)者朱軍教授。
憑借出色的表現(xiàn),他獲得了UC Berkeley計算機系的全額獎學(xué)金,攻讀計算機視覺博士學(xué)位。
這期間,高陽師從國際計算機視覺大師Trevor Darrell教授(曾培養(yǎng)了包括賈揚清在內(nèi)的多位視覺領(lǐng)域知名學(xué)者)。
此外,在讀博士、博士后期間,他曾與機器人學(xué)習(xí)領(lǐng)域的頂尖學(xué)者Sergey Levine和Pieter Abbeel教授有深入合作。
Pieter Abbeel是擴散模型(Sora、SD背后核心技術(shù))的提出者之一。
爆火AI搜索初創(chuàng)Perplexity AI的創(chuàng)始人Aravind Srinivas,以及前OpenAI聯(lián)創(chuàng)John Schulman,皆是他的學(xué)生。
論文地址:https://arxiv.org/pdf/2006.11239
此外,Sergey Levine教授是美國Physical Intelligence (Pi)的創(chuàng)始人。Pi是美國具身智能領(lǐng)域的頭部公司,獲得OpenAI等公司共計7000萬美元的天使投資。
就讀博士期間,高陽在AI頂會CVPR上,曾發(fā)表了一篇大規(guī)模現(xiàn)實世界數(shù)據(jù)的端到端自動駕駛論文。
這為后來的端到端自動駕駛,如FSD等,奠定了學(xué)術(shù)基礎(chǔ)。
論文地址:https://www2.eecs.berkeley.edu/Pubs/TechRpts/2020/EECS-2020-5.pdf
在個人貢獻方面,如上介紹的所有機器人背后核心技術(shù),皆有首席科學(xué)家高陽的貢獻。
他在具身智能的三層模型中,取得了豐碩的研究成果。
在強化學(xué)習(xí)方面,高陽提出了世界上迄今為止,樣本效率最高的強化學(xué)習(xí)算法EfficientZero、EfficientZero v2。
EfficientZero曾被前OpenAI聯(lián)創(chuàng)、強化學(xué)習(xí)帶頭人John Schulman,賦予了高度評價。
在模仿學(xué)習(xí)方面,他提出了EfficientImitate高性能模仿學(xué)習(xí)算法,相比斯坦福的VMAIL提升了600%性能。
此外,高陽從利用互聯(lián)網(wǎng)視頻以及預(yù)訓(xùn)練VLM角度,提出了ViLa和CoPa模型。
在硬件方面,千尋智能也是這一賽道中的佼佼者。
團隊不僅具備了世界一流的機器人運動控制系統(tǒng)開發(fā)能力,還具備了一流的系統(tǒng)級機電系統(tǒng)設(shè)計能力。
最重要的是,他們已經(jīng)在工業(yè)機器人、醫(yī)療機器人方面,有著豐富的經(jīng)驗,在技術(shù)上實現(xiàn)「降維打擊」。
總言之,千尋智能在軟硬件方面所具備的領(lǐng)先優(yōu)勢,也成為持續(xù)吸引、贏得資本青睞與押注的關(guān)鍵因素。
所有動作均由神經(jīng)網(wǎng)絡(luò)自動生成
4個月,融資2億
這次千尋智能Spirit AI的天使輪融資,由弘暉基金領(lǐng)投,達晨財智、千乘資本跟投,同時,順為資本和綠洲資本作為種子輪老股東也在持續(xù)加碼。
現(xiàn)在,具身智能的下一個爆發(fā)點就在眼前。在商用服務(wù)和家用服務(wù)上,可能批量落地就在3到5年內(nèi)了。
從工業(yè)到服務(wù),再到家庭應(yīng)用,一個亟待開拓的萬億級市場,正在所有人眼前展開。
憑借業(yè)界領(lǐng)先的具身大模型技術(shù),和卓越的機器人研發(fā)能力,千尋智能將以最高效率完成從技術(shù)研發(fā)到產(chǎn)品市場化的商業(yè)閉環(huán)。
通用機器人成為人類的親密伙伴,即將從科幻走入現(xiàn)實,整個世界已經(jīng)開始走進智能機器人時代。機器人像iPhone手機一樣人人可用的時刻,或許就在眼前了!
而看完了機器人自主做咖啡,我們對千尋智能打動投資人的理由,也就有了更多具象化的理解。
在弘暉基金投資團隊看來,具身智能是AGI的重要應(yīng)用場景,市場空間極為廣闊。
在過去,機器人的操控依賴大量人工編程流程,對場景有諸多限制。而具身大模型算法與硬件結(jié)合而成的智能體,相對傳統(tǒng)機器人會在任務(wù)泛化性上有極大的提升。
這類智能體,會是通往空間智能的最佳路徑。而中國在機器人硬件產(chǎn)業(yè)鏈上,具備領(lǐng)先優(yōu)勢。
團隊非常期待,新一代智能機器人的量產(chǎn)指日可待,掀起一場新的工業(yè)革命。
順為投資團隊非??春们ぶ悄軇?chuàng)始團隊的復(fù)合背景和行業(yè)經(jīng)驗。同樣,綠洲資本投資負責(zé)人也表示,千尋智能的隊伍既結(jié)合了產(chǎn)業(yè)理解,還積累了前沿技術(shù)。也是因此,才讓我們見證到了公司在短期內(nèi)的高效成長和迭代。
達晨財智投資團隊則肯定了千尋智能在行業(yè)內(nèi)的稀缺性——這樣一個團隊,是同時具備機器人硬件、具身AI算法能力以及商業(yè)化經(jīng)驗的老炮團隊,緊密結(jié)合了過往的機器人工程化理解和前沿學(xué)術(shù)積累。
才短短半年,公司表現(xiàn)出的具身大模型以及快速的軟硬件迭代能力,無不令人印象深刻。
而千乘資本投資團隊對千尋智能表示出了強烈的信心。
在他們看來,AI大模型的革命性突破,賦予了機器人更多的智能性和敏捷性,展現(xiàn)出通用和泛化能力。
在人形機器人這個下一個萬億級別的大賽道,千尋智能無疑站在了行業(yè)的前沿。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )