123,123,123

11月13日消息，具身智能公司靈初智能宣布完成天使輪融資，本輪融資由高瓴創(chuàng)投（GL Ventures）和藍馳創(chuàng)投（Lanchi Ventures）領(lǐng)投。

本輪融資完成后，靈初智能將繼續(xù)推進基于強化學習算法的機器人技能集訓練、場景化的數(shù)據(jù)生成及采集、端到端解決方案的研發(fā)及落地，打造業(yè)界領(lǐng)先的通用靈巧操作智能體。

據(jù)悉，靈初智能創(chuàng)始人王啟斌博士在手機、智能音箱、機器人領(lǐng)域有近20年的成功操盤經(jīng)驗，多次實現(xiàn)產(chǎn)品從定義、開發(fā)、到上市、再到全球化0-1-N的產(chǎn)業(yè)閉環(huán)，是一名深諳機器人商業(yè)化落地的“老兵”。聯(lián)合創(chuàng)始人柴曉杰博士，在機器人及無人駕駛領(lǐng)域從業(yè)15年，擅長算法、仿真、工程、全棧技術(shù)，有L4產(chǎn)品落地的數(shù)據(jù)閉環(huán)經(jīng)驗，是量產(chǎn)經(jīng)驗豐富的研發(fā)專家。

靈初與北京大學成立北大-靈初智能具身靈巧操作聯(lián)合實驗室，由人工智能研究院楊耀東博士擔任聯(lián)合實驗室項目負責人開展橫向課題合作。楊耀東博士是強化學習領(lǐng)域的知名青年學者，他博士畢業(yè)于UCL, 是現(xiàn)代深度強化學習的發(fā)源地。楊耀東課題組在強化學習領(lǐng)域有系列重要成果，其中包括帶領(lǐng)華人團隊研發(fā)多體強化學習算法首登Nature機器智能子刊，帶領(lǐng)華人團隊獲得NeurIPS 2022具身靈巧操作冠軍等。

同時，北大-靈初聯(lián)合實驗室將和梁一韜博士就具身智能體長程任務規(guī)劃開展課題合作，梁博士長期致力于如何將知識注入機器學習中以提高其性能和泛化性，在開放環(huán)境MineCraft中取得系列重要成果。他利用LLM實現(xiàn)復雜任務的拆解和規(guī)劃，讓大模型“缸中之腦“長出手腳，在具身場景中自主行動。

在靈初北大聯(lián)合實驗室之外，公司聯(lián)合創(chuàng)始人陳源培是一名癡迷機器人的00后天才少年，作為Stanford訪問學者，他師從Karen Liu和李飛飛教授，曾在全球首次實現(xiàn)利用強化學習在真實世界同時控制雙臂、雙手多技能操作。此外，來自上海交大人工智能學院的溫穎副教授也是技術(shù)團隊關(guān)鍵成員，溫教授課題組曾推出多模態(tài)決策大模型DB1，實現(xiàn)了對DeepMind通才決策Gato模型的超越，并引入了與現(xiàn)實世界相關(guān)的百余個場景任務，為實際業(yè)務需求提供了有力工具。

高泛化性、高靈巧性和高成功率是具身智能的 “不可達三角”。高泛化性指機器人在變化環(huán)境對不同物體執(zhí)行復雜任務，高靈巧性體現(xiàn)在執(zhí)行任務的精確靈活（如搭樂高、雙手操作等），高成功率即機器人受干擾時穩(wěn)定正確執(zhí)行任務（產(chǎn)品驗證階段成功率 95%、規(guī)?；涞馗哂?99.9%）。
兼顧這三者極具挑戰(zhàn)。高泛化性需通用模型和注重數(shù)據(jù)多樣性的學習算法，高靈巧性需要精細模型和關(guān)注精度細節(jié)的學習算法及特定控制算法，魯棒性也對控制算法有要求。強化學習是提升具身智能體這三方面性能的核心技術(shù)，能讓智能體在仿真環(huán)境利用低成本合成數(shù)據(jù)訓練，實現(xiàn)自主探索、試錯學習最優(yōu)解，提升靈巧性甚至超越人類上限，還能增強魯棒性。

靈初智能早期一直深耕基于強化學習的全棧能力，從靈巧操作入手在具身智能領(lǐng)域積累技術(shù)壁壘，后將擴展至通用泛化操作。其開發(fā)的分層端到端模型領(lǐng)先業(yè)界，包含Psi-P0規(guī)劃模型和Psi-C0控制模型。Psi-P0借助大模型交互推理理解行為對環(huán)境影響，拆解復雜任務以實現(xiàn)任務泛化；Psi-C0模型為陳源培提出的雙層架構(gòu)，結(jié)合人類運動數(shù)據(jù)和深度強化學習，上層用人類數(shù)據(jù)訓練參考軌跡生成器，下層用其生成軌跡指導強化學習訓練，解決泛化性和靈巧性難題，這也是世界首次利用強化學習在現(xiàn)實中控制雙臂雙手多技能操作。

Psi-C0控制模型支持多個技能串聯(lián)作業(yè)的訓練難題。陳源培與斯坦福大學共同提出的Sequential Dexterity通過串聯(lián)多個靈巧操作策略來完成長程的任務。在真實世界的搭積木任務中，能將翻找、重定向、抓取和插入積木4個skill串聯(lián)起來提高整體的成功率。這也是世界上第一個基于強化學習實現(xiàn)了靈巧操作的長程任務，顯示了多技能組合的泛化性。

據(jù)介紹，梁一韜博士開發(fā)的Psi-P0實現(xiàn)開放環(huán)境中復雜任務的任務拆解和規(guī)劃。其所支持的任務復雜度和準確度都超越同期OpenAI（VPT）和Nvidia的工作（Minedojo）。如下面視頻所示，我們可以進一步通過構(gòu)建memory使具身模型具有l(wèi)ifelong learning，即根據(jù)自身經(jīng)歷自我提升的能力。

在產(chǎn)品規(guī)劃上，靈初智能將從2B服務業(yè)切入，以頭部客戶的高價值場景需求為指引，開發(fā)整合技能集，實現(xiàn)商業(yè)落地，并快速迭代硬件，算法，數(shù)據(jù)系統(tǒng)，不斷提升具身智能整體解決方案的泛化性，靈巧性和成功率，給出具身領(lǐng)域“不可達三角”的最優(yōu)解。

靈初智能創(chuàng)始人兼CEO王啟斌表示：“非常感謝投資人的鼎力支持。我們這支集合工業(yè)界老兵和高密度科學家的戰(zhàn)隊，擁有完整的技術(shù)棧，將在具身智能的前沿打造軟硬一體的綜合解決方案，拓展在先進制造，商超物流及2B服務業(yè)等場景中的應用場景，快速實現(xiàn)數(shù)據(jù)閉環(huán)，商業(yè)化落地。在具身智能賽道的初紀元，期待和我們的合作伙伴靈性成長，共同開創(chuàng)智能未來?！?/p>

（免責聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性，但不保證有關(guān)資料的準確性及可靠性，讀者在使用前請進一步核實，并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏，概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時，應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明，并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后，將會依法盡快聯(lián)系相關(guān)文章源頭核實，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。）