首款國產(chǎn)CAEGPT大模型解決SORA之痛——中國AI企業(yè)的探索之路

從兩月前, Sora大模型的發(fā)布,如平地一聲驚雷,到近日,StreamingT2V的AI視頻模型在幀數(shù)和視頻長度上的突破,全球的注意力都被文生/AI視頻生成領(lǐng)域所牽系,生成的視頻產(chǎn)品無論是連貫性的場景和運(yùn)動(dòng)鏡頭,還是模擬復(fù)雜情境和角色表情,都為AI在理解真實(shí)世界場景并與之實(shí)現(xiàn)互動(dòng),增添了更多細(xì)節(jié)和想象空間。

Sora可以說是人工智能領(lǐng)域的一次革命性突破,OpenAI更是將Sora定位為“世界模擬器”—— Sora對(duì)語言深刻理解,遵循現(xiàn)實(shí)世界的邏輯,展現(xiàn)物體運(yùn)動(dòng)和交互,甚至是光影的捕捉,這些都符合現(xiàn)實(shí)世界的基本物理規(guī)律。

然而,已展現(xiàn)了超強(qiáng)算力的Sora在細(xì)節(jié)的呈現(xiàn)上并不是完美的——在模擬復(fù)雜場景的物理效應(yīng),以及理解某些特定因果關(guān)系時(shí),它可能會(huì)遇到難題——比如,視頻中的人物可能會(huì)咬一口食物,但食物上可能看不到明顯咬痕;比如,在處理空間細(xì)節(jié)分辨左右時(shí),Sora也可能會(huì)出現(xiàn)混淆;比如,特定的攝影機(jī)移動(dòng)軌跡時(shí),也可能顯得力不從心。

目前,人工智能大模型都由數(shù)據(jù)驅(qū)動(dòng),Sora也不例外,她需要“看”到大量的包羅萬象的物理現(xiàn)象,進(jìn)行學(xué)習(xí),才能讓自身智能真正融合到現(xiàn)實(shí)的的物理場景中。世界的運(yùn)行規(guī)律無處不在又極其復(fù)雜,人類無法把這個(gè)所有的運(yùn)行細(xì)節(jié)全部捕捉給Sora們,這也是當(dāng)前人工智能模型在運(yùn)行中碰到的待解決難題。

科技界經(jīng)過漫長的觀察實(shí)踐,捕捉到了世界運(yùn)行背后的基本規(guī)律,并通過第一性原理建立起各種物理定律和數(shù)理方程,并在此基礎(chǔ)上形成的世界模擬模型——“仿真計(jì)算”(CAE仿真)。這一強(qiáng)大的技術(shù),用于生成符合物理規(guī)律的數(shù)據(jù)集,這在許多工程和科學(xué)領(lǐng)域中都是至關(guān)重要的。對(duì)于通用人工智能(AGI)來說,這些數(shù)據(jù)集可以用于訓(xùn)練和優(yōu)化模型,以更好地理解和模擬物理世界,這無疑能為Sora們創(chuàng)造出無窮的“糧食”和針對(duì)性的“營養(yǎng)元素”。

自然界中大多數(shù)物理過程是穩(wěn)恒態(tài)和臨界態(tài)的交替變化。在臨界態(tài)(災(zāi)變態(tài))中系統(tǒng)驟然突變,很難抓拍到足夠的觀察數(shù)據(jù)。因此,臨界態(tài)的數(shù)據(jù)樣本非常稀少,Sora“看”到的絕大多數(shù)都是穩(wěn)恒態(tài)的數(shù)據(jù),所以生成的穩(wěn)恒態(tài)的視頻讓我們嘆為觀止,但是對(duì)臨界態(tài)的處理,往往又讓人啼笑皆非。畢竟,在人類認(rèn)知中,最為關(guān)鍵的物理事件恰恰是概率幾乎為零的臨界態(tài)。正如在Open AI發(fā)布的視頻中看到明顯的時(shí)空不一致,包括違反重力、碰撞動(dòng)力學(xué)、穩(wěn)固性和物理永恒性。

在以上生成的視頻中,我們看到有兩個(gè)明顯的穩(wěn)定狀態(tài):水杯直立和果汁已經(jīng)潑濺完成的狀態(tài)。然而,最為關(guān)鍵的臨界狀態(tài)--果汁從杯中流灑出來的過程卻未被生成。

究其原因,Sora對(duì)物理世界的理解,完全來自于對(duì)海量視頻的學(xué)習(xí)。而物理世界的運(yùn)行規(guī)律可能在這些視頻里表現(xiàn)出來的都是一些微不足道的細(xì)節(jié),并不能完全被Sora所“重視”。幸運(yùn)的是,這些細(xì)節(jié)背后蘊(yùn)含的物理世界的運(yùn)行規(guī)律經(jīng)過人類漫長的“學(xué)習(xí)”,已經(jīng)形成了無數(shù)個(gè)固定的數(shù)理方程,通過求解這些方程,人們能模擬物理世界的真實(shí)運(yùn)行,從而為Sora提供各類符合物理規(guī)律的數(shù)據(jù),使其能夠更好地學(xué)習(xí)、理解和進(jìn)而模擬真實(shí)世界,實(shí)現(xiàn)真正的AGI。

以上的視頻由云廬科技生成,是基于計(jì)算流體動(dòng)力學(xué)仿真數(shù)據(jù)渲染而成,當(dāng)液體從杯子流出時(shí),所呈現(xiàn)的過程更為真實(shí),而這正是目前Sora等不具備物理引擎基底的視頻生成模型無法實(shí)現(xiàn)的。而CAE仿真技術(shù)作為模擬物理世界的核心底層技術(shù),是無縫連接物理世界和數(shù)字世界的橋梁,無數(shù)的符合物理世界運(yùn)行規(guī)律的數(shù)據(jù)或視頻被“喂養(yǎng)”給Sora們,并基于這些海量視頻數(shù)據(jù)樣本進(jìn)行再訓(xùn)練,讓Sora等大模型學(xué)習(xí)和發(fā)現(xiàn)隱藏在這些視頻數(shù)據(jù)背后的物理規(guī)律,茁壯成長。

據(jù)前瞻產(chǎn)業(yè)研究院測算,2023-2025年是我國AIGC產(chǎn)業(yè)市場規(guī)模增長的第一階段,增長率維持在25%左右,2025年市場規(guī)模達(dá)到約260億人民幣。2025年開始,由于行業(yè)生態(tài)完善(特別是底層大模型完成對(duì)外開放),應(yīng)用層蓬勃發(fā)展將帶動(dòng)產(chǎn)業(yè)快速增長,年復(fù)合增長率將超過70%。如果說,AI是未來10-20年最重要的新質(zhì)生產(chǎn)力,那么誰掌握了CAE仿真技術(shù),誰就擁有打開未來之門的鑰匙。正如英偉達(dá)CEO黃仁勛在GTC大會(huì)上表達(dá)的一樣,“數(shù)字孿生和生成式AI都是將價(jià)值高達(dá)50萬億美元的重工業(yè)市場進(jìn)行數(shù)字化所需的基礎(chǔ)技術(shù)”。

仿真技術(shù)及相關(guān)軟件無疑是未來新質(zhì)生產(chǎn)力的核心底座之一,全球的創(chuàng)新科技企業(yè)對(duì)其商業(yè)價(jià)值的探索也在如火如荼展開,國內(nèi)科技企業(yè)在這一波全球化的浪潮中不落人后,堅(jiān)持發(fā)展工業(yè)軟件的自主自力,堅(jiān)持走從中國制造到中國智造的發(fā)展道路,研發(fā)實(shí)力和成果同樣取得了矚目的成就。深耕于仿真計(jì)算領(lǐng)域的云廬科技是一家立足于工業(yè)軟件行業(yè),擁有完整自主知識(shí)產(chǎn)權(quán)的國家級(jí)高新技術(shù)企業(yè),搭建了國內(nèi)領(lǐng)先的全棧仿真計(jì)算平臺(tái),包括方程式代碼生成器,多物理場求解器,仿真云平臺(tái),仿真應(yīng)用云平臺(tái)等。繼2021年發(fā)布了“非線性多物理場耦合仿真云平臺(tái)”, 將多物理場耦合仿真能力提升到一個(gè)新的高度后,又于去年9月,發(fā)布了全球首款CAE領(lǐng)域大模型——CAEGPT。CAEGPT是基于云廬完全自主研發(fā)的CAE內(nèi)核代碼庫構(gòu)建和訓(xùn)練的一個(gè)智能生成CAE代碼的大模型,它通過輸入自然語言文本,能夠快速生成各種場景的CAE仿真代碼。

如果說,過去的大半個(gè)世紀(jì)里,在推動(dòng)人類工業(yè)化、信息化進(jìn)程中的仿真計(jì)算領(lǐng)域,已孵育出的大多還是市值百億美元的歐美公司。那么現(xiàn)在,云廬科技等企業(yè)的出現(xiàn)讓我們看到了中國CAE公司奮起直追與勃勃生機(jī),看到了躋身世界先進(jìn)行列的希望。

解決Sora之痛,中國科技公司給出了自己的方案,在未來即將到來的生成式AI改變?nèi)f物的時(shí)代,我們有理由相信中國CAE的明天也將星河燦爛,熠熠生輝。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )