123,123

OpenAI的最新技術(shù)成果——文生視頻模型Sora，在春節(jié)假期炸裂登場，令海內(nèi)外的AI從業(yè)者、投資人徹夜難眠。

如果你還沒有關(guān)注到這個(gè)新聞，簡單介紹一下：Sora是OpenAI使用超大規(guī)模視頻數(shù)據(jù)，訓(xùn)練出的一個(gè)通用視覺模型，可以理解和模擬運(yùn)動(dòng)中的物理世界，生成不同時(shí)間、縱橫比和分辨率的視頻，最大版本的Sora能夠生成長達(dá)一分鐘的高保真視頻。

Sora發(fā)布之前，也有許多采用各種方法的視頻生成模型，但都使用較少的視覺數(shù)據(jù)，只能生成較短（4秒）或固定大小的視頻。所以，Sora逼真的視覺效果、碾壓級(jí)的性能提升，在震撼整個(gè)科技圈之余，也導(dǎo)致了“中國AI焦慮癥”的人傳人現(xiàn)象。

廣大網(wǎng)友們再一次痛心疾首，對(duì)中國A發(fā)出質(zhì)問：

為什么又一個(gè)AI元?jiǎng)?chuàng)新沒能發(fā)生在中國？我們點(diǎn)錯(cuò)了科技樹，好難過；

中國跟美國的AI差距越來越大，Sora這波國內(nèi)慢了十年吧？這下真跟不上了；

復(fù)制Sora算力是最大阻礙，從芯片禁運(yùn)開始咱們就完敗了，沒戲了。

當(dāng)然也不乏陰陽怪氣的，“等國外的類Sora模型開源，國內(nèi)AI公司就又能創(chuàng)新啦”。

在中美對(duì)弈的時(shí)代背景下，上述焦慮情緒，每一次在海外科技取得重大突破的時(shí)候，都會(huì)蔓延開來。但時(shí)間證明，作為全球唯二的AI大國之一，中國發(fā)展了多年AI技術(shù)，就算美國真有什么新AI成果是其他國家做不了、趕不上的，那也絕對(duì)不是中國。

拿并不遙遠(yuǎn)的ChatGPT來說，經(jīng)過一年狂奔，“中國有沒有自己的ChatGPT”已經(jīng)不再成為問題。2023年很多國產(chǎn)“類ChatGPT”大語言模型已經(jīng)向公眾開放使用，走進(jìn)行業(yè)場景，有數(shù)億用戶檢測過中國AI的真實(shí)水平，或許與OpenAI還存在差距，但肯定不是一些人擔(dān)憂的那樣，認(rèn)為“中國做不到”“技術(shù)有代差”。

這就像我們經(jīng)常會(huì)看到一類“震驚體”新聞，一種新藥問世，就說人類離永生不遠(yuǎn)了；一個(gè)AI突破，就說AGI要實(shí)現(xiàn)了，人類要被毀滅了。讀者在這些奇談怪論中“死去活來”，對(duì)AI的認(rèn)知也在“成神”和“騙子”之間反復(fù)橫跳。而真正懂藥的人，肯定不會(huì)相信一種藥能包治百病，而是搞清楚療效和副作用，在對(duì)應(yīng)的癥狀上使用。

同理，真正了解AI產(chǎn)業(yè)的人，也能正視中國AI的長處，承認(rèn)現(xiàn)實(shí)差距，不卑不亢，積極應(yīng)對(duì)。

尤其是經(jīng)過了ChatGPT的“練兵”之后，這一次我們應(yīng)該更有底氣，客觀看待Sora對(duì)中國AI帶來的真實(shí)變化，準(zhǔn)備迎接又一個(gè)“AI之春”。

變化一：拉近差距

在“ChatGPT為什么沒有誕生在中國？”之后，龍年版本已經(jīng)成了“Sora為什么沒有誕生在中國？”接連兩次錯(cuò)失“元?jiǎng)?chuàng)新”，讓期待中國AI“彎道超車”“后來居上”的急性子讀者，大感失望。

科技發(fā)展從來不是一步登天，現(xiàn)實(shí)并沒有爽文小說中逆襲打臉的“金手指”，只能是一步一個(gè)腳印邁進(jìn)。不能否認(rèn)，大語言模型、文生視頻模型的顛覆性產(chǎn)品，沒有首發(fā)在中國，但也必須看到，中國AI一直都在正確的道路上，并且腳步在加速。

Sora的發(fā)布，反而會(huì)讓中美AI的距離進(jìn)一步拉近，原因有三：

首先，方向一致。

錯(cuò)過一場技術(shù)革命，最可怕的不是來得晚，而是點(diǎn)錯(cuò)技能樹，比如歷史上日本大力發(fā)展的“五代機(jī)”，選錯(cuò)方向就錯(cuò)過了一個(gè)時(shí)代。OpenAI的ChatGPT、Sora都是在大規(guī)模預(yù)訓(xùn)練模型的技術(shù)路徑上，進(jìn)行大量的工程實(shí)踐創(chuàng)新。由此可見，一項(xiàng)新突破，技術(shù)積累、技術(shù)選型是十分重要的，而這條以Transformer架構(gòu)為主的“大模型之路”，中國AI一直在持續(xù)跟進(jìn)，基礎(chǔ)設(shè)施和算法層面的堅(jiān)實(shí)程度是肉眼可見的。

其次，目標(biāo)明確。

OpenAI的元?jiǎng)?chuàng)新讓人應(yīng)接不暇，處于全球AI領(lǐng)先地位，中國AI企業(yè)確實(shí)與其存在差距，始終在追趕。但這并不是諷刺中國AI的理由。“沒有從頭發(fā)明xx技術(shù)”，并不代表不優(yōu)秀，OpenAI也不是Transformer發(fā)明者。而且，OpenAI本身就是一家集合了全球頂尖人才、力量與資本的特殊AI公司，就連谷歌都跟在后面屢敗屢戰(zhàn)，用OpenAI的標(biāo)準(zhǔn)去要求各方面資源受限的中國AI產(chǎn)學(xué)研機(jī)構(gòu)，其實(shí)是不公平的。

Sora明確了，“視頻生成模型是一條構(gòu)建物理世界通用模擬器的有效路徑”，印證了暴力計(jì)算的又一次勝利，“Scaling Law”大力出奇跡的涌現(xiàn)效果，相當(dāng)于為中國AI領(lǐng)域完成了“探路”。有了清晰的追趕目標(biāo)，中國AI各界反而能快速整合資源、投入研發(fā)，從而進(jìn)一步拉近中美在文生視頻上的距離。和ChatGPT一樣，中國AI做出“類Sora”也是必然的，絕不可能錯(cuò)過這一波或者徹底跟不上。

最后，能力具備。

或早或晚，中國一定會(huì)做出“類Sora”，但到底是三年后、五年后，還是十年后？我們認(rèn)為，2024年應(yīng)該就會(huì)看到國產(chǎn)Sora問世。無論是Sora所用到的基礎(chǔ)模型LLM、文生圖模型DALL·E 3、大規(guī)模視頻數(shù)據(jù)集、AI算力體系、大模型開發(fā)工具棧等核心基礎(chǔ)設(shè)施，中國都已經(jīng)具備。比如原創(chuàng)的基礎(chǔ)大語言模型文心一言、訊飛星火、BAICHUAN等，以及文生圖模型文心一格、騰訊混元等，加上過去一年大模型存算傳基礎(chǔ)設(shè)施的突飛猛進(jìn)，有能力和條件支持中國AI修成正果，在視頻生成賽道再現(xiàn) 類ChatGPT 式的成功。

面對(duì)Sora，中國AI努力追趕是必須的，但數(shù)一數(shù)行囊中的工具和果實(shí)，不必妄自菲薄，更不用亂了陣腳。沿著正確且清晰的道路，加速向前跑，中美AI的差距才能縮小。

變化二：國產(chǎn)大模型格局再優(yōu)化

和LLM一樣，不會(huì)出現(xiàn)Sora在全球一枝獨(dú)秀，而國內(nèi)卻無視頻生成模型可用的情況。衷心希望，我們在不久的未來，不會(huì)像LLM百模大戰(zhàn)一樣，從擔(dān)憂“中國沒有Sora”，轉(zhuǎn)而擔(dān)憂“中國要那么多Sora怎么用”。

從這個(gè)角度看，OpenAI從ChatGPT到Sora的持續(xù)輸出，會(huì)讓國內(nèi)AI大模型市場少一點(diǎn)虛火，多一分理性。

少一點(diǎn)虛火，是指底層模型的重要性，被Sora再一次“劃重點(diǎn)”，避免國產(chǎn)大模型低水平的重復(fù)建設(shè)。

2023年一個(gè)又一個(gè)大語言模型被訓(xùn)練出來，推向市場，其中原創(chuàng)性的基礎(chǔ)模型占比最小，更多是行業(yè)大模型，以及很多私有化部署的大模型，在數(shù)據(jù)規(guī)模、參數(shù)規(guī)模上無法與基座模型相提并論，生成效果也會(huì)差很多。這種低水平的重復(fù)建設(shè)，也會(huì)造成AI算力、投資的浪費(fèi)。

而Sora在視頻領(lǐng)域的驚艷表現(xiàn)，再次證明了暴力美學(xué)的有效性，將曾經(jīng)大火的AI視頻創(chuàng)業(yè)公司的模型直接碾壓。正如OpenAI CEO奧特曼在YC W24 啟動(dòng)會(huì)上的演講中所說：最正確的做法是設(shè)想一個(gè)“上帝般的”模型正在運(yùn)作，然后基于這種設(shè)想來構(gòu)建最好的產(chǎn)品。

對(duì)中國AI來說，將為數(shù)不多具有底層原創(chuàng)能力的基座模型，如文心、星火等，作為大模型基礎(chǔ)設(shè)施與支柱，支持初創(chuàng)企業(yè)和千行百業(yè)做好精調(diào)、優(yōu)化，避免“重復(fù)造輪子”，是非常重要的。

多一分理性，是在被Sora驚艷的同時(shí)，也要想到應(yīng)用和商業(yè)化的漸進(jìn)性，以更合理的方案來進(jìn)行國產(chǎn)類Sora的開發(fā)。

類ChatGPT的大語言模型在狂奔一年之后，在與各個(gè)行業(yè)結(jié)合的過程中，已經(jīng)暴露出實(shí)際應(yīng)用場景局限、商業(yè)價(jià)值雖有但不多、大模型投入產(chǎn)出比較低的挑戰(zhàn)。如何用好大模型，已經(jīng)成為中國AI的關(guān)鍵考驗(yàn)。

相比“人人皆可上手”的大語言模型，視頻生成模型的應(yīng)用門檻更高，受眾群體更小，目前OpenAI僅開放給創(chuàng)作者使用，而非像ChatGPT那樣開放給大眾。不難看到，視頻生成模型從研發(fā)到落地，整個(gè)過程會(huì)更加緩慢，應(yīng)用潛力與商業(yè)出口還有待探索。

這一方面留給中國AI產(chǎn)學(xué)各界了較長的追趕窗口期，同時(shí)，由于Sora能夠激活多大的商業(yè)價(jià)值尚不明確，除了字節(jié)跳動(dòng)、流媒體平臺(tái)等要全力投入，其他科技企業(yè)和初創(chuàng)公司都要考慮到商業(yè)化的問題，為創(chuàng)作、商用場景打磨好工具，做好視頻生成模型的提示詞工程，以便非專業(yè)背景的廣大行業(yè)用戶們上手使用。

大模型的價(jià)值需要商業(yè)化來證明，Sora也不例外。視頻生成模型走向行業(yè)的長跑，才剛剛開始。在更廣袤的產(chǎn)業(yè)空間里，如何讓類Sora產(chǎn)品帶來真實(shí)價(jià)值，這個(gè)答案OpenAI沒有給，美國AI不會(huì)給，只能由中國AI自己來書寫，而這也是國內(nèi)更勝一籌的地方。

變化三：長期動(dòng)能的查漏補(bǔ)缺

不必焦慮Sora，并不意味著中國AI就能躺平“坐看云卷云舒”了。必須承認(rèn)，國產(chǎn)大模型還有很多瓶頸尚待解決。

Sora模擬物理世界的通用能力，不僅可以用于影視制作等內(nèi)容創(chuàng)意行業(yè)，還可以為游戲、自動(dòng)駕駛、工業(yè)數(shù)字孿生、電商、文旅等各行各業(yè)，提供一個(gè)構(gòu)建敘事融合世界的技術(shù)支柱。

那么問題來了，國產(chǎn)Sora一定會(huì)出現(xiàn)，但我們做好各行業(yè)規(guī)模應(yīng)用Sora的準(zhǔn)備了嗎？恐怕今天的答案還是，沒有。

前面提到，Sora的“暴力美學(xué)”再次證明了Scale的價(jià)值。而要達(dá)到涌現(xiàn)效果，基座模型仍然高度依賴于大量高質(zhì)量數(shù)據(jù)集，超大規(guī)模算力，大量工程化調(diào)優(yōu)人才，以及由此帶來的巨大開發(fā)及運(yùn)行成本。

即使背靠微軟云的OpenAI，也沒有面向公眾開放使用Sora，也沒有向開發(fā)者開放API接入，就連正式開放使用的時(shí)間表都欠奉。國產(chǎn)AI本就存在的專項(xiàng)算力緊缺問題，在Sora問世之后變得更加緊迫。

同時(shí)不難預(yù)料，為了進(jìn)一步阻截中國AI的發(fā)展，圍繞AI算力的新一輪限制一定會(huì)來。完善和發(fā)展AI基礎(chǔ)設(shè)施，構(gòu)建自主可控的產(chǎn)業(yè)鏈，讓大語言模型、視頻生成模型等新AI技術(shù)都不缺席中國式現(xiàn)代化的進(jìn)程，讓算力成為中國數(shù)字經(jīng)濟(jì)長期發(fā)展的動(dòng)能，中國計(jì)算行業(yè)依舊重任在肩。

此外，在中美AI差距中，數(shù)據(jù)的規(guī)模與質(zhì)量成為越不過的門檻。2023年5月英國《經(jīng)濟(jì)學(xué)人》提出，中國在建立基礎(chǔ)模型方面比美國落后兩到三年，造成這一差距的首要原因就是數(shù)據(jù)，AI模型在訓(xùn)練時(shí)難以充分利用互聯(lián)網(wǎng)內(nèi)容。

針對(duì)這一現(xiàn)狀，2023年12月15日，國家數(shù)據(jù)局同中央網(wǎng)信辦、科技部、工業(yè)和信息化部等17個(gè)部門聯(lián)合印發(fā)《“數(shù)據(jù)要素×”三年行動(dòng)計(jì)劃（2024—2026年）》，目標(biāo)是到2026年底，數(shù)據(jù)要素應(yīng)用場景廣度和深度大幅擴(kuò)展。2024年，我們一定會(huì)見證該行動(dòng)的推進(jìn)與落地，見證數(shù)據(jù)要素成為國產(chǎn)AI的養(yǎng)料。

由此可見，中國AI的查漏補(bǔ)缺，不是一朝一夕的事，也不是某一家AI企業(yè)、某一個(gè)模型廠商的事，面對(duì)已經(jīng)在行動(dòng)的中國產(chǎn)業(yè)各界，何妨多一些耐心。

智者不惑，仁者不憂，勇者不懼。正視Sora給中國AI帶來的變化與挑戰(zhàn)，不為一時(shí)的缺席而焦慮，是相信我們有能力登場，也終將登場。

免責(zé)聲明：此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章，所有文字和圖片版權(quán)歸作者所有，且僅代表作者個(gè)人觀點(diǎn)，與極客網(wǎng)無關(guān)。文章僅供讀者參考，并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱：editor@fromgeek.com。

免責(zé)聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請(qǐng)進(jìn)一步核實(shí)，并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏，概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí)，應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后，將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí)，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

Sora給中國AI帶來的真實(shí)變化

下一篇