從國產(chǎn)視頻生成大模型海外爆紅看中國AI發(fā)展路徑

在剛剛過去的一個(gè)月,來自中國的一款視頻生成大模型可靈成為全球范圍內(nèi)最受關(guān)注的AI產(chǎn)品。創(chuàng)刊于1899年的美國權(quán)威技術(shù)雜志《麻省理工科技評(píng)論》在其官方網(wǎng)站刊文指出,來自中國的新型“文生視頻”人工智能模型“令人興奮”,由中國互聯(lián)網(wǎng)企業(yè)快手發(fā)布的這款產(chǎn)品,在行業(yè)里具有里程碑的意義——這是全球范圍內(nèi)首款可供公眾測(cè)試的文生視頻大模型產(chǎn)品。

過去兩年多來,從ChatGPT發(fā)布到視頻生成大模型Sora問世,都引發(fā)了科技界、產(chǎn)業(yè)界的廣泛關(guān)注。Sora的出現(xiàn)不僅推動(dòng)了AIGC技術(shù)在全球范圍的邁進(jìn),也引發(fā)了對(duì)于中國在未來的全球AI競(jìng)爭(zhēng)中,是否還有技術(shù)創(chuàng)新能力的關(guān)注。

“可靈”大模型的發(fā)布不僅在國際大模型技術(shù)圈層展現(xiàn)了中國技術(shù)具備領(lǐng)先可能,也在一定程度上加速了AI生成視頻產(chǎn)品的競(jìng)爭(zhēng)。如何看待人工智能對(duì)于新質(zhì)生產(chǎn)力的正向作用?下一步如何推動(dòng)應(yīng)用場(chǎng)景和商業(yè)化的應(yīng)用?圍繞這一主題,瞭望智庫近期在京召開了“未來已來,擁抱人工智能+新質(zhì)生產(chǎn)力”課題研討會(huì),國產(chǎn)視頻生成大模型,正在成為助力創(chuàng)作者和行業(yè)從業(yè)者提效的技術(shù)實(shí)現(xiàn)路徑。

國產(chǎn)視頻生成大模型海外爆紅

從ChatGPT發(fā)布到視頻生成大模型Sora問世,來自美國的人工智能公司OpenAI牢牢占據(jù)AIGC領(lǐng)域的創(chuàng)新高峰。所有后來者,不可避免地要接受來自科技愛好者、專業(yè)從業(yè)者以及行業(yè)的高標(biāo)準(zhǔn)比較,甚至更多時(shí)候需要先突破大眾“先入為主”的質(zhì)疑。

國產(chǎn)大模型可靈(Kling)發(fā)布后,美國著名創(chuàng)業(yè)投資公司Y Combinator CEO 于6月8日在海外社交媒體平臺(tái)轉(zhuǎn)發(fā)并稱贊了可靈生成的 Demo(樣片);英國開源人工智能公司Stability AI 前 CEO Emad Mostaque 表示:“中國的 AI 技術(shù)有自己的優(yōu)勢(shì)。”可靈在大幅度運(yùn)動(dòng)的合理性、物理世界特性的高度模擬能力,以及強(qiáng)大的概念組合能力和想象力方面都獲得了海外專業(yè)人士的認(rèn)可。

美國科技媒體在對(duì)可靈的評(píng)價(jià)中,也罕見地釋放了同一信號(hào):這是中國大型科技公司在人工智能 (AI) 應(yīng)用領(lǐng)域努力趕上美國同行的最新跡象。比如,硅谷的科技新聞媒體The Information將可靈評(píng)價(jià)為“讓人印象深刻的”,并稱之為Sora的競(jìng)爭(zhēng)對(duì)手。另一家美國科技媒體Tech Radar同樣表示,視頻生成是下一個(gè) AI 大戰(zhàn)場(chǎng),Kling AI 是一個(gè)令人印象深刻的新對(duì)手。

在媒體的報(bào)道中,可靈最初被稱之為國產(chǎn)版Sora,但來自海內(nèi)外眾多的產(chǎn)品測(cè)評(píng)顯示,國產(chǎn)版Sora的定義明顯低估了可靈的能力。一家專注于人工智能研究的自媒體“The AI GRID”甚至在測(cè)評(píng)后,直接給出了“Game Over”的結(jié)論,表示中國最新的AI視頻工具可靈已經(jīng)全面戰(zhàn)勝了Sora。

可靈的出現(xiàn),也在一定程度上加速了AI視頻領(lǐng)域的競(jìng)爭(zhēng)。就在快手可靈上線一周后的6月13日,Luma AI發(fā)布最新文生視頻模型Dream Machine,向所有用戶免費(fèi)開放使用,生成式AI平臺(tái)Runway7月2日宣布,其文生視頻模型Gen-3 Alpha向所有用戶開放使用。

業(yè)內(nèi)人士認(rèn)為,AI大模型與全球生成式AI的行業(yè)生態(tài)和產(chǎn)業(yè)格局息息相關(guān),這也是可靈“一石激起千層浪”的核心原因。

人工智能發(fā)展如何走出“中國路徑”

搶灘AI至高點(diǎn)過程中,對(duì)中國AI能力的一個(gè)普遍判斷是,雖處于第一梯隊(duì),但與Open AI等所代表的發(fā)達(dá)國家人工智能研發(fā)相比,還處于追趕狀態(tài)。以可靈為代表的國產(chǎn)視頻生成大模型,正在修正這一觀點(diǎn),并給中國人工智能創(chuàng)新領(lǐng)域注入信心。

“應(yīng)充分認(rèn)識(shí)我國發(fā)展人工智能的優(yōu)勢(shì)。”十三屆全國政協(xié)社會(huì)和法制委員會(huì)副主任陳智敏表示,我國發(fā)展人工智能的優(yōu)勢(shì)有:黨的集中統(tǒng)一領(lǐng)導(dǎo),新型舉國體制,集中力量辦大事的優(yōu)勢(shì);制造業(yè)的優(yōu)勢(shì),我國制造業(yè)總產(chǎn)值占全球比重達(dá)35%,為人工智能基礎(chǔ)設(shè)施建設(shè)奠定了堅(jiān)實(shí)的基礎(chǔ);民營(yíng)企業(yè)敢闖敢試優(yōu)勢(shì),我國民營(yíng)企業(yè)貢獻(xiàn)50%以上的稅收,60%以上的GDP,70%以上的技術(shù)創(chuàng)新成果。

一個(gè)來自行業(yè)的共識(shí)是,以可靈為代表的視頻生成大模型,早已突破“豐富創(chuàng)意庫工具”層面的較量,轉(zhuǎn)向了“新質(zhì)生產(chǎn)力工具”的革新。

“6月份第一周,可靈是世界第一。”長(zhǎng)期關(guān)注人工智能應(yīng)用的清華大學(xué)新聞學(xué)院教授沈陽表示,在人工智能應(yīng)用上,要重視短視頻領(lǐng)域和人工智能的結(jié)合。

“短視頻占到中國網(wǎng)民上網(wǎng)的一半時(shí)間,全世界現(xiàn)在慢慢也是這樣。”沈陽表示,目前大模型領(lǐng)域從應(yīng)用的角度來看,我們達(dá)到過世界第一,如果繼續(xù)強(qiáng)化,還有可能在Sora、Luma、Runway的競(jìng)爭(zhēng)下又走出一條路。

在快手研究院執(zhí)行院長(zhǎng)蔡雄山看來,進(jìn)一步做大做強(qiáng)國產(chǎn)文生視頻大模型,可以充分發(fā)揮短視頻直播行業(yè)的優(yōu)勢(shì)。

“短視頻直播生態(tài)具有應(yīng)用場(chǎng)景多元、機(jī)制靈活、反應(yīng)速度快等特點(diǎn),天然適合大模型訓(xùn)練和應(yīng)用場(chǎng)景布局。”蔡雄山說,可靈在海外引發(fā)的關(guān)注和業(yè)態(tài)競(jìng)爭(zhēng)加速,對(duì)于中國人工智能發(fā)展路徑的啟發(fā)是,通往人工智能未來的競(jìng)爭(zhēng)中,算力的確是核心因素之一,但研發(fā)所依賴的海量數(shù)據(jù)、產(chǎn)業(yè)積累、用戶規(guī)模,也是重要變量,并導(dǎo)向不同的發(fā)展路徑。

多位與會(huì)專家認(rèn)為,無論從戰(zhàn)略布局還是產(chǎn)業(yè)參與看,全球新一輪科技競(jìng)爭(zhēng)中,人工智能將走出“中國路徑”, 即與產(chǎn)業(yè)的更緊密融合,甚至直接脫胎于產(chǎn)業(yè)領(lǐng)域,實(shí)現(xiàn)新質(zhì)生產(chǎn)力引領(lǐng)下的高質(zhì)量發(fā)展。

在這一點(diǎn)上,視頻生成大模型可靈的率先內(nèi)測(cè)和應(yīng)用,恰恰切中了這個(gè)命題。可以說,中國AI能力正在形成基礎(chǔ)設(shè)施、技術(shù)研發(fā)、產(chǎn)業(yè)應(yīng)用、用戶驅(qū)動(dòng)的多向奔赴,而不是純技術(shù)與算力的“內(nèi)卷”,這些都是中國在全球AI競(jìng)爭(zhēng)中的優(yōu)勢(shì),也是一家民營(yíng)企業(yè)能夠推出第一個(gè)視頻大模型產(chǎn)品的獨(dú)特土壤。

作為新興數(shù)字技術(shù),人工智能體現(xiàn)出了更高的自主性與擬真性,讓AI視頻生成技術(shù)具有廣闊的應(yīng)用前景。

推動(dòng)公共數(shù)據(jù)開放共享提升AI競(jìng)爭(zhēng)力

通往人工智能未來的競(jìng)爭(zhēng)中,算法、算力與數(shù)據(jù),是支撐大模型發(fā)展的三大基石。更高質(zhì)量、更豐富的數(shù)據(jù)是生成式AI大模型成功的驅(qū)動(dòng)力。

蔡雄山認(rèn)為,人工智能研發(fā)與應(yīng)用對(duì)資金、算力、數(shù)據(jù)的需求有目共睹,尤其在突破前沿技術(shù)方面,既需要持續(xù)的現(xiàn)金流和利潤(rùn)支撐,又需要龐大的用戶基數(shù)、數(shù)據(jù)沉淀和多元的應(yīng)用場(chǎng)景。

十三屆全國政協(xié)社會(huì)和法制委員會(huì)副主任陳智敏在研討會(huì)上表示,超大的市場(chǎng)、海量的數(shù)據(jù)要素、以及豐富的應(yīng)用場(chǎng)景,是我國人工智能發(fā)展的優(yōu)勢(shì)所在。

據(jù)了解,中國的公共數(shù)據(jù)非常豐富,在可公開獲取的公共數(shù)據(jù)領(lǐng)域具有突出優(yōu)勢(shì)。有研究顯示,我國政府部門掌握的數(shù)據(jù)資源占據(jù)全社會(huì)數(shù)據(jù)資源總量的50%—80%左右,但目前公共數(shù)據(jù)開放共享不夠、數(shù)據(jù)利用率不高。我國公共數(shù)據(jù)開放共享還有很大空間。

針對(duì)“人工智能+新質(zhì)生產(chǎn)力”的議題,新質(zhì)生產(chǎn)力從全新視角釋放的新動(dòng)能和新活力,對(duì)生產(chǎn)力各要素提出新要求,與會(huì)專家也提出了相關(guān)建議。

“實(shí)現(xiàn)數(shù)實(shí)融合,我認(rèn)為這是催生新質(zhì)生產(chǎn)力的有效途徑,同時(shí)它也可以促進(jìn)生產(chǎn)關(guān)系的完善、改進(jìn)。”國務(wù)院發(fā)展研究中心原副主任侯云春認(rèn)為,首先要加強(qiáng)數(shù)與實(shí)的聯(lián)手互動(dòng);第二,精選慎選數(shù)實(shí)融合的解決方案;第三,打通盤活數(shù)據(jù)要素;第四,對(duì)于數(shù)實(shí)融合的失誤和過程要提高容忍度,允許試錯(cuò)。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )