国产一起色一起爱,久久久久久逼

到底什么時(shí)候，才能有一家公司趕超OpenAI？這句問(wèn)題，想必是過(guò)去一年多來(lái)，縈繞在不少讀者心中的困惑。

如果全世界只有一家公司能趕超OpenAI，谷歌應(yīng)該是最有希望的選手。

同為北美AI巨頭的谷歌，與OpenAI有著相同的AGI目標(biāo)、世界級(jí)的技術(shù)人才、全球資金資源，就連OpenAI大模型的核心Transformer架構(gòu)，都是谷歌原創(chuàng)發(fā)明的。

然而2023年至今，AI領(lǐng)域風(fēng)云迭起，OpenAI永遠(yuǎn)快谷歌一步。谷歌每次拿出一個(gè)“復(fù)仇大殺器”，想一雪前恥的時(shí)候，總會(huì)被OpenAI搶走風(fēng)頭。

比如最新推出的核彈級(jí)多模態(tài)大模型Gemini 1.5，只在科技話題榜上“炸裂”了幾個(gè)小時(shí)，就因?yàn)榫o隨其后推出的Sora過(guò)于炸裂、更吸引眼球，而變得無(wú)人在意。

毫無(wú)疑問(wèn)，AI領(lǐng)域正在進(jìn)行著一場(chǎng)世界上最精彩的“速度與激情”，領(lǐng)先的OpenAI贏得漂亮，緊隨其后的谷歌也輸?shù)皿w面。我發(fā)現(xiàn)它們的境遇，被龍年春節(jié)檔的熱門(mén)電影，給精準(zhǔn)拿捏了。

如果說(shuō)OpenAI是驚艷四座、激動(dòng)人心的《熱辣滾燙》，那谷歌就像是《飛馳人生2》中艱難追夢(mèng)的中年賽車(chē)手，鼓起勇氣全速前進(jìn)，結(jié)果不是贏，而是來(lái)了個(gè)大翻車(chē)。

誰(shuí)能摘下賽道終點(diǎn)AGI的圣杯，結(jié)果還未可知，這一年多來(lái)，僅僅是欣賞這一長(zhǎng)程賽事的初始賽段，都已經(jīng)令人極為振奮了。

谷歌與OpenAI的AI對(duì)線，可謂是屢戰(zhàn)屢敗、屢敗屢戰(zhàn)。我們就從這場(chǎng)精彩的“雙雄競(jìng)速”，來(lái)整體看一看北美AI巨頭的產(chǎn)業(yè)對(duì)壘形勢(shì)。

谷歌三連敗，北美AI巨頭的激情對(duì)線

目前，在爭(zhēng)奪AGI通用人工智能圣杯的賽場(chǎng)上，分別有三支北美AI巨頭：OpenAI、谷歌、Meta。

其中，Meta走的是開(kāi)源路線，其大模型系列LLaMA是目前全球最活躍的AI開(kāi)源社區(qū)。而OpenAI和谷歌則在同一條賽道上，主要打造“閉源”大模型。

盡管OpenAI被嘲諷“不再Open”，谷歌工作人員也大膽諫言“我們和OpenAI都沒(méi)有護(hù)城河”。但換個(gè)角度，閉源的業(yè)務(wù)策略要說(shuō)服用戶付費(fèi)，必須提供高質(zhì)量模型、具備難以替代的能力優(yōu)勢(shì)，這也會(huì)驅(qū)動(dòng)模型廠商持續(xù)創(chuàng)新，保持競(jìng)爭(zhēng)優(yōu)勢(shì)，是AI產(chǎn)業(yè)中一股不可缺少的商業(yè)力量。

所以，北美AI三巨頭的對(duì)壘格局，就是Meta卷生態(tài)，OpenAI與谷歌卷模型。

那么，把目光聚焦到模型賽道上，比賽情況如何呢？

2023一整年，和OpenAI同一賽道的谷歌，深深品嘗到了peer pressure同輩壓力的滋味。

這場(chǎng)競(jìng)速，可以分為三個(gè)賽段：

Round1.ChatGPT VS Bard.

結(jié)果不用多說(shuō)，這是一場(chǎng)谷歌被OpenAI“摘了桃子”而開(kāi)啟的競(jìng)賽，從此就只能一路跟在OpenAI的尾氣后面。

2022年11月，OpenAI發(fā)布ChatGPT一鳴驚人，開(kāi)啟了全球大語(yǔ)言模型的熱潮。

其中，ChatGPT的基礎(chǔ)技術(shù)Transformer是谷歌推出的，大語(yǔ)言模型的涌現(xiàn)現(xiàn)象是谷歌研究員Jason Wei發(fā)現(xiàn)的（后來(lái)跳槽到了OpenAI）。用谷歌的技術(shù)，搶谷歌的人，沖擊谷歌的AI領(lǐng)導(dǎo)地位，OpenAI可謂是一通“騎臉輸出”。

谷歌的應(yīng)對(duì)，是“一怒之下怒了一下”。

2023年3月，谷歌緊急發(fā)布了Bard。但這個(gè)模型本身的性能就比較弱，上線時(shí)功能有限，只支持英文，只針對(duì)少數(shù)用戶，跟ChatGPT完全不能打。

Round2.GPT-4 VS PaLM2.

有人說(shuō)，谷歌采用的是“田忌賽馬”策略，第一局故意放出了比較弱的機(jī)器學(xué)習(xí)模型Bard。這話有一定道理，但架不住OpenAI的每匹馬都是好馬。

OpenAI很快推出了升級(jí)版的GPT-4，并開(kāi)放了 GPT-4 的 API，把谷歌甩得更遠(yuǎn)了。

5月的谷歌I/O 2023大會(huì)，派出來(lái)對(duì)打GPT- 4的PaLM 2，也是一個(gè)“過(guò)渡產(chǎn)品”。谷歌研究副總裁Zoubin Ghahramani對(duì)外表示，PaLM 2是對(duì)早期模型的改進(jìn)，僅僅縮小了谷歌與OpenAI在AI方面的差距，但并沒(méi)有整體超越GPT-4。

這一輪，谷歌仍然落后。谷歌顯然也清楚這一點(diǎn)，在這場(chǎng)大會(huì)上同時(shí)宣布，正在訓(xùn)練PaLM的繼任者，名為Gemini，押注了上億身家，準(zhǔn)備在年底上演“王子復(fù)仇記”。

Round3.Gemini家族VS Sora+GPT-5。

2023年底的12月，谷歌Gemini“雖遲但到”，這個(gè)谷歌目前最強(qiáng)大、最通用的AI模型，被媒體稱(chēng)為“復(fù)仇殺器”。這期間，OpenAI上演了一出“甄嬛回宮”的宮斗大戲，沒(méi)有特別炸裂的產(chǎn)品。這一次，谷歌能奪回屬于自己的一切嗎？

很遺憾，谷歌并沒(méi)能上演AI領(lǐng)域的“龍王歸來(lái)”。

三個(gè)尺寸的Gemini：Nano、Pro和Ultra，其中Gemini Pro在常識(shí)推理任務(wù)中落后于OpenAI的GPT模型，Gemini Ultra對(duì)于GPT-4僅有幾個(gè)百分點(diǎn)的優(yōu)勢(shì)，而GPT-4是OpenAI一年前的產(chǎn)品。而且，Gemini還被爆出，宣稱(chēng)打敗GPT-4的多模態(tài)視頻，有后期制作和剪輯的成分，用中國(guó)模型產(chǎn)生的中文語(yǔ)料進(jìn)行訓(xùn)練，自稱(chēng)是文心一言。

谷歌一鼓作氣，一腳油門(mén)，Gemini Ultra發(fā)布還沒(méi)幾天，就推出了多模態(tài)大模型Gemini 1.5，能夠穩(wěn)定處理高達(dá)100萬(wàn)token，創(chuàng)下了最長(zhǎng)上下文窗口的紀(jì)錄。

這是一個(gè)激動(dòng)人心的成果，如果沒(méi)有Sora的話。

OpenAI幾個(gè)小時(shí)之后，就推出了文字視頻生成模型Sora，用前所未有的視頻生成性能，以及世界模型的產(chǎn)品化，再一次驚艷了世人，搶走了本應(yīng)屬于Gemini 1.5的話題度，也強(qiáng)化了自己的AI領(lǐng)導(dǎo)地位。目前人們傾向于認(rèn)為，OpenAI還是領(lǐng)先谷歌一籌。

此前大家都猜測(cè)是GPT-5已經(jīng)訓(xùn)練得差不多了，面對(duì)谷歌目前最強(qiáng)的模型Gemini 1.5，已經(jīng)有人隔空喊話奧特曼，問(wèn)他還要把寶貝捂到什么時(shí)候，還不快點(diǎn)放出GPT-5。

至此，為期約一年的北美AI“田忌賽馬”，以谷歌的三連敗，暫時(shí)告一段落。

AGI的殊途，難以飛馳的谷歌

AGI是一場(chǎng)長(zhǎng)長(zhǎng)的賽事。拉長(zhǎng)時(shí)間軸，谷歌與OpenAI的一年對(duì)壘與一時(shí)成敗，或許未來(lái)看都不算什么。有資格走上頂級(jí)賽道，本身就是谷歌AI實(shí)力的一種證明。

比起輸贏結(jié)果，更值得討論的是，谷歌變成“卷王”卷了一整年，為什么會(huì)一直被OpenAI甩在身后，怎么折騰都跟不上？

田忌賽馬，輸一次是戰(zhàn)術(shù)失誤，次次都輸，可能就能關(guān)注一下，是不是從馬種、馬圈、草料等源頭，就已經(jīng)存在問(wèn)題了。

回到源頭，谷歌和OpenAI可謂是同歸、殊途。

同歸，是雙方都以實(shí)現(xiàn)通用人工智能，摘下AGI圣杯作為目標(biāo)；

殊途，是雙方選擇的技術(shù)路線不同。OpenAI將更為通用的語(yǔ)言能力，作為實(shí)現(xiàn)AGI的基礎(chǔ)，因此采用了對(duì)NLP領(lǐng)域至關(guān)重要的Transformer架構(gòu)，打造了一系列GPT模型，才有了ChatGPT的驚艷亮相。

而谷歌則不然。多年來(lái)，谷歌的AI研發(fā)機(jī)構(gòu)DeepMind，將強(qiáng)化學(xué)習(xí)、深度學(xué)習(xí)用于解決各種人工智能問(wèn)題，技術(shù)積累非常廣泛。比如石破天驚的AlphaGo、徹底改變生物學(xué)的AlphaFold，以及Transformer等NLP技術(shù)。

這就相當(dāng)于，兩個(gè)車(chē)手在為比賽準(zhǔn)備賽車(chē)，OpenAI為AGI選了一個(gè)場(chǎng)地，比如“方程式賽車(chē)”，然后以語(yǔ)言為核心進(jìn)行模型的開(kāi)發(fā)制造，對(duì)賽車(chē)（模型）的結(jié)構(gòu)、長(zhǎng)寬、發(fā)動(dòng)機(jī)、汽缸等進(jìn)行優(yōu)化改造（工程化）。而谷歌的DeepMind則不確定哪種車(chē)能終結(jié)AGI比賽，手里的技術(shù)工具又很多，于是方程式賽車(chē)、跑車(chē)、摩托車(chē)都造一下試試。

兩種路線原本并沒(méi)有什么優(yōu)劣之分。但隨著大語(yǔ)言模型的“智能涌現(xiàn)”，證明了OpenAI選擇的技術(shù)路線更有希望實(shí)現(xiàn)AGI，谷歌DeepMind的技術(shù)路線就暴露出了明顯的短板：

1.方向分散，成本高昂。在各個(gè)技術(shù)方向上投入的泛創(chuàng)新，消耗了大量資金，DeepMind與谷歌母公司AlphaBeta在商業(yè)化上的矛盾日趨加深。在OpenAI大幅融資加速的時(shí)候，谷歌為了加大對(duì)AI的投資，通過(guò)裁員來(lái)節(jié)省成本。

2.選型太多，難以聚焦。谷歌開(kāi)創(chuàng)了許多技術(shù)，但每個(gè)技術(shù)的重視程度、持續(xù)深入強(qiáng)度也被分散了，四處打井不出水。最典型的就是Transformer架構(gòu)，由谷歌發(fā)明，但被OpenAI發(fā)揚(yáng)光大。ChatGPT的涌現(xiàn)現(xiàn)象，也是研究員在谷歌發(fā)現(xiàn)之后，但得不到重視，出走OpenAI后向前推進(jìn)。

3.落地遲緩，成果太慢。谷歌內(nèi)部對(duì)AI的保守也是出名的，導(dǎo)致其即使掌握了先進(jìn)的技術(shù)，成果轉(zhuǎn)化的效率也很低下。有前谷歌員工曾吐槽，谷歌的項(xiàng)目一般都是先吹一陣牛，然后什么也不發(fā)布，一年后再把這個(gè)項(xiàng)目給砍了。這一點(diǎn)在Sora的爆火上就能看到，訓(xùn)練Sora使用的擴(kuò)散模型（diffusion model）、文生圖模型，谷歌都有相應(yīng)的技術(shù)儲(chǔ)備和成果，但就是沒(méi)能先搞出Sora這樣的產(chǎn)品。

可以看到，由于一開(kāi)始就押注錯(cuò)了賽道，等到大語(yǔ)言模型成為AGI最有潛力的實(shí)現(xiàn)路徑，OpenAI領(lǐng)先的大勢(shì)已成。這時(shí)的谷歌再要回到OpenAI所在的技術(shù)賽道上，當(dāng)然就處于劣勢(shì)身位了。

一步錯(cuò)，步步錯(cuò)的“人生”，挺住意味著一切

坦誠(chéng)地說(shuō)，谷歌已經(jīng)在積極解決問(wèn)題，包括技術(shù)戰(zhàn)略選擇失誤、內(nèi)部的管理效率人事冗余、AI技術(shù)人才的外流等。

去年4月，谷歌將自己的兩個(gè)AI“扛把子”團(tuán)隊(duì)——谷歌大腦和DeepMind合并，共同進(jìn)行Gemini的開(kāi)發(fā)。從最終效果來(lái)看，Gemini的表現(xiàn)是很優(yōu)秀的，1.5版本是目前全球最領(lǐng)先的大模型之一。內(nèi)部資源也大幅度向AI領(lǐng)域傾斜，一些外流的AI人才回歸谷歌。

實(shí)際行動(dòng)表明，谷歌在明確了賽道之后，追趕OpenAI的決心和速度都是一等一的。

但持續(xù)落后的現(xiàn)實(shí)也充分詮釋了一點(diǎn)：自己的失敗固然可怕，朋友的成功更讓人揪心。

盡管谷歌竭力解決自身的種種弊病，全力推動(dòng)大模型，但架不住OpenAI的加速度更強(qiáng)大。

一方面，OpenAI的研發(fā)團(tuán)隊(duì)可謂是全力以赴，而谷歌新合并的團(tuán)隊(duì)還需要磨合。Sora核心研發(fā)人員Bill Peebles曾透露，團(tuán)隊(duì)每天基本不睡覺(jué)高強(qiáng)度工作了一年。而谷歌大腦和DeepMind合并之后，很多員工不得不放棄自己原本熟悉的軟件，放棄原本開(kāi)展的項(xiàng)目去開(kāi)發(fā)Gemini，這些內(nèi)部磨合導(dǎo)致的項(xiàng)目延遲、停滯，必然會(huì)給谷歌追趕OpenAI帶來(lái)阻礙。

另外，相比谷歌亡羊補(bǔ)牢式地招回人才，OpenAI虹吸全球頂級(jí)AI人才的氣勢(shì)如虹。就在2月份，Altman公開(kāi)在社交媒體上表示，“所有關(guān)鍵資源都已到位，非常專(zhuān)注于AGI”，在線誠(chéng)聘人才。AI的競(jìng)爭(zhēng)歸根結(jié)底是人才的競(jìng)爭(zhēng)，因?yàn)锳GI最重要的是智力資源，而最頂尖最優(yōu)秀的人才一共只有那么多，這也讓人為谷歌能否追趕上OpenAI捏了一把汗。

電影《飛馳人生2》中，主角再度嘗試賽車(chē)而翻車(chē)后，他沒(méi)有繼續(xù)追求賽場(chǎng)上的贏，而是作為一個(gè)深?lèi)?ài)著賽車(chē)運(yùn)動(dòng)的車(chē)手，踏上賽場(chǎng)，只為證明自己。

谷歌與OpenAI的對(duì)線，也不能歸于簡(jiǎn)單的輸和贏。正如谷歌在「Why We Focus on AI (and to what end)」中所言：我們相信AI能夠成為一項(xiàng)基礎(chǔ)技術(shù)，徹底改變?nèi)澜缛嗣竦纳睢@正是我們追求的目標(biāo)，也是我們的激情所在！

所有勇于下場(chǎng)、站上跑道的AI“賽車(chē)手”，都值得掌聲。而這場(chǎng)充滿了速度與激情的AGI比賽，一定還會(huì)帶給觀眾席上的我們，更多震撼。

免責(zé)聲明：此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章，所有文字和圖片版權(quán)歸作者所有，且僅代表作者個(gè)人觀點(diǎn)，與極客網(wǎng)無(wú)關(guān)。文章僅供讀者參考，并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱：editor@fromgeek.com。

免責(zé)聲明：本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請(qǐng)進(jìn)一步核實(shí)，并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏，概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí)，應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后，將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí)，溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

OpenAI和谷歌，AI對(duì)線中的飛馳人生

下一篇

OpenAI和谷歌，AI對(duì)線中的飛馳人生

下一篇

OpenAI和谷歌，AI對(duì)線中的飛馳人生