對(duì)話王小川:大語言模型是起點(diǎn),AGI時(shí)代已經(jīng)到來

撰文 | 蘇? ? ?舒

編輯 | 李 信 馬

題圖 | 官方圖片

中國的互聯(lián)網(wǎng)圈,科技圈的少有這么熱鬧的時(shí)候。

上周,王小川在搜狐網(wǎng)絡(luò)大廈召開了一場(chǎng)發(fā)布會(huì),重點(diǎn)講了一件事:我,王小川要加入中國大模型創(chuàng)業(yè)大軍。

為什么說是創(chuàng)業(yè)大軍呢?因?yàn)榫驮诎l(fā)布會(huì)樓上的辦公區(qū),美團(tuán)聯(lián)合創(chuàng)始人王慧文也在此開啟了大模型創(chuàng)業(yè)項(xiàng)目“光年之外”。除了他們之外,還有其他不少創(chuàng)業(yè)者們都涌進(jìn)了大模型創(chuàng)業(yè)賽道。

緊接著,王小川在接受媒體專訪時(shí),被動(dòng)調(diào)侃了百度的文心一言,隨后百度回嘴,一不小心互聯(lián)網(wǎng)口水戰(zhàn)昔日重現(xiàn)。

這樣的“真性情口水戰(zhàn)”讓寂靜許久的互聯(lián)網(wǎng)圈、科技圈波瀾四起。這不經(jīng)讓人想起了早些年,也是這群人,站在時(shí)代的風(fēng)口,躊躇滿志揮斥方遒,開啟了互聯(lián)網(wǎng)十年黃金期。

而現(xiàn)在,又是這樣一批人,想要抓住AI的風(fēng)口再創(chuàng)輝煌,就這樣,大模型賽道是真的靠著這樣一群人,熱鬧了起來。這種熱鬧,讓不少互聯(lián)網(wǎng)人、創(chuàng)業(yè)者甚至媒體人淚目。

近日,對(duì)話欄目《方桌說》對(duì)王小川進(jìn)行了專訪。我們?cè)噲D從王小川的過去,找尋到他做大模型的底氣,然后去發(fā)現(xiàn),王小川對(duì)大語言模型的理解究竟如何,也嘗試去向他發(fā)問,對(duì)于未來的考慮。

在采訪中,我們抽絲剝繭的發(fā)現(xiàn),王小川去做大語言模型,可以算是“順勢(shì)而為”。 王小川擁有的技術(shù)實(shí)力、產(chǎn)品理念、學(xué)界力量以及極致的技術(shù)主義信念,這些都是他義無反顧去做大語言模型的底氣。

我將這樣一個(gè)問題拋給王小川,從在清華讀計(jì)算機(jī)系到搜狗工作,以及到現(xiàn)在去做大模型方向的創(chuàng)業(yè),可以總結(jié)說你生命中的底色就是AI么?

王小川給出的回答是,對(duì)我自身來講,探索生命的意義是我永恒的主題。廣義上生命分幾種,AGI主要指向創(chuàng)造智力。人最根本的需求是“生存”,我的公開信中也反復(fù)提到繁榮和延續(xù)人類文明,“繁榮”指向“生”,“延續(xù)”指向“存”。我說的“生命”,既不是個(gè)體的生命,也不是AGI,而是整個(gè)人類文明——讓人類文明能夠更繁榮和延續(xù)是我的終極理想,我希望向文明、向生命致敬。

這似乎也說明,搜狗創(chuàng)業(yè)也好,大模型創(chuàng)業(yè)也好,都是王小川手上的利刃,它們最終目的,是雕刻出一張寫滿人類文明,以生命為底色的畫卷。

以下是采訪原文,為了便于閱讀,我們?cè)诓桓淖冊(cè)x的基礎(chǔ)上,做了小幅度的調(diào)整。

1、過去:“我與AI結(jié)緣已久”

Q:您是從什么時(shí)候接觸的到AI的?那個(gè)時(shí)候,您對(duì)它有什么樣的理解么?

A:我本人在大學(xué)的時(shí)候,從大一開始就在學(xué)習(xí)人工智能,到了2016年AlphaGo的出現(xiàn),徹底將AI帶入了大眾的視野。當(dāng)時(shí)不只是技術(shù)本身的一個(gè)突破,在以前,人工智能只存在于高校,現(xiàn)在參與人工智能的企業(yè)是以前的數(shù)倍,從2016年開始人工智能開始真正走向了實(shí)用,但那時(shí)的AI只能算作數(shù)據(jù)智能,不能叫做人工智能。

到了2021年,AlphaFold的出現(xiàn),讓我們又能夠明白一件事情,一個(gè)基因如何把它變成了一個(gè)蛋白質(zhì)三維結(jié)構(gòu),這種技術(shù)突破就再一次震驚世界。

而最初看到ChatGPT相關(guān)的論文時(shí),我沒把它理解成一個(gè)嚴(yán)肅科學(xué)問題,比如你問個(gè)問題它答錯(cuò)了,但當(dāng)你要求它“think step by step”,它就答對(duì)了,我最初覺得很好笑,直到今年1月底我開始認(rèn)真看,才發(fā)現(xiàn)通用人工智能時(shí)代真的到了。

Q:在搜狗的時(shí)候,您是如何將AI與業(yè)務(wù)結(jié)合起來?那個(gè)時(shí)候?qū)I技術(shù)應(yīng)用的思考是什么樣的?

A:很多人可能對(duì)搜狗有誤解,覺得搜索公司不夠AI,其實(shí)搜狗現(xiàn)在都有12000片GPU在跑著,70%是做推理的,搜狗是非常AI化的公司。搜狗的核心是語言相關(guān)工作,NLP是基本功,在大量文本數(shù)據(jù)中篩選高質(zhì)量數(shù)據(jù)的方法和大模型是完全一樣的。所以其實(shí)從搜狗的建立之初,我們就致力于利用AI技術(shù)讓大家更好地表達(dá)與獲取信息。2019 年,我們把此前的使命跟愿景升級(jí)為“讓表達(dá)與獲取知識(shí)更簡單”。

而今天其實(shí)我們說什么產(chǎn)品是能夠把一個(gè)這個(gè)整個(gè)互聯(lián)網(wǎng)的知識(shí)裝進(jìn)來,變成一個(gè)超級(jí)APP?其實(shí) web 現(xiàn)在就三個(gè)東西,一個(gè)是現(xiàn)在ChatGPT,一個(gè)搜索,還有就是輸入法,就這 3 個(gè)東西。整個(gè)互聯(lián)網(wǎng)的信息裝在里面形成的一個(gè)產(chǎn)品,一個(gè)幫助你更好地表達(dá)的,一是幫好你更好地獲取內(nèi)容的,但今天ChatGPT在表達(dá)上遠(yuǎn)超過輸入法,在回答問題的理解深度上也超過搜索,基本上是我們?cè)瓉磉@個(gè)做事情的巨大的一種跨越或升級(jí)版。

Q:離開搜狗后的兩年,您做了什么?

A:離開搜狗的這一年半,我開始釋放自己的這樣一種經(jīng)歷,更多去關(guān)注生命相關(guān)的問題。因?yàn)樵谖易x研究生期間,我當(dāng)時(shí)做的課題就是跟基因測(cè)序拼接算法相關(guān)的,研究基因后面的這么一個(gè)法則。當(dāng)時(shí),我就看到一件事情是人的生命的復(fù)雜性遠(yuǎn)遠(yuǎn)超過了物理世界。我們都知道是牛頓是把物理問題變成了數(shù)學(xué)問題,通過他對(duì)萬有引力的探索,通過他的牛頓三大定律,我們可以用數(shù)學(xué)精確的去刻畫物理世界,但生命我們還做不到。

所以我很好奇的一點(diǎn),就是如何用數(shù)學(xué)模型怎么去刻畫生命,這是從我研究生期間一直帶來的這樣一個(gè)困惑。AlphaGO和AlphaFold的這樣一種成功,更激發(fā)了我們用這種計(jì)算機(jī)用深度學(xué)習(xí)方法去理解生命。所以這一年半的時(shí)間里面,我都花了很多精力里面去研究這種生命科學(xué)的問題,希望對(duì)于大眾健康產(chǎn)生更多的貢獻(xiàn)。

Q:在此前您對(duì)GPT的,對(duì)大語言模型有關(guān)注么?

A:其實(shí)當(dāng)時(shí) 2021 年的時(shí)候,搜狗搜索技術(shù)團(tuán)隊(duì)在CLUE(中文語言理解測(cè)評(píng)基準(zhǔn))的任務(wù)比賽中,基于自研的中文預(yù)訓(xùn)練模型擊敗了包括華為盤古在內(nèi)的一眾強(qiáng)勁對(duì)手,在CLUE總榜、分類總榜、閱讀理解榜再次獲得第一名,刷新業(yè)界記錄。當(dāng)時(shí)我們就已經(jīng)訓(xùn)練過百億的模型了。

Q:ChatGPT發(fā)布的那一天您在做什么?

A:這個(gè)確實(shí)記不住了。但首先來講,我是覺得特別激動(dòng)的,對(duì)于語言的理解這塊,科學(xué)家們真的把這事給突破了。

Q:您此前一直非常關(guān)注AlphaGo,那現(xiàn)在的ChatGPT就是當(dāng)初的AlphaGo?并且都開創(chuàng)了不一樣的時(shí)代?

A:Alphago 我覺得確實(shí)是給我們信心了,就是深度學(xué)習(xí)把這個(gè)路給走通了。其實(shí)我們有兩種理念,一種理念就是讓機(jī)器自己學(xué)習(xí),就是重演一部進(jìn)化史。但 Alpha Zero 其實(shí)已經(jīng)在一個(gè)垂直領(lǐng)域里面做到了最強(qiáng)。所以我覺得AlphaGo的出現(xiàn),第一讓人對(duì)人工智能有了信心,第二是讓人能夠理解到通用人工智能如果真的完成,能夠做什么事情。

而ChatGPT的出現(xiàn),可以說是讓人工智能照進(jìn)了現(xiàn)實(shí),通用人工智能時(shí)代真的到來了。我們正在創(chuàng)造一種新的生命,它和石頭、蒸汽機(jī)、電腦的出現(xiàn)都不一樣,以前都是工具,但AGI不是工具了——它是你的伙伴,新的朋友,是人類進(jìn)化的下一個(gè)階段。

2、現(xiàn)在:“人才是我現(xiàn)在更需要考慮的問題”

Q:為什么一定要下場(chǎng)去做大語言模型?

A:隨著大模型騰空出世的話,我們開始發(fā)現(xiàn)人跟機(jī)器能夠產(chǎn)生很好的對(duì)話,甚至機(jī)器能夠去開始掌握世界的知識(shí)。我也意識(shí)到在解決生命健康問題的時(shí)候,那么不只是研究人的這樣一個(gè)生命的結(jié)構(gòu),而是人跟外部的這么一個(gè)這種醫(yī)生,他能夠形成新的一種互動(dòng),能夠有新的方式去幫助人更加健康。

因此我認(rèn)為大模型在醫(yī)療領(lǐng)域同樣會(huì)產(chǎn)生作用。坦白講的話,我們?nèi)诉€沒弄明白生命本身數(shù)學(xué)化的問題,但是我們開始發(fā)現(xiàn)我們能夠讓語言變成了一個(gè)書寫模型的問題,這跟我的老本行特別相關(guān)。

因此我認(rèn)為在解決生命的路徑當(dāng)中,把語言變成數(shù)學(xué)問題,也成為我們?cè)撊ミ@樣的一個(gè)去應(yīng)用突破的一個(gè)支點(diǎn)。有這些方式里面,我們不僅可以能夠去為生命科學(xué)里面建電機(jī),同時(shí)我們就已經(jīng)可以通過它去構(gòu)造你的這種虛擬的數(shù)字醫(yī)生,這種數(shù)字的老師或者數(shù)字的律師也已經(jīng)產(chǎn)生很大的應(yīng)用。

我認(rèn)為這件事情能夠承接未來對(duì)生命的探索,并且今天就已經(jīng)對(duì)于怎么讓人跟機(jī)器更好相處,產(chǎn)生它實(shí)際的意義,這是我現(xiàn)在這次下場(chǎng)中間很大的一個(gè)原因。

Q:目前項(xiàng)目進(jìn)展如何?

A:4到月底我們差不多就接近50人了,今年年中會(huì)有一個(gè)500億參數(shù)的模型訓(xùn)練出來。年底我們就可以做到中國最好的大模型,可以達(dá)到GPT-3.5以上的水平。當(dāng)然,這不代表我們中間沒有產(chǎn)品發(fā)出來。

Q:從萌生創(chuàng)業(yè)想法到現(xiàn)在,遇到過最困難的事情是什么?

A:人才。我現(xiàn)在最關(guān)心的就是,有沒有人愿意來一塊兒干,能和一群有理想的人,用極致的技術(shù)驅(qū)動(dòng)創(chuàng)造出顛覆性的智能產(chǎn)品。我在公開信中也提到,這一次百川智能將借助語言AI的突破,構(gòu)建中國最好的大模型底座,并在搜索、多模態(tài)、教育、醫(yī)療等方面增強(qiáng),幫助大眾輕松、普惠的獲取世界知識(shí)和專業(yè)服務(wù)。

也歡迎大家?guī)臀覀兺扑屯哆f建立的郵箱:

80@baichuan-inc.com;

90@baichuan-inc.com;

95@baichuan-inc.com;

00@baichuan-inc.com;

oier@baichuan-inc.com。

Q:5000萬美元啟動(dòng)資金,您認(rèn)為能支撐到創(chuàng)業(yè)的哪個(gè)階段,具體會(huì)用在哪些地方?比較有意思的是,現(xiàn)在宣布進(jìn)軍大模型創(chuàng)業(yè)的大佬們,大多是拿到了5000萬美元的啟動(dòng)資金,這是一個(gè)入門的標(biāo)準(zhǔn)線么?為什么?

A:無論是多少錢,比較務(wù)實(shí)的思考是如何迅速啟動(dòng),設(shè)定合理的里程碑,并且用最高的效率,以及超預(yù)期的結(jié)果到達(dá)里程碑,那么后續(xù)的資源才會(huì)源源不斷。

同時(shí),這個(gè)階段人比錢更重要。這個(gè)領(lǐng)域不會(huì)像之前打車、外賣一樣,錢能直接轉(zhuǎn)化成市場(chǎng)份額——今天的錢你可以買樓,你可以買卡,你可以買人,但它都不直接變成市場(chǎng)份額,也不一定有那么多網(wǎng)絡(luò)效應(yīng)。

Q:有下一輪融資的計(jì)劃么?

A:面向機(jī)構(gòu)的融資將會(huì)在近期啟動(dòng)

Q:大模型“燒錢”,不管是算力、算法、人才、數(shù)據(jù)都需要源源不斷的錢,目前在您的規(guī)劃中來看,投入多少錢后可以看到一個(gè)“結(jié)果”?

A:我大概估算過,只是從0到1起步,5000萬美元就夠了,但要持續(xù)做到最好,大概需要3-20億美元。

Q:現(xiàn)在無論是大廠也好,創(chuàng)業(yè)者也罷,還有不少專注于人工智能的企業(yè),都在做大模型,包括多模態(tài)的,圖生文、或者大語言模型等等,您認(rèn)為您自己和其他創(chuàng)業(yè)者不同的點(diǎn)在哪里,未來的競爭優(yōu)勢(shì)又在哪里?

A:因?yàn)榻裉焓紫仁钦Z言模型,搜索公司做語言確實(shí)有先天優(yōu)勢(shì)。而且搜索公司的經(jīng)驗(yàn)是比較完整的,從數(shù)據(jù)清洗、轉(zhuǎn)化成模型,到最后上線提供服務(wù)、甚至在數(shù)據(jù)安全這一塊的經(jīng)驗(yàn),其實(shí)都干過。公司的組織結(jié)構(gòu)和評(píng)價(jià)體系,也都有相關(guān)性。所以搜索公司起步的時(shí)候的確是有優(yōu)勢(shì)的。

搜狗的核心是語言相關(guān)工作,NLP是基本功,在大量文本數(shù)據(jù)中篩選高質(zhì)量數(shù)據(jù)的方法和大模型是完全一樣的;其次,在評(píng)價(jià)方法上,從平臺(tái)輸入一個(gè)問題,評(píng)價(jià)它的反饋答案好不好的標(biāo)準(zhǔn)和搜狗也相對(duì)一致,所以我們?cè)谝活^一尾的原始數(shù)據(jù)治理上相對(duì)有更多經(jīng)驗(yàn),也更擅長對(duì)生成內(nèi)容的好壞做評(píng)價(jià)。當(dāng)然,大模型會(huì)涉及獨(dú)有的經(jīng)驗(yàn)和算法,但我們學(xué)起來也會(huì)很快。

相對(duì)于OpenAI,他們可以用幾萬張卡跑模型去通向AGI,但有些深水區(qū)他們就不碰了,比如搜索、醫(yī)學(xué),他們可能躲著走,但我要去碰這些東西,我需要更考慮落地應(yīng)用。我們雖然理想比OpenAI慢半步,但我們相信我們?cè)贏GI的具體應(yīng)用落地上會(huì)快半步。

Q:您覺得誰會(huì)做出中國版的ChatGPT?您之前在采訪的時(shí)候說,要做中國最好的模型?怎么定義中國最好的模型?

A:參數(shù)量、測(cè)試集的效果,Chat產(chǎn)品體驗(yàn)。

Q:ChatGPT爆火背后,不少人也關(guān)注到了數(shù)據(jù)隱私與安全,前有三星公司因?yàn)榻尤隒hatGPT導(dǎo)致芯片機(jī)密泄露一事,后有意大利就數(shù)據(jù)安全和數(shù)據(jù)隱私的問題,宣布禁用ChatGPT。ChatGPT大爆發(fā)背后,如何平衡數(shù)據(jù)隱私安全和AI能力之間的關(guān)系?

A:我覺得中國的大模型創(chuàng)業(yè)者首先要考慮活下去,做出最好的大模型。

3、未來:“用技術(shù)理想主義的信念去做普惠AI”

Q:您之前提到,到年底產(chǎn)品將會(huì)對(duì)標(biāo)ChatGPT3.5,您認(rèn)為就目前來說,國內(nèi)已經(jīng)有達(dá)到ChatGPT3.5標(biāo)準(zhǔn)的大模型么?

A:我覺得國內(nèi)大模型一年內(nèi)可能追上GPT-3.5。

Q:您之前也談到,一直非常關(guān)注應(yīng)用層,未來對(duì)大模型應(yīng)用的領(lǐng)域有哪些?未來會(huì)做什么樣的一個(gè)應(yīng)用呢?

A:什么行業(yè)知識(shí)密集,什么行業(yè)就適合大模型。教育服務(wù)高知群體,醫(yī)學(xué)生要學(xué)8年才能走進(jìn)工作崗位,這明顯是知識(shí)密集的兩個(gè)領(lǐng)域。會(huì)是C端的應(yīng)用,到時(shí)候各位就會(huì)看到。

Q:創(chuàng)業(yè)九死一生,您已經(jīng)準(zhǔn)備好面對(duì)接下來的“硬仗”了么?您對(duì)接來下想要入行或者正在入行的創(chuàng)業(yè)者有哪些建議?還有哪些可以進(jìn)行的創(chuàng)業(yè)方向?

A:我這算是二次創(chuàng)業(yè)吧。我是從“人本”來看的——人究竟該怎么跟機(jī)器相處,這是我關(guān)心的問題。從這個(gè)角度出發(fā),我更知道C端要什么。

Q:不管是外界,還是您自身,一直會(huì)提到技術(shù)理想主義?怎么理解技術(shù)理想主義?在過去搜狗,以及現(xiàn)在大語言模型的創(chuàng)業(yè)中,您會(huì)怎么踐行?需要做到極致的技術(shù)么?極致的技術(shù),是想OpenAI那樣,去觸摸AI的天花板么?

A:我覺得我理解的技術(shù)理想主義是,首先把技術(shù)做好就是目的,而不是用技術(shù)去服務(wù)商業(yè)化;第二,先相信再看見,而不是先看見再相信。我認(rèn)為任何領(lǐng)域都可能入“道”,茶有茶道,花有花道,而極致的技術(shù)理想主義者一定是一個(gè)純粹的理想主義者。

Q:ChatGPT出現(xiàn)可以算是一場(chǎng)效率的大革新,您認(rèn)為ChatGPT會(huì)引發(fā)第四次工業(yè)革命么?

A:過去工業(yè)革命的邏輯是分工越細(xì)、效率越高、越規(guī)模化。但我們?cè)谥悄苓@扇門的面前,可能是“逆社會(huì)分工”。

機(jī)器使人被普適性地賦能,更像人類擁有了搜索引擎之后,實(shí)現(xiàn)了信息獲取的普惠化。而我們現(xiàn)在是獲得知識(shí)和服務(wù)的能力普惠化。

人最終從工作中解放出來。所以產(chǎn)業(yè)未來會(huì)變平,深度會(huì)壓淺、廣度會(huì)拉開。人的工作會(huì)更加多元化,未必要像現(xiàn)在一樣,必須處于流水線中串在一起才能獲得結(jié)果。所以是“逆社會(huì)分工”。

所以AGI可以給人帶來更平等。它可能會(huì)更像是一種文藝復(fù)興,將重新定義人是什么。

Q:您認(rèn)為大語言模型是通往通用人工智能的路徑么?您也一直提到,現(xiàn)在已經(jīng)進(jìn)入了強(qiáng)人工智能的時(shí)代。在強(qiáng)人工智能時(shí)代下,甚至未來AGI時(shí)代到來后,AI會(huì)怎么樣影響人類生活?

A:我覺得這部分,我用公開信中的內(nèi)容作回答:

智能時(shí)代會(huì)改寫互聯(lián)網(wǎng)時(shí)代的范式。‘連接’會(huì)被‘陪伴’取代,‘信息服務(wù)’會(huì)被‘知識(shí)服務(wù)’取代,‘免費(fèi)與廣告’會(huì)被‘付費(fèi)與高品質(zhì)’取代。

智能時(shí)代也會(huì)改寫自工業(yè)時(shí)代以來的范式。曾經(jīng)是專業(yè)化社會(huì)分工帶來規(guī)模效應(yīng)與效率提升,而未來會(huì)是逆專業(yè)化分工:之前需要很多公司協(xié)作完成的工作,會(huì)因?yàn)锳I的賦能‘端到端’的完成。

智能時(shí)代將再一次開啟“文藝復(fù)興”。每個(gè)人都會(huì)因?yàn)锳I的助力而變得更加強(qiáng)大。用好AI,一個(gè)人就可能做一個(gè)公司,解決之前難以解決的難題,也更容易成為自己想成為的人。社會(huì)也會(huì)更加扁平,以前少數(shù)人才能享有的智力服務(wù),也能更普惠。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2023-04-17
對(duì)話王小川:大語言模型是起點(diǎn),AGI時(shí)代已經(jīng)到來
極致的技術(shù)理想主義者一定是一個(gè)純粹的理想主義者。

長按掃碼 閱讀全文