国产日产欧产精品精品蜜芽,欧美激情性爱网

撰文 | 蘇? ? ?舒

編輯 | 李信馬

題圖 | 官方圖片

中國的互聯(lián)網(wǎng)圈，科技圈的少有這么熱鬧的時(shí)候。

上周，王小川在搜狐網(wǎng)絡(luò)大廈召開了一場(chǎng)發(fā)布會(huì)，重點(diǎn)講了一件事：我，王小川要加入中國大模型創(chuàng)業(yè)大軍。

為什么說是創(chuàng)業(yè)大軍呢？因?yàn)榫驮诎l(fā)布會(huì)樓上的辦公區(qū)，美團(tuán)聯(lián)合創(chuàng)始人王慧文也在此開啟了大模型創(chuàng)業(yè)項(xiàng)目“光年之外”。除了他們之外，還有其他不少創(chuàng)業(yè)者們都涌進(jìn)了大模型創(chuàng)業(yè)賽道。

緊接著，王小川在接受媒體專訪時(shí)，被動(dòng)調(diào)侃了百度的文心一言，隨后百度回嘴，一不小心互聯(lián)網(wǎng)口水戰(zhàn)昔日重現(xiàn)。

這樣的“真性情口水戰(zhàn)”讓寂靜許久的互聯(lián)網(wǎng)圈、科技圈波瀾四起。這不經(jīng)讓人想起了早些年，也是這群人，站在時(shí)代的風(fēng)口，躊躇滿志揮斥方遒，開啟了互聯(lián)網(wǎng)十年黃金期。

而現(xiàn)在，又是這樣一批人，想要抓住AI的風(fēng)口再創(chuàng)輝煌，就這樣，大模型賽道是真的靠著這樣一群人，熱鬧了起來。這種熱鬧，讓不少互聯(lián)網(wǎng)人、創(chuàng)業(yè)者甚至媒體人淚目。

近日，對(duì)話欄目《方桌說》對(duì)王小川進(jìn)行了專訪。我們?cè)噲D從王小川的過去，找尋到他做大模型的底氣，然后去發(fā)現(xiàn)，王小川對(duì)大語言模型的理解究竟如何，也嘗試去向他發(fā)問，對(duì)于未來的考慮。

在采訪中，我們抽絲剝繭的發(fā)現(xiàn)，王小川去做大語言模型，可以算是“順勢(shì)而為”。王小川擁有的技術(shù)實(shí)力、產(chǎn)品理念、學(xué)界力量以及極致的技術(shù)主義信念，這些都是他義無反顧去做大語言模型的底氣。

我將這樣一個(gè)問題拋給王小川，從在清華讀計(jì)算機(jī)系到搜狗工作，以及到現(xiàn)在去做大模型方向的創(chuàng)業(yè)，可以總結(jié)說你生命中的底色就是AI么？

王小川給出的回答是，對(duì)我自身來講，探索生命的意義是我永恒的主題。廣義上生命分幾種，AGI主要指向創(chuàng)造智力。人最根本的需求是“生存”，我的公開信中也反復(fù)提到繁榮和延續(xù)人類文明，“繁榮”指向“生”，“延續(xù)”指向“存”。我說的“生命”，既不是個(gè)體的生命，也不是AGI，而是整個(gè)人類文明——讓人類文明能夠更繁榮和延續(xù)是我的終極理想，我希望向文明、向生命致敬。

這似乎也說明，搜狗創(chuàng)業(yè)也好，大模型創(chuàng)業(yè)也好，都是王小川手上的利刃，它們最終目的，是雕刻出一張寫滿人類文明，以生命為底色的畫卷。

以下是采訪原文，為了便于閱讀，我們?cè)诓桓淖冊(cè)x的基礎(chǔ)上，做了小幅度的調(diào)整。

1、過去：“我與AI結(jié)緣已久”

Q：您是從什么時(shí)候接觸的到AI的？那個(gè)時(shí)候，您對(duì)它有什么樣的理解么？

A：我本人在大學(xué)的時(shí)候，從大一開始就在學(xué)習(xí)人工智能，到了2016年AlphaGo的出現(xiàn)，徹底將AI帶入了大眾的視野。當(dāng)時(shí)不只是技術(shù)本身的一個(gè)突破，在以前，人工智能只存在于高校，現(xiàn)在參與人工智能的企業(yè)是以前的數(shù)倍，從2016年開始人工智能開始真正走向了實(shí)用，但那時(shí)的AI只能算作數(shù)據(jù)智能，不能叫做人工智能。

到了2021年，AlphaFold的出現(xiàn)，讓我們又能夠明白一件事情，一個(gè)基因如何把它變成了一個(gè)蛋白質(zhì)三維結(jié)構(gòu)，這種技術(shù)突破就再一次震驚世界。

而最初看到ChatGPT相關(guān)的論文時(shí)，我沒把它理解成一個(gè)嚴(yán)肅科學(xué)問題，比如你問個(gè)問題它答錯(cuò)了，但當(dāng)你要求它“think step by step”，它就答對(duì)了，我最初覺得很好笑，直到今年1月底我開始認(rèn)真看，才發(fā)現(xiàn)通用人工智能時(shí)代真的到了。

Q：在搜狗的時(shí)候，您是如何將AI與業(yè)務(wù)結(jié)合起來？那個(gè)時(shí)候?qū)I技術(shù)應(yīng)用的思考是什么樣的？

A：很多人可能對(duì)搜狗有誤解，覺得搜索公司不夠AI，其實(shí)搜狗現(xiàn)在都有12000片GPU在跑著，70%是做推理的，搜狗是非常AI化的公司。搜狗的核心是語言相關(guān)工作，NLP是基本功，在大量文本數(shù)據(jù)中篩選高質(zhì)量數(shù)據(jù)的方法和大模型是完全一樣的。所以其實(shí)從搜狗的建立之初，我們就致力于利用AI技術(shù)讓大家更好地表達(dá)與獲取信息。2019 年，我們把此前的使命跟愿景升級(jí)為“讓表達(dá)與獲取知識(shí)更簡單”。

而今天其實(shí)我們說什么產(chǎn)品是能夠把一個(gè)這個(gè)整個(gè)互聯(lián)網(wǎng)的知識(shí)裝進(jìn)來，變成一個(gè)超級(jí)APP？其實(shí) web 現(xiàn)在就三個(gè)東西，一個(gè)是現(xiàn)在ChatGPT，一個(gè)搜索，還有就是輸入法，就這 3 個(gè)東西。整個(gè)互聯(lián)網(wǎng)的信息裝在里面形成的一個(gè)產(chǎn)品，一個(gè)幫助你更好地表達(dá)的，一是幫好你更好地獲取內(nèi)容的，但今天ChatGPT在表達(dá)上遠(yuǎn)超過輸入法，在回答問題的理解深度上也超過搜索，基本上是我們?cè)瓉磉@個(gè)做事情的巨大的一種跨越或升級(jí)版。

Q：離開搜狗后的兩年，您做了什么？

A：離開搜狗的這一年半，我開始釋放自己的這樣一種經(jīng)歷，更多去關(guān)注生命相關(guān)的問題。因?yàn)樵谖易x研究生期間，我當(dāng)時(shí)做的課題就是跟基因測(cè)序拼接算法相關(guān)的，研究基因后面的這么一個(gè)法則。當(dāng)時(shí),我就看到一件事情是人的生命的復(fù)雜性遠(yuǎn)遠(yuǎn)超過了物理世界。我們都知道是牛頓是把物理問題變成了數(shù)學(xué)問題，通過他對(duì)萬有引力的探索，通過他的牛頓三大定律，我們可以用數(shù)學(xué)精確的去刻畫物理世界，但生命我們還做不到。

所以我很好奇的一點(diǎn)，就是如何用數(shù)學(xué)模型怎么去刻畫生命，這是從我研究生期間一直帶來的這樣一個(gè)困惑。AlphaGO和AlphaFold的這樣一種成功，更激發(fā)了我們用這種計(jì)算機(jī)用深度學(xué)習(xí)方法去理解生命。所以這一年半的時(shí)間里面，我都花了很多精力里面去研究這種生命科學(xué)的問題，希望對(duì)于大眾健康產(chǎn)生更多的貢獻(xiàn)。

Q：在此前您對(duì)GPT的，對(duì)大語言模型有關(guān)注么？

A：其實(shí)當(dāng)時(shí) 2021 年的時(shí)候，搜狗搜索技術(shù)團(tuán)隊(duì)在CLUE（中文語言理解測(cè)評(píng)基準(zhǔn)）的任務(wù)比賽中，基于自研的中文預(yù)訓(xùn)練模型擊敗了包括華為盤古在內(nèi)的一眾強(qiáng)勁對(duì)手，在CLUE總榜、分類總榜、閱讀理解榜再次獲得第一名，刷新業(yè)界記錄。當(dāng)時(shí)我們就已經(jīng)訓(xùn)練過百億的模型了。

Q：ChatGPT發(fā)布的那一天您在做什么？

A：這個(gè)確實(shí)記不住了。但首先來講，我是覺得特別激動(dòng)的，對(duì)于語言的理解這塊，科學(xué)家們真的把這事給突破了。

Q：您此前一直非常關(guān)注AlphaGo，那現(xiàn)在的ChatGPT就是當(dāng)初的AlphaGo？并且都開創(chuàng)了不一樣的時(shí)代？

A：Alphago 我覺得確實(shí)是給我們信心了，就是深度學(xué)習(xí)把這個(gè)路給走通了。其實(shí)我們有兩種理念，一種理念就是讓機(jī)器自己學(xué)習(xí)，就是重演一部進(jìn)化史。但 Alpha Zero 其實(shí)已經(jīng)在一個(gè)垂直領(lǐng)域里面做到了最強(qiáng)。所以我覺得AlphaGo的出現(xiàn)，第一讓人對(duì)人工智能有了信心，第二是讓人能夠理解到通用人工智能如果真的完成，能夠做什么事情。

而ChatGPT的出現(xiàn)，可以說是讓人工智能照進(jìn)了現(xiàn)實(shí)，通用人工智能時(shí)代真的到來了。我們正在創(chuàng)造一種新的生命，它和石頭、蒸汽機(jī)、電腦的出現(xiàn)都不一樣，以前都是工具，但AGI不是工具了——它是你的伙伴，新的朋友，是人類進(jìn)化的下一個(gè)階段。

2、現(xiàn)在：“人才是我現(xiàn)在更需要考慮的問題”

Q：為什么一定要下場(chǎng)去做大語言模型？

A：隨著大模型騰空出世的話，我們開始發(fā)現(xiàn)人跟機(jī)器能夠產(chǎn)生很好的對(duì)話，甚至機(jī)器能夠去開始掌握世界的知識(shí)。我也意識(shí)到在解決生命健康問題的時(shí)候，那么不只是研究人的這樣一個(gè)生命的結(jié)構(gòu)，而是人跟外部的這么一個(gè)這種醫(yī)生，他能夠形成新的一種互動(dòng)，能夠有新的方式去幫助人更加健康。

因此我認(rèn)為大模型在醫(yī)療領(lǐng)域同樣會(huì)產(chǎn)生作用。坦白講的話，我們?nèi)诉€沒弄明白生命本身數(shù)學(xué)化的問題，但是我們開始發(fā)現(xiàn)我們能夠讓語言變成了一個(gè)書寫模型的問題，這跟我的老本行特別相關(guān)。

因此我認(rèn)為在解決生命的路徑當(dāng)中，把語言變成數(shù)學(xué)問題，也成為我們?cè)撊ミ@樣的一個(gè)去應(yīng)用突破的一個(gè)支點(diǎn)。有這些方式里面，我們不僅可以能夠去為生命科學(xué)里面建電機(jī)，同時(shí)我們就已經(jīng)可以通過它去構(gòu)造你的這種虛擬的數(shù)字醫(yī)生，這種數(shù)字的老師或者數(shù)字的律師也已經(jīng)產(chǎn)生很大的應(yīng)用。

我認(rèn)為這件事情能夠承接未來對(duì)生命的探索，并且今天就已經(jīng)對(duì)于怎么讓人跟機(jī)器更好相處，產(chǎn)生它實(shí)際的意義，這是我現(xiàn)在這次下場(chǎng)中間很大的一個(gè)原因。

Q：目前項(xiàng)目進(jìn)展如何？

A：4到月底我們差不多就接近50人了，今年年中會(huì)有一個(gè)500億參數(shù)的模型訓(xùn)練出來。年底我們就可以做到中國最好的大模型，可以達(dá)到GPT-3.5以上的水平。當(dāng)然，這不代表我們中間沒有產(chǎn)品發(fā)出來。

Q：從萌生創(chuàng)業(yè)想法到現(xiàn)在，遇到過最困難的事情是什么？

A：人才。我現(xiàn)在最關(guān)心的就是，有沒有人愿意來一塊兒干，能和一群有理想的人，用極致的技術(shù)驅(qū)動(dòng)創(chuàng)造出顛覆性的智能產(chǎn)品。我在公開信中也提到，這一次百川智能將借助語言AI的突破，構(gòu)建中國最好的大模型底座，并在搜索、多模態(tài)、教育、醫(yī)療等方面增強(qiáng)，幫助大眾輕松、普惠的獲取世界知識(shí)和專業(yè)服務(wù)。

也歡迎大家?guī)臀覀兺扑屯哆f建立的郵箱：

80@baichuan-inc.com;

90@baichuan-inc.com；

95@baichuan-inc.com;

00@baichuan-inc.com；

oier@baichuan-inc.com。

Q：5000萬美元啟動(dòng)資金，您認(rèn)為能支撐到創(chuàng)業(yè)的哪個(gè)階段，具體會(huì)用在哪些地方？比較有意思的是，現(xiàn)在宣布進(jìn)軍大模型創(chuàng)業(yè)的大佬們，大多是拿到了5000萬美元的啟動(dòng)資金，這是一個(gè)入門的標(biāo)準(zhǔn)線么？為什么？

A：無論是多少錢，比較務(wù)實(shí)的思考是如何迅速啟動(dòng)，設(shè)定合理的里程碑，并且用最高的效率，以及超預(yù)期的結(jié)果到達(dá)里程碑，那么后續(xù)的資源才會(huì)源源不斷。

同時(shí)，這個(gè)階段人比錢更重要。這個(gè)領(lǐng)域不會(huì)像之前打車、外賣一樣，錢能直接轉(zhuǎn)化成市場(chǎng)份額——今天的錢你可以買樓，你可以買卡，你可以買人，但它都不直接變成市場(chǎng)份額，也不一定有那么多網(wǎng)絡(luò)效應(yīng)。

Q：有下一輪融資的計(jì)劃么？

A：面向機(jī)構(gòu)的融資將會(huì)在近期啟動(dòng)

Q：大模型“燒錢”，不管是算力、算法、人才、數(shù)據(jù)都需要源源不斷的錢，目前在您的規(guī)劃中來看，投入多少錢后可以看到一個(gè)“結(jié)果”？

A：我大概估算過，只是從0到1起步，5000萬美元就夠了，但要持續(xù)做到最好，大概需要3-20億美元。

Q：現(xiàn)在無論是大廠也好，創(chuàng)業(yè)者也罷，還有不少專注于人工智能的企業(yè)，都在做大模型，包括多模態(tài)的，圖生文、或者大語言模型等等，您認(rèn)為您自己和其他創(chuàng)業(yè)者不同的點(diǎn)在哪里，未來的競爭優(yōu)勢(shì)又在哪里？

A：因?yàn)榻裉焓紫仁钦Z言模型，搜索公司做語言確實(shí)有先天優(yōu)勢(shì)。而且搜索公司的經(jīng)驗(yàn)是比較完整的，從數(shù)據(jù)清洗、轉(zhuǎn)化成模型，到最后上線提供服務(wù)、甚至在數(shù)據(jù)安全這一塊的經(jīng)驗(yàn)，其實(shí)都干過。公司的組織結(jié)構(gòu)和評(píng)價(jià)體系，也都有相關(guān)性。所以搜索公司起步的時(shí)候的確是有優(yōu)勢(shì)的。

搜狗的核心是語言相關(guān)工作，NLP是基本功，在大量文本數(shù)據(jù)中篩選高質(zhì)量數(shù)據(jù)的方法和大模型是完全一樣的；其次，在評(píng)價(jià)方法上，從平臺(tái)輸入一個(gè)問題，評(píng)價(jià)它的反饋答案好不好的標(biāo)準(zhǔn)和搜狗也相對(duì)一致，所以我們?cè)谝活^一尾的原始數(shù)據(jù)治理上相對(duì)有更多經(jīng)驗(yàn)，也更擅長對(duì)生成內(nèi)容的好壞做評(píng)價(jià)。當(dāng)然，大模型會(huì)涉及獨(dú)有的經(jīng)驗(yàn)和算法，但我們學(xué)起來也會(huì)很快。

相對(duì)于OpenAI，他們可以用幾萬張卡跑模型去通向AGI，但有些深水區(qū)他們就不碰了，比如搜索、醫(yī)學(xué)，他們可能躲著走，但我要去碰這些東西，我需要更考慮落地應(yīng)用。我們雖然理想比OpenAI慢半步，但我們相信我們?cè)贏GI的具體應(yīng)用落地上會(huì)快半步。

Q：您覺得誰會(huì)做出中國版的ChatGPT？您之前在采訪的時(shí)候說，要做中國最好的模型？怎么定義中國最好的模型？

A：參數(shù)量、測(cè)試集的效果，Chat產(chǎn)品體驗(yàn)。

Q：ChatGPT爆火背后，不少人也關(guān)注到了數(shù)據(jù)隱私與安全，前有三星公司因?yàn)榻尤隒hatGPT導(dǎo)致芯片機(jī)密泄露一事，后有意大利就數(shù)據(jù)安全和數(shù)據(jù)隱私的問題，宣布禁用ChatGPT。ChatGPT大爆發(fā)背后，如何平衡數(shù)據(jù)隱私安全和AI能力之間的關(guān)系？

A：我覺得中國的大模型創(chuàng)業(yè)者首先要考慮活下去，做出最好的大模型。

3、未來：“用技術(shù)理想主義的信念去做普惠AI”

Q：您之前提到，到年底產(chǎn)品將會(huì)對(duì)標(biāo)ChatGPT3.5，您認(rèn)為就目前來說，國內(nèi)已經(jīng)有達(dá)到ChatGPT3.5標(biāo)準(zhǔn)的大模型么？

A：我覺得國內(nèi)大模型一年內(nèi)可能追上GPT-3.5。

Q：您之前也談到，一直非常關(guān)注應(yīng)用層，未來對(duì)大模型應(yīng)用的領(lǐng)域有哪些？未來會(huì)做什么樣的一個(gè)應(yīng)用呢？

A：什么行業(yè)知識(shí)密集，什么行業(yè)就適合大模型。教育服務(wù)高知群體，醫(yī)學(xué)生要學(xué)8年才能走進(jìn)工作崗位，這明顯是知識(shí)密集的兩個(gè)領(lǐng)域。會(huì)是C端的應(yīng)用，到時(shí)候各位就會(huì)看到。

Q：創(chuàng)業(yè)九死一生，您已經(jīng)準(zhǔn)備好面對(duì)接下來的“硬仗”了么？您對(duì)接來下想要入行或者正在入行的創(chuàng)業(yè)者有哪些建議？還有哪些可以進(jìn)行的創(chuàng)業(yè)方向？

A：我這算是二次創(chuàng)業(yè)吧。我是從“人本”來看的——人究竟該怎么跟機(jī)器相處，這是我關(guān)心的問題。從這個(gè)角度出發(fā)，我更知道C端要什么。

Q：不管是外界，還是您自身，一直會(huì)提到技術(shù)理想主義？怎么理解技術(shù)理想主義？在過去搜狗，以及現(xiàn)在大語言模型的創(chuàng)業(yè)中，您會(huì)怎么踐行？需要做到極致的技術(shù)么？極致的技術(shù)，是想OpenAI那樣，去觸摸AI的天花板么？

A：我覺得我理解的技術(shù)理想主義是，首先把技術(shù)做好就是目的，而不是用技術(shù)去服務(wù)商業(yè)化；第二，先相信再看見，而不是先看見再相信。我認(rèn)為任何領(lǐng)域都可能入“道”，茶有茶道，花有花道，而極致的技術(shù)理想主義者一定是一個(gè)純粹的理想主義者。

Q：ChatGPT出現(xiàn)可以算是一場(chǎng)效率的大革新，您認(rèn)為ChatGPT會(huì)引發(fā)第四次工業(yè)革命么？

A：過去工業(yè)革命的邏輯是分工越細(xì)、效率越高、越規(guī)模化。但我們?cè)谥悄苓@扇門的面前，可能是“逆社會(huì)分工”。

機(jī)器使人被普適性地賦能，更像人類擁有了搜索引擎之后，實(shí)現(xiàn)了信息獲取的普惠化。而我們現(xiàn)在是獲得知識(shí)和服務(wù)的能力普惠化。

人最終從工作中解放出來。所以產(chǎn)業(yè)未來會(huì)變平，深度會(huì)壓淺、廣度會(huì)拉開。人的工作會(huì)更加多元化，未必要像現(xiàn)在一樣，必須處于流水線中串在一起才能獲得結(jié)果。所以是“逆社會(huì)分工”。

所以AGI可以給人帶來更平等。它可能會(huì)更像是一種文藝復(fù)興，將重新定義人是什么。

Q：您認(rèn)為大語言模型是通往通用人工智能的路徑么？您也一直提到，現(xiàn)在已經(jīng)進(jìn)入了強(qiáng)人工智能的時(shí)代。在強(qiáng)人工智能時(shí)代下，甚至未來AGI時(shí)代到來后，AI會(huì)怎么樣影響人類生活？

A：我覺得這部分，我用公開信中的內(nèi)容作回答：

智能時(shí)代會(huì)改寫互聯(lián)網(wǎng)時(shí)代的范式。‘連接’會(huì)被‘陪伴’取代，‘信息服務(wù)’會(huì)被‘知識(shí)服務(wù)’取代，‘免費(fèi)與廣告’會(huì)被‘付費(fèi)與高品質(zhì)’取代。

智能時(shí)代也會(huì)改寫自工業(yè)時(shí)代以來的范式。曾經(jīng)是專業(yè)化社會(huì)分工帶來規(guī)模效應(yīng)與效率提升，而未來會(huì)是逆專業(yè)化分工：之前需要很多公司協(xié)作完成的工作，會(huì)因?yàn)锳I的賦能‘端到端’的完成。

智能時(shí)代將再一次開啟“文藝復(fù)興”。每個(gè)人都會(huì)因?yàn)锳I的助力而變得更加強(qiáng)大。用好AI，一個(gè)人就可能做一個(gè)公司，解決之前難以解決的難題，也更容易成為自己想成為的人。社會(huì)也會(huì)更加扁平，以前少數(shù)人才能享有的智力服務(wù)，也能更普惠。

免責(zé)聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請(qǐng)進(jìn)一步核實(shí)，并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏，概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí)，應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后，將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí)，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

對(duì)話王小川：大語言模型是起點(diǎn)，AGI時(shí)代已經(jīng)到來

下一篇

對(duì)話王小川：大語言模型是起點(diǎn)，AGI時(shí)代已經(jīng)到來

下一篇

對(duì)話王小川：大語言模型是起點(diǎn)，AGI時(shí)代已經(jīng)到來