GPT或被拋棄?AI未來(lái)是世界級(jí)模型?國(guó)內(nèi)AI模型只能存活三個(gè)?

文/曹雙濤

編輯/楊博丞

題圖/IC Photo

Chat GPT熱度尚未退散,一場(chǎng)大會(huì)又將AI大模型的注意力推向新高度。

在剛剛舉辦的北京智源大會(huì)上,匯聚了眾多傳說(shuō)中的AI大佬,以張鈸、張宏江為代表的國(guó)內(nèi)AI最前沿領(lǐng)軍人物,Geoffery Hinton、Yann LeCun、姚期智、Joseph Sifakis這四位圖靈獎(jiǎng)得主,Open AI創(chuàng)始人Sam Altman、PaLM-E和RoBERTa等AI公司高管。

因每次的智源大會(huì)秉承著專業(yè)的學(xué)術(shù)思想路線,因此在國(guó)內(nèi)外人工領(lǐng)域內(nèi)行精英圈層口碑極高,但對(duì)大眾來(lái)說(shuō),卻稍顯高冷。而在本次大會(huì)上,Sam Altman指出為搞清楚通用AI技術(shù)的發(fā)展,Open AI必須要推進(jìn)AI研究變革。

但這一說(shuō)法卻遭到了不少AI大佬們的反對(duì)。其中,加州伯克利分校教授斯圖爾特·羅素抨擊Open AI研發(fā)的Chat GPT和GPT-4沒(méi)有在“回答”問(wèn)題,它們不理解世界,也不是一個(gè)通用AI的發(fā)展步驟。楊立昆更是直接指出,當(dāng)前的GPT自回歸模型存在缺乏規(guī)劃、推理的能力,未來(lái)GPT系統(tǒng)或?qū)⒈粧仐墶?/p>

除激烈的學(xué)術(shù)爭(zhēng)論外,關(guān)于當(dāng)前AI如何監(jiān)管、后續(xù)AI的發(fā)展方向也成了本次會(huì)議討論的焦點(diǎn)。

01.后續(xù)AI到底要如何監(jiān)管?

進(jìn)入到2023年以來(lái),在生成式AI以勢(shì)如破竹的速度席卷諸多領(lǐng)域的同時(shí),由AI所引發(fā)的各種問(wèn)題也在加劇外界的擔(dān)憂。

在我國(guó),“AI詐騙”成為近期社會(huì)關(guān)注的方向之一。日前,內(nèi)蒙古包頭警方通報(bào)一起利用AI實(shí)施詐騙的案件,福州市某公司法人代表郭先生10分鐘內(nèi)被騙430萬(wàn)元。據(jù)通報(bào),騙子通過(guò)AI換臉和擬聲技術(shù),佯裝熟人實(shí)施詐騙。無(wú)獨(dú)有偶,江蘇常州的小劉被騙子冒充其同學(xué)發(fā)語(yǔ)音、打視頻電話,小劉看到“真人”后信以為真,“借”了6000元給騙子。

圖源:抖音

事實(shí)上,AI詐騙案發(fā)生的背后還是和當(dāng)前AI技術(shù)迅速發(fā)展,技術(shù)合成門檻持續(xù)降低有關(guān)。而從后續(xù)來(lái)看,若AI大模型技術(shù)不斷突破,未來(lái)也將逐漸從面部合成轉(zhuǎn)向到全身合成、3D合成技術(shù),其合成效果也將更加逼真。

在美國(guó),AI是否會(huì)影響選舉成為當(dāng)?shù)孛襟w討論的重點(diǎn)。據(jù)美聯(lián)社報(bào)道,如今復(fù)雜的生成性AI工具能在幾秒鐘內(nèi)“克隆”某人的聲音和形象,制造出大量“假料”。只要綁定強(qiáng)大的社交媒體算法,AI就可以迅速鎖定受眾進(jìn)行傳播,以前所未見(jiàn)的規(guī)模和速度破壞選舉。

美國(guó)其他媒體則預(yù)測(cè),因美國(guó)下一任總統(tǒng)選舉是在明年舉行,不排除美國(guó)兩黨將使用AI技術(shù)用于宣傳、籌款等活動(dòng)。更重要的是,因Chat GPT在文本能力上有著卓越的表現(xiàn)。因此,參選者的團(tuán)隊(duì)僅需在幾秒鐘就能生成一份措辭華麗的演講稿。

基于外界對(duì)AI的種種擔(dān)憂,日前,由“AI教父”杰弗里?辛頓、Anthropic的首席執(zhí)行官達(dá)里奧?阿莫代,Google Deep Mind首席執(zhí)行官戴米斯?哈薩比斯等超過(guò)350位AI領(lǐng)域高管和專家共同簽署了“減輕AI帶來(lái)的滅絕風(fēng)險(xiǎn),應(yīng)該與流行病和核戰(zhàn)爭(zhēng)等其他社會(huì)規(guī)模的風(fēng)險(xiǎn)一起,成為全球優(yōu)先事項(xiàng)”的聯(lián)合聲明。

針對(duì)后續(xù)AI如何監(jiān)管的問(wèn)題,Sam Altman在智源大會(huì)上指出,目前Open AI正在通過(guò)多種方式來(lái)解決這一問(wèn)題。首先,早在5月26日,Open AI啟動(dòng)了一項(xiàng)激勵(lì)計(jì)劃,出資100萬(wàn)美元,向社會(huì)征集有效的AI治理方案。

其次,Sam Altman認(rèn)為人類是無(wú)法發(fā)現(xiàn)一些惡意模型在一些邪惡的事情。目前Open AI正在投資一些新的、互補(bǔ)的方向,希望能夠?qū)崿F(xiàn)突破。但可擴(kuò)展的監(jiān)督是嘗試使用 AI 系統(tǒng)來(lái)協(xié)助人類發(fā)現(xiàn)其他系統(tǒng)缺陷,而解釋能力是用GPT-4解釋GPT-2神經(jīng)元,雖然還有很長(zhǎng)的路要走,但Open AI相信機(jī)器學(xué)習(xí)技術(shù)可進(jìn)一步提高AI可解釋能力。同時(shí),Sam Altman也認(rèn)為未來(lái)只有把模型做得更智能,更加有幫助,才能更好地實(shí)現(xiàn)通用AI的目標(biāo)優(yōu)勢(shì),進(jìn)而降低AI風(fēng)險(xiǎn)。

最后,Open AI短期內(nèi)雖不會(huì)推出GPT-5版本,但未來(lái)十年全球可能會(huì)擁有更強(qiáng)大的AI系統(tǒng),全球范圍內(nèi)需做好提前準(zhǔn)備。而Open AI后續(xù)對(duì)AI大模型的核心工作仍是訓(xùn)練,并且準(zhǔn)備在全球建立一套數(shù)據(jù)庫(kù),以反映全球AI的價(jià)值觀和偏好,即時(shí)向全球分享AI安全研究。

除Open AI自身努力外,Sam Altman也呼吁全球共同努力來(lái)完善對(duì)于AI的監(jiān)管。比如說(shuō),Sam Altman指出當(dāng)前中國(guó)擁有一些世界上最優(yōu)秀的AI人才,考慮到解決 AI 系統(tǒng)對(duì)齊的困難需要來(lái)自世界各地最好的頭腦。

因此,Sam Altman也希望未來(lái)中國(guó)AI研究人員能夠在AI風(fēng)險(xiǎn)上做出貢獻(xiàn)。Tegmark也認(rèn)為,目前中國(guó)在人工智能的監(jiān)管方面做得最多,其次則為歐洲,最后則是美國(guó)。

圖源:智源大會(huì)

另外,Sam Altman也指出,全球AI監(jiān)管的合作困難是有的,但這也實(shí)則是一種機(jī)遇。AI在讓全世界走到一起的同時(shí),后續(xù)也需要出臺(tái)系統(tǒng)性的框架和安全標(biāo)準(zhǔn)。

但考慮當(dāng)前全球大國(guó)和大國(guó)之間的博弈加劇,地緣沖突呈現(xiàn)多點(diǎn)式爆發(fā),各國(guó)政府對(duì)生成式AI的態(tài)度不一,這在讓全球關(guān)于AI監(jiān)管的合作短時(shí)間難以落地的同時(shí),也會(huì)影響到生成式AI公司的市場(chǎng)業(yè)務(wù)。

歐洲一直走在AI監(jiān)管的前沿,5月份歐盟已經(jīng)接近通過(guò)一項(xiàng)人工智能技術(shù)監(jiān)管的立法,這也有望成為全球首部全面的人工智能法案,并可能成為發(fā)達(dá)經(jīng)濟(jì)體的先例。

歐盟委員會(huì)主席烏爾蘇拉·馮德萊恩此前在接受媒體采訪說(shuō)曾表示,“我們希望人工智能系統(tǒng)準(zhǔn)確、可靠、安全且無(wú)歧視,無(wú)論其來(lái)源如何。歐盟相關(guān)法律法規(guī)的出臺(tái),可能會(huì)讓Open AI后續(xù)退出歐盟市場(chǎng)。因此,后續(xù)如何根據(jù)全球監(jiān)管政策的調(diào)整,不斷完善自家的生成式AI模型,這不僅僅是Open AI自身遇到的問(wèn)題,更是全行業(yè)需不斷關(guān)注的問(wèn)題。

02.生成式AI未來(lái)的發(fā)展方向在哪?

不可否認(rèn)的是,當(dāng)前GPT-4在諸多能力上得到了很大提高。和GPT-3.5相比,GPT-4在復(fù)雜專業(yè)領(lǐng)域的性能表現(xiàn)大幅提升,邏輯推理能力也更強(qiáng),其在美國(guó)律師資格考試測(cè)試中,GPT-4的成績(jī)可以達(dá)到前10%,但GPT-3.5只能達(dá)到后10%的水平。

圖源:Open AI

能力的大幅度提高,也讓Chat GPT正開拓更多的使用場(chǎng)景。目前Open AI官方也給出了幾大應(yīng)用場(chǎng)景,如在Duolingo里加入AI與用戶進(jìn)行日常聊天,加速用戶對(duì)語(yǔ)言的學(xué)習(xí);摩根士丹利采用GPT-4來(lái)對(duì)其知識(shí)庫(kù)進(jìn)行管理,幫助員工快速訪問(wèn)想要的內(nèi)容。

但針對(duì)GPT目前的能力,也有不少大佬存在質(zhì)疑。斯圖爾特·羅素在演講中指出,Chat GPT和GPT-4他們并不理解世界,也沒(méi)有在“回答”問(wèn)題,目前的大語(yǔ)言模型僅僅只是一塊拼圖,這個(gè)拼圖目前缺少哪些以及最終會(huì)拼成什么樣,這些均不確定。諸多能力上的欠缺,也決定了發(fā)展通用人工智能還有很長(zhǎng)的路要走?;趯?duì)GPT-4能力的種種質(zhì)疑,也讓斯圖爾特·羅素在Sam Altman在演講期間全程在修改PPT。

圖源:智源大會(huì)

和斯圖爾特·羅素持有相同觀點(diǎn)的也有來(lái)自圖靈獎(jiǎng)”得主、“深度學(xué)習(xí)三巨頭”之一、Meta首席人工智能科學(xué)家楊立昆。他認(rèn)為,當(dāng)前GPT的自回歸模型因缺乏規(guī)劃,導(dǎo)致其推理能力目前整體不行。若單純根據(jù)概率生成自回歸的大語(yǔ)言模型從本質(zhì)上根本無(wú)法解決幻覺(jué),錯(cuò)誤的問(wèn)題。在輸入文本增大的時(shí)候,錯(cuò)誤的概率也會(huì)呈指數(shù)增加。

事實(shí)上,兩位大佬對(duì)GPT的指責(zé)并非不是沒(méi)有道理。因Chat GPT所使用的RLHF算法,本身就是借助人類的感知,讓模型判斷自己的答案質(zhì)量,訓(xùn)練自己逐步給出更高質(zhì)量的回答。若想要讓模型的推理能力得以提高的話,則需要在補(bǔ)充數(shù)據(jù)庫(kù)大量參數(shù)的同時(shí),對(duì)算法也要進(jìn)行不斷迭代。

圖源:西南證券

但各種風(fēng)險(xiǎn)的存在,也讓眾多生成式AI公司并不敢輕易嘗試。若生成式AI能到達(dá)和小說(shuō)作家一樣的具備故事推理能力,以及人物情感創(chuàng)造能力,這是否會(huì)讓生成式AI完全脫離人類的控制呢?這在引發(fā)全球恐慌的同時(shí),又是否會(huì)遭遇來(lái)自當(dāng)?shù)卣膹?qiáng)監(jiān)管,進(jìn)而讓生成式AI此前的投入付諸東流呢?

針對(duì)未來(lái)生成式AI的發(fā)展方向,楊立昆給出的答案是世界模型。這個(gè)世界模型不單單是神經(jīng)水平上模仿人腦的模型,而是在認(rèn)知模塊上也完全貼合人腦分區(qū)的世界模型,它與大語(yǔ)言模型最大的差別在于可以有規(guī)劃和預(yù)測(cè)能力(世界模型)以及成本核算能力(成本模塊)。

借助世界模型能夠更好地理解這個(gè)世界并預(yù)測(cè)和規(guī)劃未來(lái),通過(guò)成本核算模塊,結(jié)合一個(gè)簡(jiǎn)單的需求(一定按照最節(jié)約行動(dòng)成本的邏輯去規(guī)劃未來(lái)),它就可以杜絕一切潛在的毒害和不可靠性。

圖源:智源大會(huì)

但問(wèn)題是世界模型在訓(xùn)練期間的參數(shù)、算法、成本等等問(wèn)題,楊立昆也只是簡(jiǎn)單地給出了一些戰(zhàn)略級(jí)想法。比如采用自監(jiān)督模型去訓(xùn)練以及建立多層級(jí)的思維模式等等,但對(duì)于具體如何落地,楊立昆也無(wú)法給出一個(gè)完整的方案。

而其他參會(huì)嘉賓對(duì)于未來(lái)生成式AI的發(fā)展方向,也并沒(méi)有分享自己的看法。因此,后續(xù)生成式AI仍將維持各家“各自為政”的局面,全球統(tǒng)一的生成式AI或許也只能停留在實(shí)驗(yàn)室階段。

03.國(guó)內(nèi)生成式AI預(yù)測(cè)

智源研究院院長(zhǎng)黃鐵軍教授在會(huì)后接受媒體采訪時(shí)說(shuō),當(dāng)前國(guó)內(nèi)生成式AI大模型存在的問(wèn)題是行業(yè)過(guò)熱,但訓(xùn)練數(shù)據(jù)過(guò)小,現(xiàn)在百億模型也只是剛剛涌現(xiàn)能力。雖然中間也都有一些技術(shù)能力,但因重復(fù)性發(fā)力,這在讓行業(yè)資源愈發(fā)分散的同時(shí),其智能水平和國(guó)外生成式AI大模型相比,仍有一定差距。

如黃鐵軍教授所言,以阿里旗下的“通義千問(wèn)”大模型為例,因該大模型訓(xùn)練時(shí)的數(shù)據(jù)是從阿里旗下的淘寶、支付寶、天貓等產(chǎn)業(yè)中抽取的大量中文對(duì)話和文本數(shù)據(jù),以及一些其他來(lái)源的文本數(shù)據(jù),其前期訓(xùn)練數(shù)據(jù)量是約2000億個(gè)詞,相當(dāng)于14TB的文本數(shù)據(jù)。

而Chat GPT的訓(xùn)練數(shù)據(jù)量是約45億個(gè)詞,相當(dāng)于300GB的文本數(shù)據(jù)。訓(xùn)練數(shù)據(jù)的相對(duì)較小,讓阿里的“通義千問(wèn)”也欠缺多模態(tài)能力,在文字方面上來(lái)看二者均和GPT-4有較大差距。

另?yè)?jù)InfoQ 研究中心發(fā)布的《大語(yǔ)言模型綜合能力測(cè)評(píng)報(bào)告2023》數(shù)據(jù)顯示,目前Chat GPT以77.13%的綜合得分領(lǐng)先于國(guó)內(nèi)其他的大模型廠商。

圖源:《大語(yǔ)言模型綜合能力測(cè)評(píng)報(bào)告2023》

同時(shí),黃鐵軍教授也指出,今天的大模型都是技術(shù)迭代的一個(gè)中間產(chǎn)品,隨著后續(xù)國(guó)內(nèi)大模型行業(yè)的發(fā)展,未來(lái)能夠存活的大模型生態(tài)合理數(shù)量為3個(gè)左右。

正如黃鐵軍教授所說(shuō),此前馬化騰在騰訊內(nèi)部的高層會(huì)議上曾指出,未來(lái)十年C端市場(chǎng)紅利將消失殆盡,整個(gè)希望在ToB端市場(chǎng),互聯(lián)網(wǎng)的下半場(chǎng)則屬于產(chǎn)業(yè)互聯(lián)網(wǎng)。阿里商業(yè)研究院此前也指出,未來(lái)十年是傳統(tǒng)企業(yè)轉(zhuǎn)型的黃金風(fēng)口。

但從ToB端市場(chǎng)來(lái)看,以發(fā)展多年的SaaS市場(chǎng)作為參考,大模型若想要真正打開ToB端市場(chǎng),其核心一定是要客戶帶來(lái)“降本增效”的價(jià)值,尤其是在當(dāng)前不少行業(yè)對(duì)大模型仍保持觀望的情況下更是如此。以傳統(tǒng)制造業(yè)為主,目前中小型傳統(tǒng)制造業(yè)普遍遇到的問(wèn)題是訂單減少,行業(yè)一直在價(jià)格戰(zhàn)中廝殺,下游回款周期變長(zhǎng),許多中小制造業(yè)目前均是在苦苦支撐。為避免出現(xiàn)較高的試錯(cuò)成本,不少中小制造企業(yè)自然不敢輕易嘗試大模型的使用。

并且從SaaS產(chǎn)業(yè)的發(fā)展歷程來(lái)看,自2004年初期開始國(guó)內(nèi)SaaS產(chǎn)業(yè)在經(jīng)歷了波瀾不驚的10年之后,于2015年迎來(lái)了一波生長(zhǎng)高峰。從2020年疫情暴發(fā)至今,疫情加速企業(yè)數(shù)字化轉(zhuǎn)型,國(guó)內(nèi)SaaS市場(chǎng)進(jìn)入了關(guān)鍵的生長(zhǎng)期。但即使如此,當(dāng)前國(guó)內(nèi)SaaS產(chǎn)業(yè)生態(tài)尚未完整,市場(chǎng)并未成熟。

圖源:Flash Cloud

顯然,大模型打開TOB端市場(chǎng)也并非一朝一夕,而是一個(gè)極其緩慢的過(guò)程。而且模型迭代其間因算法、算力、數(shù)據(jù)產(chǎn)生的成本,包括后續(xù)推出各種功能,均要求大模型公司不斷投入高額資金。

商業(yè)化落地時(shí)間長(zhǎng),資金投入高,短期內(nèi)難以盈利等問(wèn)題的存在,后續(xù)也會(huì)讓缺乏現(xiàn)金流的企業(yè),在資金壓力面前只能將企業(yè)自身的大模型進(jìn)行關(guān)停,行業(yè)資源也會(huì)更加向頭部大模型廠商身上集中。

而從網(wǎng)約車、外賣等多個(gè)行業(yè)的經(jīng)驗(yàn)來(lái)看,一個(gè)新興行業(yè)在歷經(jīng)多年的大浪淘沙過(guò)程中,后續(xù)能夠真正發(fā)展起來(lái)的企業(yè)也只在3家左右,其他不少企業(yè)則被淹沒(méi)在歷史的長(zhǎng)河中。

04.結(jié)語(yǔ)

不可否認(rèn)的是,生成式的AI能力正在逐漸被市場(chǎng)所認(rèn)可,但如何對(duì)AI進(jìn)行監(jiān)管將會(huì)是后續(xù)全球多國(guó)一直要重視的問(wèn)題。

而對(duì)于我們普通人擔(dān)心未來(lái)是否會(huì)被AI搶走飯碗,引發(fā)自己失業(yè)所產(chǎn)生的焦慮,或許正如Tegmark所說(shuō),經(jīng)濟(jì)和就業(yè)市場(chǎng)的變化會(huì)越來(lái)越快,如果你在基礎(chǔ)知識(shí)方面很強(qiáng),并且非常善于創(chuàng)造性的開放思維,你就可以靈活地隨波逐流。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2023-06-11
GPT或被拋棄?AI未來(lái)是世界級(jí)模型?國(guó)內(nèi)AI模型只能存活三個(gè)?
AI監(jiān)管將是多國(guó)共同面臨的問(wèn)題。

長(zhǎng)按掃碼 閱讀全文