張鈸:發(fā)展第三代人工智能,推動(dòng)產(chǎn)業(yè)化創(chuàng)新應(yīng)用及產(chǎn)業(yè)發(fā)展

7月6日,昇騰人工智能產(chǎn)業(yè)高峰論壇在上海舉辦。會(huì)上,中國科學(xué)院院士、清華大學(xué)計(jì)算機(jī)系教授、清華大學(xué)人工智能研究院名譽(yù)院長張鈸發(fā)表演講。

image001.jpg

以下是張鈸演講全文:

各位專家、各位嘉賓、大家好!非常高興被聘請為昇騰榮譽(yù)顧問,這可能是對人工智能工作者的一種鼓勵(lì),我覺得人工智能工作者是需要鼓勵(lì)的,因?yàn)槿斯ぶ悄苁窃陉J無人區(qū),人工智能取得的每一個(gè)進(jìn)步都是非常艱難的。

首先,我想談一個(gè)問題,怎么樣估計(jì)ChatGPT的成就?目前有兩種說法,一種說法是ChatGPT是通用人工智能,還有一種說法它不是通用人工智能,哪個(gè)對呢?我的觀點(diǎn)是哪個(gè)都不對。怎么樣估計(jì)ChatGPT的成果呢?我認(rèn)為最恰當(dāng)?shù)墓烙?jì)是向通用人工智能邁出一步。按照微軟的說法是通用人工智能的火花,我贊成這種觀點(diǎn)。

為什么呢?首先ChatGPT具有通用人工智能的以下兩個(gè)特征,第一個(gè)特征是在對話和聊天這個(gè)領(lǐng)域,它達(dá)到了人工智能的目標(biāo),或者說達(dá)到了行為主義主張的人工智能的目標(biāo)。行為主義人工智能是人工智能的主流,背后的哲學(xué)是唯物主義、實(shí)用主義。它追求的人工智能目標(biāo)是什么?使得機(jī)器的行為跟人類的行為相似,為什么說ChatGPT達(dá)到了這個(gè)目標(biāo)呢?因?yàn)槲覀兏鶦hatGPT對話的時(shí)候,和與人類的對話很相近,因此它滿足第一個(gè)通用人工智能的特征。

第二個(gè)特征,ChatGPT是開領(lǐng)域、多任務(wù)的,在對話這個(gè)問題里跟領(lǐng)域無關(guān),這是一個(gè)重大的突破。大家知道人工智能經(jīng)歷過第一代知識(shí)驅(qū)動(dòng),第二代數(shù)據(jù)驅(qū)動(dòng),都只能在限定領(lǐng)域里面完成單個(gè)任務(wù)。ChatGPT變成開領(lǐng)域,走向通用。在通用人工智能最重要的兩個(gè)特征上達(dá)到要求,即一個(gè)接近人類水平,一個(gè)跟領(lǐng)域無關(guān)。所以,我們可以說它向通用人工智能邁出一步。因?yàn)樗皇窃趯υ?,或者講得寬一點(diǎn),是在語言處理這個(gè)領(lǐng)域里面達(dá)到這個(gè)目標(biāo),所以我們還不能把它稱作通用人工智能。因?yàn)樵趧e的人工智能領(lǐng)域里面,它是不是能通用呢?現(xiàn)在還說不清楚,所以我覺得這樣的估計(jì)是非常恰當(dāng)?shù)?。我們只有在這樣的估計(jì)下,才能討論下面的問題。

首先一個(gè)問題,ChatGPT為什么能夠達(dá)到現(xiàn)在這樣的水平,甚至很多地方使大家感到非常驚奇?主要是由于人工智能經(jīng)過六七十年的努力,在三個(gè)問題上實(shí)現(xiàn)了突破,或者說是三個(gè)關(guān)鍵科技問題的突破。

第一個(gè)科技問題,基于詞嵌入的文本語意表示。

第二個(gè)科技問題,是大家非常熟悉的轉(zhuǎn)換器,就是基于注意機(jī)制的轉(zhuǎn)換器,也就是大模型,我們現(xiàn)在說的大模型就是大轉(zhuǎn)換器。

第三個(gè)科技問題,就是基于“預(yù)測下一個(gè)詞”的自監(jiān)督學(xué)習(xí),我們應(yīng)該說ChatGPT是經(jīng)過人工智能領(lǐng)域里或者多個(gè)領(lǐng)域里大量的科學(xué)家和工程師,經(jīng)過六七十年共同努力的結(jié)果,因?yàn)榻?jīng)過六七十年這三個(gè)問題才得到突破。這三個(gè)科技問題的突破,使得機(jī)器在處理文本上起到了本質(zhì)的變化,過去我們在處理文本的時(shí)候,我們往往把它稱作處理數(shù)據(jù),到現(xiàn)在為止,大家還是用的這個(gè)詞,但是這個(gè)詞在ChatGPT里不成立。

因?yàn)镃hatGPT是在我們找到了文本語意表示這個(gè)條件下再處理文本,所以它處理的不是文本的形式,不是把文本當(dāng)成數(shù)據(jù)來處理,而是把文本當(dāng)成知識(shí)來處理。

所以,ChatGPT成功并不是僅僅歸功于三個(gè)要素,也就是數(shù)據(jù)、算力和算法。我覺得應(yīng)該強(qiáng)調(diào)四個(gè)要素,分別是知識(shí)、數(shù)據(jù)、算法和算力。也就是說,我們有了三個(gè)關(guān)鍵問題的突破,就使得我們能夠從大量的文本,所謂“數(shù)據(jù)”,從大量的數(shù)據(jù)中獲取知識(shí),只有出現(xiàn)這個(gè)轉(zhuǎn)變才有現(xiàn)在的ChatGPT,如果我們還是停留在那個(gè)認(rèn)識(shí)上肯定是錯(cuò)的。

這個(gè)突破可能帶來三件事情的發(fā)生,且是不可阻擋的:

第一件事就是必然帶來科技的革命,首先會(huì)帶來人工智能本身的革命。大家知道人工智能發(fā)展到ChatGPT以前,我們不能說它是一門科學(xué),為什么呢?它沒有理論,人工智能為什么理論建立不起來?非常重要的原因是,我們在第一代人工智能做的知識(shí)驅(qū)動(dòng)也好,第二代人工智能做的數(shù)據(jù)驅(qū)動(dòng)也好,我們都是在限定領(lǐng)域中完成單個(gè)任務(wù)。你在單領(lǐng)域單任務(wù)里面不可能建立一個(gè)通用的理論。ChatGPT掃除了這個(gè)障礙,至少在自然語言處理上掃除了這個(gè)障礙,因?yàn)樗I(lǐng)域無關(guān)。一旦跟領(lǐng)域脫鉤了,你才有可能建立起來它的通用理論。

所以,現(xiàn)在去建立人工智能理論是有可能的,在ChatGPT沒出現(xiàn)以前,這種可能性不存在。因此,這個(gè)問題對我們來講是一個(gè)激勵(lì)。什么是突破口呢?突破口就是ChatGPT本身,如果我們沒有把ChatGPT內(nèi)部的工作原理搞清楚,我們就找不到進(jìn)入人工智能理論的鑰匙。

大家想一想ChatGPT里面很多現(xiàn)象,我們說不清楚,比如,一方面它能夠生成一些非常出人意料、非常好的結(jié)果。它同時(shí)又會(huì)出現(xiàn)幻覺,什么是幻覺呢?就是胡說八道。所以,為什么會(huì)出現(xiàn)這個(gè)現(xiàn)象呢?目前還不清楚,所以第一個(gè)必然會(huì)迎來的科技革命,就是AI本身的革命。

第二個(gè)事情,大家討論得非常多,就是產(chǎn)業(yè)的變革。首先是人工智能產(chǎn)業(yè)本身的變革,大家知道人工智能產(chǎn)業(yè)的發(fā)展跟信息技術(shù)與產(chǎn)業(yè)的發(fā)展是非常不一樣的,信息科技與產(chǎn)業(yè)的發(fā)展,我們可以用4個(gè)字來形容——“高速持續(xù)”,但是人工智能科技與產(chǎn)業(yè)的發(fā)展卻是“緩慢曲折”,什么原因呢?一個(gè)最重要的原因就是信息科技從一開始,理論就建立起來了,計(jì)算機(jī)的理論是1936年建立的,通訊理論是1948年建立的,在它的理論指導(dǎo)下,它的技術(shù)和產(chǎn)業(yè)發(fā)展都非常順利。

而人工智能至今只有算法和模型,且這些算法和模型都是領(lǐng)域限定和任務(wù)限定的,所以你開發(fā)出來的人工智能的硬件或軟件全是專用的,跟信息產(chǎn)業(yè)完全不同,信息產(chǎn)業(yè)的所有硬件和軟件通常是通用的,市場非常之大。而人工智能產(chǎn)業(yè)的硬件或軟件通常是專用的,都是跟領(lǐng)域緊密結(jié)合的,人工智能產(chǎn)業(yè)不跟領(lǐng)域結(jié)合根本不可能有這個(gè)產(chǎn)業(yè)。拿計(jì)算機(jī)來講,它的硬件和軟件不需要跟領(lǐng)域結(jié)合,生產(chǎn)出來的計(jì)算機(jī)什么地方都能用。

但是有了ChatGPT之后,人工智能有可能建立一個(gè)跟領(lǐng)域一定程度上無關(guān)的模型和算法,只有這個(gè)算法和模型擺脫了領(lǐng)域的限制,你將來生產(chǎn)出來的硬件和軟件才會(huì)是通用的,或者是一定范圍里通用的,你才有很大的市場。這就是今后人工智能產(chǎn)業(yè)變革的一個(gè)方向。

第三個(gè)事情,人工智能治理。ChatGPT大家看正面得比較多,其實(shí)反面的東西也很多,因?yàn)樗褂玫膶W(xué)習(xí)方法叫“預(yù)測下一個(gè)詞”,這種學(xué)習(xí)范式,必然帶來兩個(gè)大問題:

首先,它的結(jié)果不確定,其次,受提示詞的影響極大,這就造成Chat GPT輸出有三個(gè)不可避免的缺點(diǎn):

第一個(gè)缺點(diǎn),錯(cuò)誤是必然的。所以我們說的那個(gè)胡說八道是必然的。

第二個(gè)缺點(diǎn),它的輸出受輸入的影響很大,受提示詞的影響很大,所以它的輸出多樣化,問同樣的問題改變“提示詞”就會(huì)得到完全不同的結(jié)果。

第三個(gè)缺點(diǎn),它不知道自己錯(cuò)了,錯(cuò)了也改不了,必須依靠AI對齊等等。我問ChatGPT清華大學(xué)校歌的歌詞是什么?它自己編了一套。我說不對,清華大學(xué)校歌不是你說那樣,應(yīng)該是“西山蒼蒼,東海茫茫,...”,我把校歌歌詞輸給它,它馬上回復(fù)說對不起我說錯(cuò)了,清華大學(xué)歌詞應(yīng)該是這個(gè)。我退出來再進(jìn)去,問它清華大學(xué)的校歌是什么?它又自己編了一套,說明它不知道自己錯(cuò)了,告訴了它的錯(cuò)誤它也改不過來。

想一想,這些情況說明ChatGPT的輸出往往不一定符合我們的要求,符合我們的道德、倫理、政治的標(biāo)準(zhǔn)。所以ChatGPT出現(xiàn)以后,人工智能的治理是不可避免的,我認(rèn)為這三個(gè)趨勢一定是這樣的。

我們怎么辦呢?我們主張發(fā)展第三代人工智能,發(fā)展第三代人工智能包含三個(gè)內(nèi)容,一個(gè)內(nèi)容就是要建立可解釋魯棒的人工智能理論。ChatGPT出現(xiàn)以后建立這個(gè)理論才成為可能,過去實(shí)際上是很難建立這個(gè)理論。第二個(gè)內(nèi)容,發(fā)展安全、可信、可控、可靠、可拓展的人工智能技術(shù),只有建立了這個(gè)理論之后,我們才有可能得到一個(gè)安全的人工智能技術(shù)。換句話說,現(xiàn)在的人工智能技術(shù)是不安全的,不可靠的,也是不可信的。特別是利用大數(shù)據(jù)的機(jī)器學(xué)習(xí),結(jié)果一定是這樣的。最后才能推動(dòng)創(chuàng)新應(yīng)用和產(chǎn)業(yè)發(fā)展。我相信通過全國的規(guī)劃與部署,通過產(chǎn)學(xué)研的結(jié)合,這個(gè)目標(biāo)一定會(huì)達(dá)到。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2023-07-17
張鈸:發(fā)展第三代人工智能,推動(dòng)產(chǎn)業(yè)化創(chuàng)新應(yīng)用及產(chǎn)業(yè)發(fā)展
我們怎么辦呢?我們主張發(fā)展第三代人工智能。

長按掃碼 閱讀全文