希爾伯特旅館里,住著AI的某種真相

“無窮”和“無窮+1”,哪個更大?

已經(jīng)吸收了不知道多少數(shù)據(jù)的AI模型,和比他多學(xué)習(xí)一條數(shù)據(jù)的模型,哪個更智能?

想聊聊這個問題,出于一個偶然的機(jī)會。很早之前我在測試ChatGPT的時候,突然想問他個刁鉆問題,于是就問它:“希爾伯特旅館悖論,對現(xiàn)實世界有什么影響?”

說實話,ChatGPT答的驢唇不對馬嘴,還硬拗出幾點,有他一貫的特色。但其中一段回答值得琢磨。他答:“希爾伯特旅館對于計算機(jī)科學(xué)是有幫助的,因為當(dāng)我們處理無限大的數(shù)據(jù)集時,希爾伯特旅館可以作為我們思考方式?!?/p>

無限大的數(shù)據(jù)集,這東西顯然不存在。但當(dāng)大模型訓(xùn)練用的數(shù)據(jù)參數(shù)達(dá)到某種天文數(shù)字,當(dāng)真人反饋機(jī)制成為常態(tài),模型在使用過程中會接觸難以估量的數(shù)據(jù)。這難道不是某種無限嗎?

但人類能控制無限嗎?

今天這個話題,其實更接近某種科幻討論,或者一些關(guān)于AI未來的腦洞??赡艽蠹易x完之后也不清楚在說什么。但也無妨,我們就當(dāng)一起舒展一下大腦,放松一下最近被ChatGPT弄得挺焦躁的心情。

一起去希爾伯特旅館,度個假吧。

歡迎來到,悖論旅館

這家旅館坐落在名叫“數(shù)學(xué)”的熱帶風(fēng)情度假勝地,有的人來了不想走,有的人一想到它就口干舌燥。

希爾伯特旅館,其實是德國數(shù)學(xué)家大衛(wèi)·希爾伯特在討論無窮這個概念時,舉的一個生動例子。它既是一個數(shù)學(xué)游戲,也經(jīng)常躋身知名的若干悖論之一。

它的具體意思是說,假設(shè)一家旅館有無窮個房間,但是都住滿了。這時候又來了一位旅客要訂房間,酒店主人就可以不慌不忙,讓1號房間客人移到2號,2好移3號……以此類推,反正房間數(shù)量是無窮的,這樣新的旅客就可以住1號房間。

而這時,又來了一車旅客。酒店主人依舊如法炮制,讓每個房間的客人都向后移動N個房間,最終把新來的客人安置進(jìn)去。

以此類推,接下來會發(fā)生什么呢?假如新來了無窮個客人。那么酒店老板只需要讓每位客人都移到單號房間。比如2號房間移到3號房間,3號房間移到5號房間,把偶數(shù)房間都空出來,那么無窮個客人依舊可以住進(jìn)去。

即使來了無窮多個旅行團(tuán),每個旅行團(tuán)有無窮多位旅客,希爾伯特酒店依舊有辦法,只需要把非2n(n∈N+)號房間就都空出來就行了。

希爾伯特旅館之所以是個悖論,因為它標(biāo)明了這樣一件事:無窮是無法比較的。

無窮+1等于無窮;無窮+N等于無窮,無窮加無窮,無窮乘無窮,那還是無窮,無窮是紋絲不動的,又是隨時變化的,無窮是可以包含若干個無窮的。

總之,無窮是難以名狀的。

無窮這玩意,會有點怪

聽上去,希爾伯特旅館悖論好像沒啥用。其實不然,人類在很多領(lǐng)域幾乎都必然面對“無窮”這個問題,至少在理論推導(dǎo)和概念驗證環(huán)節(jié),面對無窮幾乎是必然的。一個事物可以比另一個更無窮,但它們倆都還是無窮。這樣的思路可以進(jìn)行很多假設(shè),也可以解釋很多問題。

比如說,在物理學(xué)當(dāng)中,希爾伯特旅館悖論可以來解釋量子物理學(xué)中的很多現(xiàn)象,其中最典型的就是量子場論中關(guān)于虛粒子的假設(shè)。關(guān)于虛粒子是否真實存在,抑或是一種純粹的假設(shè)工具,這個問題有著非常多的爭論,但它確實可以用來解釋引力、光子、膠子等物理定義,進(jìn)而為解釋真空中的能量情況,分析宇宙輻射做出幫助。前提在于,我們需要用希爾伯特旅館的思維,來理解存在于無窮中的虛粒子。

在計算機(jī)科學(xué)中,數(shù)據(jù)存儲是個基本問題,而在設(shè)計數(shù)據(jù)結(jié)構(gòu)的時候,就需要考慮如果有海量數(shù)據(jù)需要存儲,結(jié)構(gòu)上究竟如何調(diào)動能夠保證效率最優(yōu),故障率最低。這時就需要假定數(shù)據(jù)集是無窮的,希爾伯特旅館也就用上了。

無窮很怪,這個概念還經(jīng)常被用在文學(xué)創(chuàng)作,尤其是科幻小說當(dāng)中??苹檬菍ξ磥淼耐蒲荩绻臣驴梢栽鲩L到無窮,它往往會出現(xiàn)反常識的狀態(tài)。比如說永生不死的人,它可能首先就會失去對時間的概念,因為無窮的時間已經(jīng)沒有意義了,進(jìn)而表現(xiàn)出完全失去人類的一切特征,畢竟人類的所思所為,都是在時間有限這個前提下驅(qū)動的。又比如瞬間移動,它會不會讓空間失去意義,進(jìn)而讓人失去辨別空間的需求和能力,進(jìn)而出現(xiàn)從來不想停留下來的人,而始終都在超高速移動的人,究竟還是人嗎?

一件事如果逼近甚至抵達(dá)無窮,它就會超出控制,出現(xiàn)反常識,反邏輯的一面。這個邏輯,對于AI似乎也適用。

用這個邏輯,解釋智能涌現(xiàn)

這幾年伴隨著預(yù)訓(xùn)練大模型的興起,越來越多的人開始談“智能涌現(xiàn)”。一般來說,所謂“智能涌現(xiàn)”現(xiàn)象,是指當(dāng)模型規(guī)模突破某個未知的界限后,就會突然涌現(xiàn)出驚人的智能。比如模型會表達(dá)出訓(xùn)練者預(yù)想不到的邏輯感、流暢性,甚至是人類稱之為情商的東西。

事實上,智能涌現(xiàn)作為一個目標(biāo),并不是今天才有。早在上世紀(jì)70年代,專家機(jī)器人的理論構(gòu)想就是在輸入足夠多的知識后,讓計算機(jī)展現(xiàn)出一種無所不知,無所不曉的效果,從而幫助人類解決各種問題。只是礙于當(dāng)時的算力與數(shù)據(jù)承載能力,最終這個設(shè)想無法落地。

而在今天云計算+大數(shù)據(jù)的組合下,更大規(guī)模的數(shù)據(jù)集可以應(yīng)用到AI訓(xùn)練中,加上深度學(xué)習(xí)在算法上實現(xiàn)了更好的數(shù)據(jù)吸納能力,才最終產(chǎn)出了ChatGPT為代表的智能涌現(xiàn)現(xiàn)象。

智能涌現(xiàn)到底是怎么實現(xiàn)的,這一點就像深度學(xué)習(xí)的黑箱性一樣,始終沒有特別合理的解釋。但“智能涌現(xiàn)”這個詞卻不是AI專有的,這個詞更早是一個生物學(xué)詞匯,是用來描述螞蟻、魚群表現(xiàn)出的集體智能行為。一只螞蟻挺傻的,一條魚也不聰明,但當(dāng)大量螞蟻聚集到一起,所表現(xiàn)出的那種分工明確、體系森嚴(yán)、結(jié)構(gòu)精巧的組織行動方式,簡直讓人嘆為觀止。是螞蟻的大腦進(jìn)化了嗎?恐怕并不是,而是在螞蟻聚集到一定規(guī)模后,突破了某種希爾伯特旅館式的智能邊界。

從這個角度看,大模型這條AI之路,或許終極目標(biāo)并不是模仿人類。它不需要進(jìn)化出直覺、情感、自由意識這些人類獨(dú)有的東西。但它會積累無窮多的數(shù)據(jù)和知識,當(dāng)我們無法觀測和預(yù)估大模型里擁有多少知識,那么它就有無窮的知識。AI模型就變成了一座類希爾伯特旅館,它可以吞噬更多知識,吞噬更多無窮,最終可以表現(xiàn)出人類想要的智能,也可能表現(xiàn)出更多人類不想要,或者沒準(zhǔn)備好想要的東西。

或許我們改換個思路,最終的通用人工智能AGI、強(qiáng)人工智能Strong AI,可能內(nèi)在機(jī)制并不類似于人類,而是更近乎螞蟻,近乎魚群,近乎希爾伯特旅館。

我們總是討論AI像不像人,能不能做人類所做的,人類有哪些獨(dú)有能力,巴拉巴拉巴拉。這是因為我們不住在希爾伯特旅館里,我們住在一個有限的世界,住在短暫的生命和易朽的軀殼里,住在一個絕大部分構(gòu)成物是水的大腦里。但AI不是,它相比人類更加貼近無窮。他能通過圖靈測試,他最終能做到一切。但我們并不知道為什么,因為AI并不想成為人,他只是剛好住在希爾伯特旅館里。

“智能涌現(xiàn)”或許是個征兆,它告訴我們,AI的進(jìn)化目標(biāo)不是人類,而是《星際爭霸》里的蟲族。

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2023-05-28
希爾伯特旅館里,住著AI的某種真相
“無窮”和“無窮+1”,哪個更大? 已經(jīng)吸收了不知道多少數(shù)據(jù)的AI模型,和比他多學(xué)習(xí)一條數(shù)據(jù)的模型,哪個更智能? 想聊聊這個問題,出于...

長按掃碼 閱讀全文