▲2016年在西班牙進(jìn)行質(zhì)量控制的伏尼契手稿的臨摹。圖片來源:GettyImages
如果你正在編制一份世界上最奇怪的100件物品的清單(人類幾千年文明以來最怪異的東西),那么你就得為伏尼契手稿留出空間了。它有600年的歷史,用一種沒人能讀懂的語言寫成。這是一個(gè)真正的世界級的秘密。這大概就是為什么本周世界各地的新聞編輯室都爭先報(bào)道“人工智能破譯伏尼契手稿”的故事,他們抓住了這個(gè)機(jī)會(huì)。
當(dāng)然,人工智能并沒有破譯。根據(jù)專家的說法,伏尼契手稿保持著一如既往的神秘莫測。但是,弄清楚為什么人工智能不能“解碼”這篇手稿,以及它究竟在什么程度上增加了伏尼契時(shí)代的歷史,倒是有自身的價(jià)值。它還強(qiáng)調(diào)(如果需要進(jìn)一步強(qiáng)調(diào)的話),這份手稿是一個(gè)極其古怪的東西。
引發(fā)這些報(bào)道的研究是一篇名為“解碼用未知語言和文字寫的回文構(gòu)詞法文本(Decoding Anagrammed Texts Written in an UnknownLanguage and Script)”的論文。它是在2016年出版的,但它是在去年的一次會(huì)議上被提及的,在本月早些時(shí)候被一些記者發(fā)現(xiàn)。在這篇文章中,計(jì)算機(jī)科學(xué)教授Greg Kondrak和研究生Bradley Hauer描述了一種找到密碼文本源語言的方法,然后將該方法轉(zhuǎn)化為手稿本身,并認(rèn)為它最初是用希伯來語寫成的,然后在縮寫為現(xiàn)在的形式。
這是一種說法,如果屬實(shí),那就真的是揭開世界未解之謎的神秘面紗了。這篇240頁的伏尼契手稿是用一種未知的字母寫成的,這是從未見過的。這個(gè)手稿由大約25到30個(gè)不同的人物組成(解釋不同),全文從左到右,用一種優(yōu)雅的方式書寫。這本書共有130多幅精美的奇異植物插圖,都是無法辨認(rèn)的植物,還有一些占星圖、城堡和龍的涂鴉,還有一個(gè)特別奇怪的部分,那就是裸體女人沐浴在由流動(dòng)管道連接的水池中。它看起來像一個(gè)古代水上公園的地圖,但學(xué)者們認(rèn)為它可能有醫(yī)學(xué)或煉金術(shù)方面的意圖。
▲在所謂的“balneological”一節(jié)的眾多插圖中,有一幅描繪了許多裸體女人沐浴在一種未知的液體中。圖片來源:creative common
大多數(shù)人認(rèn)為手稿是用替代密碼寫成的。這是最簡單也是最古老的一種編碼方式,在這類代碼中,字母表中的字母被替換為虛構(gòu)的字母。問題是,幾百年來的研究一直無法找出伏尼契手稿最初是用哪一種語言書寫的。
“從來沒有人對(伏尼契手稿屬于)任何一種特定的語言提出過令人信服的理由,我看到了一些建議,比如阿拉伯語、阿茲特克語、羅馬語、拉丁語、意大利語。美國中世紀(jì)學(xué)院的執(zhí)行理事、專于伏尼契的Lisa Fagin Davis說。Davis認(rèn)為人們傾向于研究“古地理、法醫(yī)和藝術(shù)相關(guān)的證據(jù)”,來找到來源于那一個(gè)國家,使用哪一種源語言,但她補(bǔ)充說人們也使用了計(jì)算分析。
計(jì)算分析是Kondrak和Hauer試圖解構(gòu)手稿的工具。他們認(rèn)為,就像之前的許多密碼學(xué)家一樣,通過計(jì)算文本的某些特性 -- 比如,每封信的頻率和字母組合的出現(xiàn)頻率 -- 他們可以創(chuàng)造出一種統(tǒng)計(jì)指紋,可以與其他語言進(jìn)行比較。
每一種語言都可以基于這樣的統(tǒng)計(jì)數(shù)字“指紋”
因此,他們訓(xùn)練了大量的算法來挑選這些指標(biāo),并將《世界人權(quán)宣言》(使用了多達(dá)380種語言)作為他們的樣本。盡管有些報(bào)道指出,這一過程并不涉及神經(jīng)網(wǎng)絡(luò)或深度學(xué)習(xí),僅僅是老式的統(tǒng)計(jì)分析,即大量的計(jì)數(shù)和百分比。但它成功了!根據(jù)伊利諾斯理工學(xué)院的計(jì)算語言學(xué)家Shlomo Argamon教授的說法,初步的測試結(jié)果“也許有點(diǎn)值得懷疑,但比在科學(xué)文獻(xiàn)中經(jīng)常發(fā)表的許多其他結(jié)果更好一些?!币虼?,憑借他們的算法模式對應(yīng)的訓(xùn)練和測試,Kondrak和Hauer轉(zhuǎn)向了伏尼契手稿。專家們說,這有很多漏洞。
問題并不是任何一個(gè)單一的錯(cuò)誤,而是一系列的假設(shè)和遺漏,使Kondrak和Hauer在解釋他們的結(jié)果時(shí)更落后了一些。
第一個(gè)很簡單:他們的算法接受了現(xiàn)代語言的訓(xùn)練,但手稿的碳含量可追溯至15世紀(jì)。所以,如果它最初是用希伯來語寫成的,它應(yīng)該是用15世紀(jì)的希伯來語寫成的。“語法、拼寫和詞匯會(huì)有很大的不同,特別是對于像伏尼契手稿(與圣經(jīng)或禮拜儀式不同)這樣的科學(xué)的手稿。”Davis說。
第二,盡管Kondrak和Hauer的算法可以為密碼文本的源語言提出建議,但它不能評估這些匹配的可能性。所以當(dāng)他們說希伯來語是手稿中得分最高的,而沒有對可能性進(jìn)行評級時(shí),這是一種毫無意義的吹噓。“總得有人得到最高的分?jǐn)?shù),他們提到了其他一些排名很高的語言。我記得,一個(gè)是馬來語,這是一種非常不同于希伯來語的語言?!?Argamon說。
第三個(gè)假設(shè)可能是問題最大的:Kondrak和Hauer聲稱,除了作為替代密碼,伏尼契手稿也存在字母顛倒的寫法,所以每個(gè)單詞的字母都是亂寫的。這并不是伏尼契學(xué)的一個(gè)新建議,但它遠(yuǎn)非一個(gè)既定事實(shí)。它也完美地建立了Kondrak和Hauer的研究的最終“成功”:將伏尼契手稿的開頭句翻譯成英語。
▲一頁的伏尼契臨摹,手稿中許多植物插圖。圖片來源:Getty Images
這句話的意思是:“她向神父、眾議院的人、我和人民提出了建議。Kondrak說:“一份手稿最開始的一句話是一種奇怪的句子,但它確實(shí)是有意義的?!钡词故窃谡撐闹?,他和Hauer也描述了他們是如何編造翻譯來產(chǎn)生這個(gè)結(jié)果的。他們的第一次嘗試“不太連貫”,一位現(xiàn)代希伯來語的發(fā)言人說,他們必須在把這些字符輸入谷歌翻譯之前做出“幾個(gè)拼寫糾正”來產(chǎn)生上述結(jié)果。(“任何時(shí)候你不得不求助于谷歌,而不是那些真正研究過這種語言的人,所以你會(huì)失去一些可信度,” Fagin說。)
但是,用字謎寫出的手稿變得更加重要。Argamon指出,希伯來語是一種“abjad”,意思是沒有元音的腳本。如果你假設(shè)手稿是用希伯來語寫成的,并且手稿是用字謎寫的,那么它就會(huì)變得更容易“翻譯”。你不僅可以重新排列單詞中的所有字符,以找到有意義的東西,還可以添加自己的元音。這意味著“大量隨機(jī)的字母組合形成了連貫的單詞,”Argamon說。再加上Kondrak和Hauer做了拼寫糾正,并依賴谷歌翻譯(這是一款看起來對內(nèi)容沒有什么意義的軟件,它經(jīng)常會(huì)把胡言亂語變成連貫的句子),你就能明白為什么專家們對此持懷疑態(tài)度了。
Argamon說?!瓣P(guān)鍵是他們的方法…給他們很大的自由度來做這種印象派的解釋,”Nick Pelling,一個(gè)在這個(gè)問題上寫過大量文章的伏尼契專家,更加直接的表示“他們把這個(gè)被解碼的句子,用厚厚的眼鏡斜視著,然后告訴我們這對我們來說已經(jīng)夠好了?!碑?dāng)The Verge問到他認(rèn)為論文的結(jié)論正確可能性時(shí),他說:“基本上接近于0%”
那么,“人工智能可以解碼神秘的600年前的手稿”?并非如此。
對于Kondrak和Hauer這件事上(這些故事經(jīng)常是這樣的),媒體當(dāng)然應(yīng)該為這種夸張的行為承擔(dān)大量的責(zé)任。Kondrak和Hauer承認(rèn)他們的研究只是一個(gè)“起點(diǎn)”,我們采訪的專家們也承認(rèn)可以認(rèn)識到他們潛在算法的效用。專家們只是說,有太多錯(cuò)漏的步驟,以至于不能對手稿本身提出結(jié)論。
在很多方面,用“人工智能”來破解伏尼契手稿的嘗試是有意義的。The New Yorker的一篇關(guān)于手稿歷史的文章將其描述為“一幅完美的畫布,用來表達(dá)我們對困難、恐懼和神秘的擔(dān)憂”,同樣這也可以用來形容人工智能。在當(dāng)代的媒體環(huán)境中,這些多樣化和復(fù)雜的技術(shù)團(tuán)隊(duì)經(jīng)常被用來作為對自動(dòng)化和無法控制的機(jī)器智能的恐懼的代替者。AI解碼伏尼契手稿就像是觀看哥斯拉與摩特拉的戰(zhàn)斗:這一場面太有趣了,我們根本不關(guān)心,也不在乎細(xì)節(jié)。
盡管如此,對于專家來說,手稿仍然無法被解析的事實(shí)可能是一種解脫。畢竟,如果你花了數(shù)年的時(shí)間試圖破解一份神秘的文件,而某個(gè)不流血的機(jī)器在一夜之間就能破解它,那將對你是一種打擊。
正如Pelling在最后一封電子郵件中所說:“通過我的書…和我的博客,我可能寫比任何一個(gè)在世人更多關(guān)于伏尼契的實(shí)際歷史研究:我為此做了演講,在廣播和電視紀(jì)錄片中做過很多次采訪…但懂我仍然不能讀它。:-)”
神秘還在繼續(xù),未解之謎仍未解開。
微信搜索【AI商業(yè)報(bào)道】,獲取最新行業(yè)資訊!
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個(gè)大計(jì)劃瞄準(zhǔn)AI機(jī)器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費(fèi)引熱議
- 消息稱塔塔集團(tuán)將收購和碩印度iPhone代工廠60%股份 并接管日常運(yùn)營
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達(dá)新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關(guān)注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號發(fā)布,意外泄露引發(fā)關(guān)注
- 無人機(jī)“黑科技”亮相航展:全球首臺(tái)低空重力測量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機(jī)器人合作
- 賽力斯觸及漲停,汽車整車股盤初強(qiáng)勢拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。