Alexa的首席科學(xué)家認(rèn)為,舊的計(jì)算基準(zhǔn)與當(dāng)今的AI時(shí)代不再相關(guān)。自艾倫·圖靈(Alan Turing)發(fā)表論文介紹圖靈測(cè)試的概念以回應(yīng)“機(jī)器可以思考嗎?”這一問(wèn)題以來(lái),今年已經(jīng)是70年了。該測(cè)試的目的是確定一臺(tái)機(jī)器是否可以表現(xiàn)出與人類沒(méi)有區(qū)別的對(duì)話行為。Turing預(yù)測(cè),到2000年,在模擬游戲中,從評(píng)估者中隱藏了正在做出響應(yīng)的人(人類或AI),普通人將AI與人類區(qū)分開(kāi)的機(jī)會(huì)不到70%。
作為一個(gè)行業(yè),為什么我們不能在實(shí)現(xiàn)這一目標(biāo)的20年后實(shí)現(xiàn)這一目標(biāo)?我相信Turing提出的目標(biāo)對(duì)于像我這樣的AI科學(xué)家來(lái)說(shuō)并不是一個(gè)有用的目標(biāo)。圖靈測(cè)試充滿局限性,其中一些圖靈本人在開(kāi)創(chuàng)性論文中對(duì)此進(jìn)行了辯論。如今,人工智能已無(wú)處不在地集成到我們的電話,汽車和房屋中,人們?cè)絹?lái)越在乎與計(jì)算機(jī)的交互是有用,無(wú)縫和透明的,并且人們無(wú)法區(qū)分機(jī)器這一概念。因此,是時(shí)候退役已經(jīng)成為過(guò)去七年靈感的絕殺了,并提出了一個(gè)新的挑戰(zhàn),這一挑戰(zhàn)同樣會(huì)激發(fā)研究人員和從業(yè)人員。
圖靈測(cè)試和大眾的想象力
在引入圖靈測(cè)試之后的幾年中,圖靈測(cè)試成為了學(xué)術(shù)界的AI北極星。60年代和70年代最早的聊天機(jī)器人ELIZA和PARRY以通過(guò)測(cè)試為中心。就在2014年,聊天機(jī)器人Eugene Goostman宣稱它通過(guò)了圖靈測(cè)試,并欺騙了33%的判斷是人類。但是,正如其他人指出的那樣,愚弄30%的法官的門(mén)檻是任意的,即使到那時(shí),勝利對(duì)某些人還是過(guò)時(shí)的。
盡管如此,圖靈測(cè)試仍在繼續(xù)引起人們的想象。OpenAI的剖成預(yù)先訓(xùn)練變壓器3(GPT-3)語(yǔ)言模型已經(jīng)掀起頭條了解其潛在擊敗圖靈測(cè)試。同樣,記者,商業(yè)領(lǐng)袖和其他觀察員仍然問(wèn)我:“ Alexa何時(shí)通過(guò)圖靈測(cè)試?” 當(dāng)然,圖靈測(cè)試是衡量Alexa智力的一種方法,但是以這種方式衡量Alexa的智力是否必然且相關(guān)?
為了回答這個(gè)問(wèn)題,讓我們回到圖靈第一次提出論文的時(shí)候。1950年,第一臺(tái)商用計(jì)算機(jī)尚未售出,光纜的基礎(chǔ)工作再也不會(huì)發(fā)布四年了,并且AI領(lǐng)域還沒(méi)有正式建立,那就是1956年。與Apollo 11相比,我們手機(jī)上的計(jì)算能力高出100,000倍,再加上云計(jì)算和高帶寬連接,人工智能現(xiàn)在可以在幾秒鐘內(nèi)根據(jù)大量數(shù)據(jù)做出決策。
盡管Turing的最初愿景繼續(xù)鼓舞人心,但將其測(cè)試解釋為AI進(jìn)步的終極標(biāo)志受到其引入時(shí)代的限制。首先,圖靈測(cè)試幾乎不考慮AI的類似計(jì)算機(jī)的快速計(jì)算和信息查找屬性,這是現(xiàn)代AI最有效的功能。對(duì)欺騙人類的強(qiáng)調(diào)意味著,要使AI通過(guò)圖靈的測(cè)試,它必須在回答“諸如您知道3434756的立方根是什么?”之類的問(wèn)題時(shí)注入停頓?;蛘撸?ldquo;西雅圖到波士頓有多遠(yuǎn)?” 實(shí)際上,AI會(huì)立即知道這些答案,而暫停使其答案聽(tīng)起來(lái)更人性化并不是最佳地運(yùn)用其技能。此外,圖靈測(cè)試沒(méi)有考慮到AI使用傳感器來(lái)聽(tīng),看和感覺(jué)外界的能力日益增強(qiáng)。相反,它僅限于文本。
為了使AI在今天變得更加有用,這些系統(tǒng)需要有效地完成我們的日常任務(wù)。如果您要讓AI助手關(guān)閉車庫(kù)燈,則不需要對(duì)話。相反,您希望它滿足該請(qǐng)求并通過(guò)簡(jiǎn)單的確認(rèn)(“確定”或“完成”)通知您。即使您與AI助手就某個(gè)熱門(mén)話題進(jìn)行了廣泛的對(duì)話,或者向您的孩子朗讀了一個(gè)故事,您仍然想知道它是AI而不是人類。實(shí)際上,假裝為人類來(lái)“欺騙”用戶會(huì)構(gòu)成真正的風(fēng)險(xiǎn)。想象一下反烏托邦的可能性,就像我們已經(jīng)開(kāi)始看到的那樣,機(jī)器人在播撒錯(cuò)誤信息和出現(xiàn)大量假貨。
人工智能面臨的新挑戰(zhàn)
我們的抱負(fù)應(yīng)該不是建立使AI與人類難以區(qū)分的迷戀,而是要建立以公平和包容的方式增強(qiáng)人類智力并改善我們?nèi)粘I畹腁I。一個(gè)有價(jià)值的基本目標(biāo)是使AI展現(xiàn)類似于人類的智力屬性(包括常識(shí),自我監(jiān)督和語(yǔ)言能力),并結(jié)合諸如快速搜索,記憶調(diào)用和代表您完成任務(wù)之類的機(jī)器效率。最終結(jié)果是學(xué)習(xí)和完成各種任務(wù),并適應(yīng)新的情況,這遠(yuǎn)遠(yuǎn)超出了普通人的能力。
該重點(diǎn)為當(dāng)前對(duì)真正重要的AI領(lǐng)域的研究提供了信息-感官理解,交談,廣泛而深入的知識(shí),有效的學(xué)習(xí),決策推理以及消除任何不當(dāng)偏見(jiàn)或偏見(jiàn)(即公平)。這些領(lǐng)域的進(jìn)展可以通過(guò)多種方式衡量。一種方法是將挑戰(zhàn)分解為組成任務(wù)。例如,Kaggle的“抽象與推理挑戰(zhàn)”專注于解決AI以前從未見(jiàn)過(guò)的推理任務(wù)。另一種方法是為人機(jī)交互設(shè)計(jì)大規(guī)模的現(xiàn)實(shí)世界挑戰(zhàn),例如Alexa Prize Socialbot Grand Challenge,這是一項(xiàng)針對(duì)大學(xué)生對(duì)話式AI的競(jìng)賽。
實(shí)際上,當(dāng)我們?cè)?016年啟動(dòng)Alexa獎(jiǎng)時(shí),我們就如何評(píng)估競(jìng)爭(zhēng)性“社交機(jī)器人”進(jìn)行了激烈的辯論。我們是否在試圖說(shuō)服人們,這個(gè)社交機(jī)器人是人,所以部署了圖靈測(cè)試的一個(gè)版本?或者,我們是否在努力使AI值得自然交流,以促進(jìn)學(xué)習(xí),提供娛樂(lè)或只是分散注意力呢?
我們發(fā)現(xiàn)了一個(gè)要求社交機(jī)器人與人類進(jìn)行20分鐘的連貫對(duì)話的主題,涉及娛樂(lè),體育,政治和技術(shù)等廣泛的熱門(mén)話題。在進(jìn)入決賽之前的開(kāi)發(fā)階段,客戶會(huì)根據(jù)是否希望再次與機(jī)器人對(duì)話對(duì)機(jī)器人進(jìn)行評(píng)分。在決賽中,獨(dú)立的人類裁判會(huì)評(píng)估連貫性和自然性,并以5分制評(píng)分。如果有任何社交機(jī)器人在平均20分鐘的時(shí)間內(nèi)進(jìn)行交流并且得分達(dá)到4.0或更高,那么它將滿足挑戰(zhàn)。盡管尚未解決嚴(yán)峻的挑戰(zhàn),但這種方法正在指導(dǎo)AI開(kāi)發(fā),該開(kāi)發(fā)具有基于深度學(xué)習(xí)的神經(jīng)方法所具有的類似于人的對(duì)話能力。
像Alexa這樣的AI在我們的日常生活中被廣泛采用,這是衡量AI進(jìn)步的另一個(gè)難得的機(jī)會(huì)。盡管這些AI服務(wù)依賴于類人的會(huì)話技能來(lái)完成簡(jiǎn)單的交易(例如設(shè)置警報(bào))和復(fù)雜的任務(wù)(例如計(jì)劃一個(gè)周末),但要最大限度地發(fā)揮效用,它們會(huì)從會(huì)話式AI轉(zhuǎn)變?yōu)?ldquo;環(huán)境式AI”在需要時(shí)回答您的請(qǐng)求,預(yù)測(cè)您的需求,在不需要時(shí)淡入背景。例如,Alexa可以檢測(cè)到玻璃破碎的聲音,并提醒您采取措施。如果您在睡覺(jué)時(shí)設(shè)置了鬧鐘,則建議您關(guān)閉樓下已連接的連接燈。此類AI的另一個(gè)方面是,它們需要成為大量不斷增加的任務(wù)的專家,這只有在具有更廣泛的學(xué)習(xí)能力而非特定于任務(wù)的智能的情況下才有可能。因此,在接下來(lái)的十年及以后的時(shí)間里,AI服務(wù)的實(shí)用性以及在環(huán)境設(shè)備上的對(duì)話和主動(dòng)幫助功能是一項(xiàng)值得測(cè)試的測(cè)試。
這些都不是to毀圖靈的最初愿景的-圖靈的“模仿游戲”被設(shè)計(jì)為一種思想實(shí)驗(yàn),而不是作為有用AI的最終測(cè)試。但是,現(xiàn)在是時(shí)候消除圖靈測(cè)試,并從艾倫·圖靈的大膽愿景中獲得啟發(fā),以加快構(gòu)建旨在幫助人類的AI的進(jìn)展。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )