正在考慮入手的新家附近有多少公園?餐館里最佳的晚餐-酒搭配是什么?這些日常問(wèn)題都需要關(guān)系推理——一種更高級(jí)思考的重要成分,而這卻是人工智能(AI)難以掌握的?,F(xiàn)在,谷歌DeepMind的研究者提出了一種處理這種推理的簡(jiǎn)單方法,并在復(fù)雜圖像理解測(cè)試中擊敗了人類。
人類通常很擅長(zhǎng)關(guān)系推理,利用邏輯連接和比較位置、順序和其他實(shí)體。但兩種主要AI——統(tǒng)計(jì)和符號(hào),在發(fā)展類似的能力方面一直進(jìn)展緩慢。統(tǒng)計(jì)AI,或者叫機(jī)器學(xué)習(xí),善于模式識(shí)別,但不善于使用邏輯。而符號(hào)AI則能利用預(yù)定規(guī)則推理關(guān)系,但不善于學(xué)習(xí)。
credit: 煎蛋畫師六翼
新研究提出了一種縮小差距的方式:進(jìn)行關(guān)系推理的人工神經(jīng)網(wǎng)絡(luò)。類似于大腦中神經(jīng)元的連接方式,神經(jīng)網(wǎng)絡(luò)利用小型程序合作發(fā)現(xiàn)數(shù)據(jù)中的模式,針對(duì)圖像處理、語(yǔ)法分析或者游戲?qū)W習(xí)有特定的架構(gòu)。在這種應(yīng)用中,新的“關(guān)系網(wǎng)絡(luò)”單獨(dú)比較場(chǎng)景中的每一對(duì)目標(biāo)。論文共同作者、在倫敦的DeepMind計(jì)算科學(xué)家Timothy Lillicrap說(shuō)道:“我們明確要求網(wǎng)絡(luò)發(fā)現(xiàn)目標(biāo)之間存在的關(guān)聯(lián)?!?/p>
他和他的團(tuán)隊(duì)利用幾個(gè)任務(wù)測(cè)試了關(guān)系網(wǎng)絡(luò)。第一個(gè)是回答單幅圖像內(nèi)物體之間的關(guān)系,比如立方、球形和圓柱的圖形。例如:“在這個(gè)藍(lán)色的東西前面有個(gè)物體,它的形狀和那個(gè)灰色金屬球右邊的小型青色物體的形狀一樣嗎?”針對(duì)這個(gè)任務(wù),關(guān)系網(wǎng)絡(luò)與其他兩種神經(jīng)網(wǎng)絡(luò)相結(jié)合了:一個(gè)識(shí)別圖像中的物體,另一個(gè)翻譯這個(gè)問(wèn)題。研究者在上周發(fā)表在預(yù)覽商arXiv的論文中稱,通過(guò)進(jìn)行眾多圖像和問(wèn)題測(cè)試,發(fā)現(xiàn)其他機(jī)器學(xué)習(xí)方法的正確率大概是42%到77%,人類的正確率則是可敬的92%。而新的關(guān)系網(wǎng)絡(luò)正確率是96%,真是一個(gè)超越人類的成績(jī)。
DeepMind團(tuán)隊(duì)還利用一個(gè)語(yǔ)言任務(wù)進(jìn)行了測(cè)試。這個(gè)任務(wù)中網(wǎng)絡(luò)將接收到一些陳述,比如“Sandra撿起了那個(gè)足球”和“Sandra去辦公室了”。隨后就會(huì)提出一些問(wèn)題比如:“球在哪里?”(辦公室)。該網(wǎng)絡(luò)在這些問(wèn)題上的表現(xiàn)和其他類型問(wèn)題上的一樣好,但最大放異彩的是所謂的推理問(wèn)題:“Lily是一只天鵝。Lily是白色的。Greg是一只天鵝。Greg是什么顏色?”在這些問(wèn)題上,關(guān)系網(wǎng)絡(luò)正確率為98%,而其競(jìng)爭(zhēng)者的正確率約為45%。最后,該方法分析了10個(gè)到處亂蹦的球體的動(dòng)畫,其中某些球體之間被不可見的彈簧或者棍子連接到一起。單單使用運(yùn)動(dòng)模式,該網(wǎng)絡(luò)就能鑒定出90%多的連接。然后使用相同的訓(xùn)練去鑒定僅利用移動(dòng)點(diǎn)表示的人類形態(tài)。
波士頓大學(xué)計(jì)算科學(xué)家Kate Saenko并未參與該新網(wǎng)絡(luò)的設(shè)計(jì),但最近也合作提出了一種回答關(guān)于圖像的復(fù)雜問(wèn)題的方法。他說(shuō)道:“他們方法的一個(gè)優(yōu)點(diǎn)是概念上十分簡(jiǎn)單。” Lillicrap稱其中大部分進(jìn)步都可以用一個(gè)簡(jiǎn)單的方程來(lái)表示,這種簡(jiǎn)單性使其容易與其他網(wǎng)絡(luò)相結(jié)合,正如在上述物體比較任務(wù)中那樣。論文將其稱為“一個(gè)即插即用的模塊”,能使系統(tǒng)的其他部分專注于它們擅長(zhǎng)的方面。
加利福尼亞帕洛阿爾托的斯坦福大學(xué)計(jì)算機(jī)科學(xué)家Justin Johnson合作設(shè)計(jì)了上述物體比較任務(wù),并且合作提出了一種在該任務(wù)上表現(xiàn)良好的方法,他說(shuō)道:“我深深為此成果而折服。” Saenko補(bǔ)充道,關(guān)系網(wǎng)絡(luò)未來(lái)可以幫助研究社交網(wǎng)絡(luò),分析監(jiān)視視頻,或者導(dǎo)引交通流中的汽車。
Johnson說(shuō)道,為了接近類人靈活性,該網(wǎng)絡(luò)還需要學(xué)會(huì)回答更多挑戰(zhàn)性的問(wèn)題。做到這一點(diǎn)可能需要不僅僅比較一對(duì)事物,而是三個(gè),四個(gè)或者更大集合中的某些對(duì)。他說(shuō)道:“我對(duì)研究能自己提出新策略的模型很感興趣。DeepMind正在建立特殊類型推理的模型,而不是追求更一般化的關(guān)系推理。但這仍然是正確方向上的重要一步。”
論文原文:arXiv:1706.01427
本文譯自 sciencemag,由譯者 CliffBao 基于創(chuàng)作共用協(xié)議(BY-NC)發(fā)布。Matthew Hutson
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )