親,阿里AI已經(jīng)能代替人類做閱讀理解了

1月11日,機(jī)器閱讀理解領(lǐng)域頂級賽事SQuAD (Stanford Question Answering Dataset) 刷新排名,阿里巴巴憑借82.440的精確匹配(Exact Match)分?jǐn)?shù),代表人工智能首次在閱讀理解能力比賽上超越人類。

親,阿里AI已經(jīng)能代替人類做閱讀理解了

什么是機(jī)器閱讀理解?

讓機(jī)器像人類一樣閱讀文本,進(jìn)而根據(jù)對該文本的理解來回答問題,這種閱讀理解就像是讓計(jì)算機(jī)來做我們高考英語的閱讀理解題。機(jī)器閱讀理解是當(dāng)前AI界前沿的一個火熱主題,主要涉及到深度學(xué)習(xí)、自然語言處理和信息檢索。如果哪一天機(jī)器真能具備相當(dāng)高水準(zhǔn)的閱讀理解能力,那么很多應(yīng)用便會體現(xiàn)出真正的人工智能。

比如搜索引擎會在真正理解文章內(nèi)容基礎(chǔ)上去回答用戶的問題,而不是目前這種以關(guān)鍵詞匹配的方式去響應(yīng)用戶,這對于搜索引擎領(lǐng)域帶來的巨變很可能是顛覆性的。

機(jī)器閱讀系統(tǒng)也能幫助醫(yī)生、律師以及其他專家更快地閱讀專業(yè)的醫(yī)學(xué)或判例文檔,從而讓他們有更多的時間對病人進(jìn)行治療或構(gòu)思合法抗辯。

它也能幫助人們更快地發(fā)現(xiàn)隱藏在汽車使用說明書或稅務(wù)條例中的信息,節(jié)約時間。

微軟深度學(xué)習(xí)技術(shù)中心合作研究經(jīng)理高劍鋒說:“世界中有大量信息,尤其是互聯(lián)網(wǎng)中;為了讓信息產(chǎn)生價(jià)值,需要將其轉(zhuǎn)化為知識,而機(jī)器閱讀技術(shù)可以在信息與知識之間搭建一個橋梁。

SQuAD:機(jī)器閱讀理解界的頂級賽事

很長一段時間以來,自然語言處理的研究都是基于句子級別的閱讀理解,但長文本的理解問題一直是研究的一個難點(diǎn),因?yàn)檫@涉及到句子之間的連貫、上下文和推理等更高維的研究內(nèi)容。而大數(shù)據(jù)的發(fā)展讓學(xué)者們看到了這一研究方向的曙光。通過長文本點(diǎn)對點(diǎn)的學(xué)習(xí),即對句子、短語、上下文進(jìn)行建模,這一過程需要運(yùn)用人工智能的推理能力。

斯坦福大學(xué)在2016年通過亞馬遜眾包平臺(AMT)建立的SQuAD 數(shù)據(jù)集是機(jī)器閱讀這一新興領(lǐng)域的核心基準(zhǔn),它包含 10 萬個(問題,原文,答案)三元組,規(guī)模遠(yuǎn)超之前的所有數(shù)據(jù)集:每個問題由人為提出,有且僅有一個維基百科文章的段落與其相關(guān);答案來自該段落的某一片段且答案類型較為豐富;推理出答案的過程具有多樣性且具有適中的難度。

親,阿里AI已經(jīng)能代替人類做閱讀理解了

▲當(dāng)前的公開數(shù)據(jù)集對比

SQuAD文本理解挑戰(zhàn)賽則被斯坦福大學(xué)打造為“機(jī)器閱讀理解界的ImageNet”,吸引了包括谷歌、卡內(nèi)基.梅隆大學(xué)、斯坦福大學(xué)、微軟亞洲研究院、艾倫研究院、IBM、Facebook等知名企業(yè)研究機(jī)構(gòu)和高校的深度參與,共同推進(jìn)機(jī)器閱讀理解的進(jìn)步。

人工智能在閱讀完數(shù)據(jù)集中的一篇短文之后,需要回答若干個基于文章內(nèi)容的問題,然后與標(biāo)準(zhǔn)答案進(jìn)行比對,得出精確匹配(Exact Match)和模糊匹配(F1-score)的結(jié)果,評分結(jié)果將實(shí)時地在SQuAD官網(wǎng)上進(jìn)行更新。

阿里巴巴人工智能機(jī)器閱讀理解打破世界紀(jì)錄

2017年,微軟亞洲研究院的自然語言計(jì)算研究組持續(xù)長居SQuAD榜首,但仍遠(yuǎn)未達(dá)到人類的水平。2018年開年,阿里巴巴 iDST NLP就打破紀(jì)錄,創(chuàng)造了歷史。SQuAD排行榜上,阿里和微軟亞洲研究院、騰訊DPDAC NLP、科大訊飛與哈工大聯(lián)合實(shí)驗(yàn)室、浙江大學(xué)均位于前十,讓世界看到中國團(tuán)隊(duì)的霸榜。

親,阿里AI已經(jīng)能代替人類做閱讀理解了

▲SQuAD排行榜

此次技術(shù)的重大突破源于阿里巴巴研究團(tuán)隊(duì)提出的“基于分層融合注意力機(jī)制”的深度神經(jīng)網(wǎng)絡(luò)模型。該模型能夠模擬人類在做閱讀理解問題時的一些行為,包括結(jié)合篇章內(nèi)容審題,帶著問題反復(fù)閱讀文章,避免閱讀中遺忘而進(jìn)行相關(guān)標(biāo)注等。

阿里巴巴自然語言處理首席科學(xué)家司羅表示,對于解決Wiki類(維基百科類)客觀知識問答,機(jī)器已經(jīng)取得非常好的結(jié)果,未來將繼續(xù)向?qū)νㄓ脙?nèi)容的“能理解會思考”的終極目標(biāo)邁進(jìn)。

目前,這項(xiàng)技術(shù)也已經(jīng)在阿里巴巴內(nèi)部被廣泛使用。比如,每年雙11都會有大量的顧客對活動規(guī)則進(jìn)行咨詢。阿里小蜜團(tuán)隊(duì)通過使用機(jī)器閱讀技術(shù),讓機(jī)器直接對規(guī)則進(jìn)行閱讀,為用戶提供規(guī)則解讀服務(wù),是最自然的交互方式。

親,阿里AI已經(jīng)能代替人類做閱讀理解了

▲阿里小蜜人機(jī)交互流程

未來的方向

機(jī)器閱讀界風(fēng)起云涌,火力全開,人類真的會被超越嗎?

微軟亞洲研究院自然語言處理組首席研究員韋福如表示,即使機(jī)器閱讀團(tuán)隊(duì)的系統(tǒng)可以在SQuAD數(shù)據(jù)集中和人表現(xiàn)的一樣好,并不意味著機(jī)器可以像人一樣真正閱讀和理解,這是未來必須要面臨的一個挑戰(zhàn)。

韋福如說,人類理解文本的能力是多維度的,結(jié)合多任務(wù)(尤其是閱讀理解相關(guān)的任務(wù),例如閱讀理解之后進(jìn)行摘要和問答)的模型非常值得關(guān)注和期待。更進(jìn)一步,雖然SQuAD提供了比較大的人工標(biāo)注數(shù)據(jù)集,如何有效且高效地使用未標(biāo)注的數(shù)據(jù)也是非常值得期待的研究課題和方向。從任務(wù)上看,目前SQuAD的任務(wù)定義中答案是原文的某個子片段,而實(shí)際中人可能讀完文章之后需要進(jìn)行更復(fù)雜的推理、并組織新的文字表達(dá)出來。

“目前我們的算法基本都是抽取型的方式,未來生成型的算法也值得更多的探索和研究。另外,目前機(jī)器閱讀理解關(guān)注的都是理解客觀信息的能力,未來機(jī)器理解文字里面所表達(dá)出來的主觀信息(例如情感)也是非常有趣并值得關(guān)注的方向。”韋福如說道。


關(guān)注【AI商業(yè)報(bào)道】,回復(fù)【2017白皮書】,可獲得干貨《2017人工智能產(chǎn)業(yè)發(fā)展白皮書》!

親,阿里AI已經(jīng)能代替人類做閱讀理解了

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2018-02-08
親,阿里AI已經(jīng)能代替人類做閱讀理解了
1月11日,機(jī)器閱讀理解領(lǐng)域頂級賽事SQuAD刷新排名。阿里巴巴憑借82 440的精確匹配分?jǐn)?shù),代表人工智能首次在閱讀理解能力比賽上超越人類。

長按掃碼 閱讀全文