1月11日,機(jī)器閱讀理解領(lǐng)域頂級賽事SQuAD (Stanford Question Answering Dataset) 刷新排名,阿里巴巴憑借82.440的精確匹配(Exact Match)分?jǐn)?shù),代表人工智能首次在閱讀理解能力比賽上超越人類。
什么是機(jī)器閱讀理解?
讓機(jī)器像人類一樣閱讀文本,進(jìn)而根據(jù)對該文本的理解來回答問題,這種閱讀理解就像是讓計(jì)算機(jī)來做我們高考英語的閱讀理解題。機(jī)器閱讀理解是當(dāng)前AI界前沿的一個火熱主題,主要涉及到深度學(xué)習(xí)、自然語言處理和信息檢索。如果哪一天機(jī)器真能具備相當(dāng)高水準(zhǔn)的閱讀理解能力,那么很多應(yīng)用便會體現(xiàn)出真正的人工智能。
比如搜索引擎會在真正理解文章內(nèi)容基礎(chǔ)上去回答用戶的問題,而不是目前這種以關(guān)鍵詞匹配的方式去響應(yīng)用戶,這對于搜索引擎領(lǐng)域帶來的巨變很可能是顛覆性的。
機(jī)器閱讀系統(tǒng)也能幫助醫(yī)生、律師以及其他專家更快地閱讀專業(yè)的醫(yī)學(xué)或判例文檔,從而讓他們有更多的時間對病人進(jìn)行治療或構(gòu)思合法抗辯。
它也能幫助人們更快地發(fā)現(xiàn)隱藏在汽車使用說明書或稅務(wù)條例中的信息,節(jié)約時間。
微軟深度學(xué)習(xí)技術(shù)中心合作研究經(jīng)理高劍鋒說:“世界中有大量信息,尤其是互聯(lián)網(wǎng)中;為了讓信息產(chǎn)生價(jià)值,需要將其轉(zhuǎn)化為知識,而機(jī)器閱讀技術(shù)可以在信息與知識之間搭建一個橋梁。”
SQuAD:機(jī)器閱讀理解界的頂級賽事
很長一段時間以來,自然語言處理的研究都是基于句子級別的閱讀理解,但長文本的理解問題一直是研究的一個難點(diǎn),因?yàn)檫@涉及到句子之間的連貫、上下文和推理等更高維的研究內(nèi)容。而大數(shù)據(jù)的發(fā)展讓學(xué)者們看到了這一研究方向的曙光。通過長文本點(diǎn)對點(diǎn)的學(xué)習(xí),即對句子、短語、上下文進(jìn)行建模,這一過程需要運(yùn)用人工智能的推理能力。
斯坦福大學(xué)在2016年通過亞馬遜眾包平臺(AMT)建立的SQuAD 數(shù)據(jù)集是機(jī)器閱讀這一新興領(lǐng)域的核心基準(zhǔn),它包含 10 萬個(問題,原文,答案)三元組,規(guī)模遠(yuǎn)超之前的所有數(shù)據(jù)集:每個問題由人為提出,有且僅有一個維基百科文章的段落與其相關(guān);答案來自該段落的某一片段且答案類型較為豐富;推理出答案的過程具有多樣性且具有適中的難度。
SQuAD文本理解挑戰(zhàn)賽則被斯坦福大學(xué)打造為“機(jī)器閱讀理解界的ImageNet”,吸引了包括谷歌、卡內(nèi)基.梅隆大學(xué)、斯坦福大學(xué)、微軟亞洲研究院、艾倫研究院、IBM、Facebook等知名企業(yè)研究機(jī)構(gòu)和高校的深度參與,共同推進(jìn)機(jī)器閱讀理解的進(jìn)步。
人工智能在閱讀完數(shù)據(jù)集中的一篇短文之后,需要回答若干個基于文章內(nèi)容的問題,然后與標(biāo)準(zhǔn)答案進(jìn)行比對,得出精確匹配(Exact Match)和模糊匹配(F1-score)的結(jié)果,評分結(jié)果將實(shí)時地在SQuAD官網(wǎng)上進(jìn)行更新。
阿里巴巴人工智能機(jī)器閱讀理解打破世界紀(jì)錄
2017年,微軟亞洲研究院的自然語言計(jì)算研究組持續(xù)長居SQuAD榜首,但仍遠(yuǎn)未達(dá)到人類的水平。2018年開年,阿里巴巴 iDST NLP就打破紀(jì)錄,創(chuàng)造了歷史。SQuAD排行榜上,阿里和微軟亞洲研究院、騰訊DPDAC NLP、科大訊飛與哈工大聯(lián)合實(shí)驗(yàn)室、浙江大學(xué)均位于前十,讓世界看到中國團(tuán)隊(duì)的霸榜。
此次技術(shù)的重大突破源于阿里巴巴研究團(tuán)隊(duì)提出的“基于分層融合注意力機(jī)制”的深度神經(jīng)網(wǎng)絡(luò)模型。該模型能夠模擬人類在做閱讀理解問題時的一些行為,包括結(jié)合篇章內(nèi)容審題,帶著問題反復(fù)閱讀文章,避免閱讀中遺忘而進(jìn)行相關(guān)標(biāo)注等。
阿里巴巴自然語言處理首席科學(xué)家司羅表示,對于解決Wiki類(維基百科類)客觀知識問答,機(jī)器已經(jīng)取得非常好的結(jié)果,未來將繼續(xù)向?qū)νㄓ脙?nèi)容的“能理解會思考”的終極目標(biāo)邁進(jìn)。
目前,這項(xiàng)技術(shù)也已經(jīng)在阿里巴巴內(nèi)部被廣泛使用。比如,每年雙11都會有大量的顧客對活動規(guī)則進(jìn)行咨詢。阿里小蜜團(tuán)隊(duì)通過使用機(jī)器閱讀技術(shù),讓機(jī)器直接對規(guī)則進(jìn)行閱讀,為用戶提供規(guī)則解讀服務(wù),是最自然的交互方式。
未來的方向
機(jī)器閱讀界風(fēng)起云涌,火力全開,人類真的會被超越嗎?
微軟亞洲研究院自然語言處理組首席研究員韋福如表示,即使機(jī)器閱讀團(tuán)隊(duì)的系統(tǒng)可以在SQuAD數(shù)據(jù)集中和人表現(xiàn)的一樣好,并不意味著機(jī)器可以像人一樣真正閱讀和理解,這是未來必須要面臨的一個挑戰(zhàn)。
韋福如說,人類理解文本的能力是多維度的,結(jié)合多任務(wù)(尤其是閱讀理解相關(guān)的任務(wù),例如閱讀理解之后進(jìn)行摘要和問答)的模型非常值得關(guān)注和期待。更進(jìn)一步,雖然SQuAD提供了比較大的人工標(biāo)注數(shù)據(jù)集,如何有效且高效地使用未標(biāo)注的數(shù)據(jù)也是非常值得期待的研究課題和方向。從任務(wù)上看,目前SQuAD的任務(wù)定義中答案是原文的某個子片段,而實(shí)際中人可能讀完文章之后需要進(jìn)行更復(fù)雜的推理、并組織新的文字表達(dá)出來。
“目前我們的算法基本都是抽取型的方式,未來生成型的算法也值得更多的探索和研究。另外,目前機(jī)器閱讀理解關(guān)注的都是理解客觀信息的能力,未來機(jī)器理解文字里面所表達(dá)出來的主觀信息(例如情感)也是非常有趣并值得關(guān)注的方向。”韋福如說道。
關(guān)注【AI商業(yè)報(bào)道】,回復(fù)【2017白皮書】,可獲得干貨《2017人工智能產(chǎn)業(yè)發(fā)展白皮書》!
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個大計(jì)劃瞄準(zhǔn)AI機(jī)器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費(fèi)引熱議
- 消息稱塔塔集團(tuán)將收購和碩印度iPhone代工廠60%股份 并接管日常運(yùn)營
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達(dá)新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關(guān)注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號發(fā)布,意外泄露引發(fā)關(guān)注
- 無人機(jī)“黑科技”亮相航展:全球首臺低空重力測量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機(jī)器人合作
- 賽力斯觸及漲停,汽車整車股盤初強(qiáng)勢拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。