国产中文字幕免费不卡,久久青草亚洲av无码麻豆,亚洲欧洲无码一区二区三区

1月11日，機(jī)器閱讀理解領(lǐng)域頂級(jí)賽事SQuAD (Stanford Question Answering Dataset) 刷新排名，阿里巴巴憑借82.440的精確匹配（Exact Match）分?jǐn)?shù)，代表人工智能首次在閱讀理解能力比賽上超越人類。

親，阿里AI已經(jīng)能代替人類做閱讀理解了

什么是機(jī)器閱讀理解？

讓機(jī)器像人類一樣閱讀文本，進(jìn)而根據(jù)對(duì)該文本的理解來(lái)回答問題，這種閱讀理解就像是讓計(jì)算機(jī)來(lái)做我們高考英語(yǔ)的閱讀理解題。機(jī)器閱讀理解是當(dāng)前AI界前沿的一個(gè)火熱主題，主要涉及到深度學(xué)習(xí)、自然語(yǔ)言處理和信息檢索。如果哪一天機(jī)器真能具備相當(dāng)高水準(zhǔn)的閱讀理解能力，那么很多應(yīng)用便會(huì)體現(xiàn)出真正的人工智能。

比如搜索引擎會(huì)在真正理解文章內(nèi)容基礎(chǔ)上去回答用戶的問題，而不是目前這種以關(guān)鍵詞匹配的方式去響應(yīng)用戶，這對(duì)于搜索引擎領(lǐng)域帶來(lái)的巨變很可能是顛覆性的。

機(jī)器閱讀系統(tǒng)也能幫助醫(yī)生、律師以及其他專家更快地閱讀專業(yè)的醫(yī)學(xué)或判例文檔，從而讓他們有更多的時(shí)間對(duì)病人進(jìn)行治療或構(gòu)思合法抗辯。

它也能幫助人們更快地發(fā)現(xiàn)隱藏在汽車使用說明書或稅務(wù)條例中的信息，節(jié)約時(shí)間。

微軟深度學(xué)習(xí)技術(shù)中心合作研究經(jīng)理高劍鋒說：“世界中有大量信息，尤其是互聯(lián)網(wǎng)中；為了讓信息產(chǎn)生價(jià)值，需要將其轉(zhuǎn)化為知識(shí)，而機(jī)器閱讀技術(shù)可以在信息與知識(shí)之間搭建一個(gè)橋梁。”

SQuAD：機(jī)器閱讀理解界的頂級(jí)賽事

很長(zhǎng)一段時(shí)間以來(lái)，自然語(yǔ)言處理的研究都是基于句子級(jí)別的閱讀理解，但長(zhǎng)文本的理解問題一直是研究的一個(gè)難點(diǎn)，因?yàn)檫@涉及到句子之間的連貫、上下文和推理等更高維的研究?jī)?nèi)容。而大數(shù)據(jù)的發(fā)展讓學(xué)者們看到了這一研究方向的曙光。通過長(zhǎng)文本點(diǎn)對(duì)點(diǎn)的學(xué)習(xí)，即對(duì)句子、短語(yǔ)、上下文進(jìn)行建模，這一過程需要運(yùn)用人工智能的推理能力。

斯坦福大學(xué)在2016年通過亞馬遜眾包平臺(tái)（AMT）建立的SQuAD 數(shù)據(jù)集是機(jī)器閱讀這一新興領(lǐng)域的核心基準(zhǔn)，它包含 10 萬(wàn)個(gè)（問題，原文，答案）三元組，規(guī)模遠(yuǎn)超之前的所有數(shù)據(jù)集：每個(gè)問題由人為提出，有且僅有一個(gè)維基百科文章的段落與其相關(guān)；答案來(lái)自該段落的某一片段且答案類型較為豐富；推理出答案的過程具有多樣性且具有適中的難度。

親，阿里AI已經(jīng)能代替人類做閱讀理解了

▲當(dāng)前的公開數(shù)據(jù)集對(duì)比

SQuAD文本理解挑戰(zhàn)賽則被斯坦福大學(xué)打造為“機(jī)器閱讀理解界的ImageNet”，吸引了包括谷歌、卡內(nèi)基.梅隆大學(xué)、斯坦福大學(xué)、微軟亞洲研究院、艾倫研究院、IBM、Facebook等知名企業(yè)研究機(jī)構(gòu)和高校的深度參與，共同推進(jìn)機(jī)器閱讀理解的進(jìn)步。

人工智能在閱讀完數(shù)據(jù)集中的一篇短文之后，需要回答若干個(gè)基于文章內(nèi)容的問題，然后與標(biāo)準(zhǔn)答案進(jìn)行比對(duì)，得出精確匹配（Exact Match）和模糊匹配（F1-score）的結(jié)果，評(píng)分結(jié)果將實(shí)時(shí)地在SQuAD官網(wǎng)上進(jìn)行更新。

阿里巴巴人工智能機(jī)器閱讀理解打破世界紀(jì)錄

2017年，微軟亞洲研究院的自然語(yǔ)言計(jì)算研究組持續(xù)長(zhǎng)居SQuAD榜首，但仍遠(yuǎn)未達(dá)到人類的水平。2018年開年，阿里巴巴 iDST NLP就打破紀(jì)錄，創(chuàng)造了歷史。SQuAD排行榜上，阿里和微軟亞洲研究院、騰訊DPDAC NLP、科大訊飛與哈工大聯(lián)合實(shí)驗(yàn)室、浙江大學(xué)均位于前十，讓世界看到中國(guó)團(tuán)隊(duì)的霸榜。

親，阿里AI已經(jīng)能代替人類做閱讀理解了

▲SQuAD排行榜

此次技術(shù)的重大突破源于阿里巴巴研究團(tuán)隊(duì)提出的“基于分層融合注意力機(jī)制”的深度神經(jīng)網(wǎng)絡(luò)模型。該模型能夠模擬人類在做閱讀理解問題時(shí)的一些行為，包括結(jié)合篇章內(nèi)容審題，帶著問題反復(fù)閱讀文章，避免閱讀中遺忘而進(jìn)行相關(guān)標(biāo)注等。

阿里巴巴自然語(yǔ)言處理首席科學(xué)家司羅表示，對(duì)于解決Wiki類（維基百科類）客觀知識(shí)問答，機(jī)器已經(jīng)取得非常好的結(jié)果，未來(lái)將繼續(xù)向?qū)νㄓ脙?nèi)容的“能理解會(huì)思考”的終極目標(biāo)邁進(jìn)。

目前，這項(xiàng)技術(shù)也已經(jīng)在阿里巴巴內(nèi)部被廣泛使用。比如，每年雙11都會(huì)有大量的顧客對(duì)活動(dòng)規(guī)則進(jìn)行咨詢。阿里小蜜團(tuán)隊(duì)通過使用機(jī)器閱讀技術(shù)，讓機(jī)器直接對(duì)規(guī)則進(jìn)行閱讀，為用戶提供規(guī)則解讀服務(wù)，是最自然的交互方式。

親，阿里AI已經(jīng)能代替人類做閱讀理解了

▲阿里小蜜人機(jī)交互流程

未來(lái)的方向

機(jī)器閱讀界風(fēng)起云涌，火力全開，人類真的會(huì)被超越嗎？

微軟亞洲研究院自然語(yǔ)言處理組首席研究員韋福如表示，即使機(jī)器閱讀團(tuán)隊(duì)的系統(tǒng)可以在SQuAD數(shù)據(jù)集中和人表現(xiàn)的一樣好，并不意味著機(jī)器可以像人一樣真正閱讀和理解，這是未來(lái)必須要面臨的一個(gè)挑戰(zhàn)。

韋福如說，人類理解文本的能力是多維度的，結(jié)合多任務(wù)（尤其是閱讀理解相關(guān)的任務(wù)，例如閱讀理解之后進(jìn)行摘要和問答）的模型非常值得關(guān)注和期待。更進(jìn)一步，雖然SQuAD提供了比較大的人工標(biāo)注數(shù)據(jù)集，如何有效且高效地使用未標(biāo)注的數(shù)據(jù)也是非常值得期待的研究課題和方向。從任務(wù)上看，目前SQuAD的任務(wù)定義中答案是原文的某個(gè)子片段，而實(shí)際中人可能讀完文章之后需要進(jìn)行更復(fù)雜的推理、并組織新的文字表達(dá)出來(lái)。

“目前我們的算法基本都是抽取型的方式，未來(lái)生成型的算法也值得更多的探索和研究。另外，目前機(jī)器閱讀理解關(guān)注的都是理解客觀信息的能力，未來(lái)機(jī)器理解文字里面所表達(dá)出來(lái)的主觀信息（例如情感）也是非常有趣并值得關(guān)注的方向。”韋福如說道。

關(guān)注【AI商業(yè)報(bào)道】，回復(fù)【2017白皮書】，可獲得干貨《2017人工智能產(chǎn)業(yè)發(fā)展白皮書》！

親，阿里AI已經(jīng)能代替人類做閱讀理解了

免責(zé)聲明：本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請(qǐng)進(jìn)一步核實(shí)，并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏，概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí)，應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后，將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí)，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

親，阿里AI已經(jīng)能代替人類做閱讀理解了

下一篇

親，阿里AI已經(jīng)能代替人類做閱讀理解了