近日,智言科技AI團(tuán)隊(duì)刷新CommonsenseQA數(shù)據(jù)集世界排名,以超出第二名3個(gè)百分點(diǎn)的成績(jī)位列榜單第一。該榜單參與團(tuán)隊(duì)包括微軟亞洲研究院、阿里達(dá)摩院、FacebookAI、CMU等。以常識(shí)性問(wèn)答為應(yīng)用是 NLP 最重要的前進(jìn)方向之一,其目的是幫助計(jì)算機(jī)通過(guò)已有的知識(shí)來(lái)推理判斷未見(jiàn)過(guò)的輸入信息,從而使計(jì)算機(jī)更理解人的意思。
CommonsenseQA任務(wù)由以色列特拉維夫大學(xué)建立,是一個(gè)新的多項(xiàng)選擇題答案數(shù)據(jù)集,它需要不同類(lèi)型的常識(shí)知識(shí)來(lái)預(yù)測(cè)正確的答案,是極具有挑戰(zhàn)性的數(shù)據(jù)集。數(shù)據(jù)集中的12102個(gè)問(wèn)題,包含一個(gè)正確答案和四個(gè)干擾因素答案,測(cè)試結(jié)果每?jī)芍茉u(píng)估一次。目前排名第一的智言科技團(tuán)隊(duì)獲得76.5%的準(zhǔn)確性,在排名中超越第二名3個(gè)百分點(diǎn),在NLP領(lǐng)域中已是很大的進(jìn)步和超越,但是仍低于人類(lèi)88.9%的水平,可見(jiàn)NLP在常識(shí)性推理方向仍有很大挑戰(zhàn)和進(jìn)步空間。
CommonsenseQALeaderBoard,智言科技目前排名第一
當(dāng)人類(lèi)回答問(wèn)題時(shí),他們會(huì)依據(jù)常識(shí)、背景知識(shí)、空間關(guān)系、原因、結(jié)果、科學(xué)事實(shí)和社會(huì)慣例等,來(lái)判斷問(wèn)題答案。例如,提出了一個(gè)問(wèn)題:“當(dāng)李蒙聽(tīng)到割草機(jī)的聲音時(shí),他在哪里?”可以推斷割草機(jī)靠近李蒙時(shí),同時(shí)可能在戶(hù)外并位于街道上。這種知識(shí)對(duì)人類(lèi)而言似乎微不足道,但是仍然超出了當(dāng)前的自然語(yǔ)言理解(NLU)系統(tǒng)。
當(dāng)前閱讀理解模型主要所關(guān)注的問(wèn)題類(lèi)型是事實(shí)類(lèi)問(wèn)題(factoid questions),這類(lèi)型的問(wèn)題答案往往能直接在原文中找到,然而如何基于常識(shí)和背景知識(shí)進(jìn)行推理以獲得答案仍舊是一個(gè)巨大的挑戰(zhàn)。數(shù)據(jù)集 CommonsenseQA、CosmosQA 等相繼被提出便是為了促進(jìn)該方向的發(fā)展。在這些數(shù)據(jù)集中,機(jī)器需要結(jié)合常識(shí)知識(shí)來(lái)回答諸如“我可以站在河上的什么地方看水流而不會(huì)弄濕自己?”這樣的問(wèn)題,因此更具挑戰(zhàn)性。
如果想人工智能要更好地服務(wù)于人類(lèi)、更多地介入人類(lèi)的日常生活,人工智能機(jī)器人就需要理解人類(lèi)自然語(yǔ)言的意義,提前學(xué)習(xí)、掌握常識(shí)并據(jù)此進(jìn)行推理。大家已經(jīng)充分地認(rèn)識(shí)到:人工智能的下一步發(fā)展和實(shí)用化,必須突破語(yǔ)義理解和常識(shí)推理這一瓶頸。我們認(rèn)為語(yǔ)義理解和常識(shí)推理研究的進(jìn)展,依賴(lài)于全新的自然語(yǔ)言處理技術(shù)和理念。
在商業(yè)化應(yīng)用當(dāng)中,人工智能帶來(lái)的首先應(yīng)該是商業(yè)模式上的轉(zhuǎn)變,然后是運(yùn)用的效率轉(zhuǎn)變。智言科技的AI團(tuán)隊(duì)始終專(zhuān)注于自然語(yǔ)言處理領(lǐng)域的技術(shù)突破,同時(shí)將知識(shí)圖譜融入其中,幫助傳統(tǒng)企業(yè)進(jìn)行數(shù)字化轉(zhuǎn)型?;诙鄠€(gè)垂直行業(yè)的大量對(duì)話(huà)應(yīng)用場(chǎng)景,智言科技在自然語(yǔ)言理解、意圖識(shí)別及邏輯推理等技術(shù)上取得了較好的效果。
對(duì)于企業(yè)員工來(lái)說(shuō),客戶(hù)所提出的問(wèn)題相似度很高,使得工作重復(fù)繁瑣,這部分工作已經(jīng)實(shí)現(xiàn)人工智能技術(shù)的部分替代性,有效提高工作效率,降低企業(yè)運(yùn)營(yíng)成本。除此之外,在常規(guī)問(wèn)答中,為了提高機(jī)器人的問(wèn)答能力邊界,以知識(shí)圖譜形式應(yīng)用的非結(jié)構(gòu)化數(shù)據(jù)、對(duì)話(huà)的數(shù)據(jù)不斷累積,從而優(yōu)化語(yǔ)料庫(kù)、提高準(zhǔn)確率。這些數(shù)據(jù)也是企業(yè)未來(lái)數(shù)字化轉(zhuǎn)型的新燃料。
目前市面上大部分的商業(yè)落地項(xiàng)目主要采用深度學(xué)習(xí)的技術(shù)提高模型的識(shí)別率以及對(duì)話(huà)準(zhǔn)確度,這樣的方式需要大量的數(shù)據(jù)。到了一個(gè)階段之后,即使加大數(shù)據(jù)量也無(wú)法提高模型的準(zhǔn)確率,且過(guò)程無(wú)法解釋?zhuān)_(kāi)放領(lǐng)域的多輪對(duì)話(huà)目前還處在弱人工智能的階段。智言科技的知識(shí)圖譜+深度學(xué)習(xí)的優(yōu)勢(shì)是數(shù)據(jù)量小、過(guò)程可以解釋、準(zhǔn)確度高,將兩項(xiàng)結(jié)合為強(qiáng)人工智能奠定基礎(chǔ)。例如,智言科技在金融領(lǐng)域,已經(jīng)構(gòu)建了數(shù)十萬(wàn)份非結(jié)構(gòu)化文檔的知識(shí)圖譜,成為支撐落地應(yīng)用中的數(shù)據(jù)源動(dòng)力。同時(shí),為了更好的完成企業(yè)智能化應(yīng)用的閉環(huán),智言科技AI團(tuán)隊(duì)在圖像識(shí)別、語(yǔ)音識(shí)別、語(yǔ)音合成等領(lǐng)域都在不斷探索,從而為用戶(hù)帶來(lái)更好的智能化體驗(yàn)。
智言科技構(gòu)建非結(jié)構(gòu)化文檔形成為知識(shí)圖譜
人工智能勢(shì)必將對(duì)人們的工作產(chǎn)生深刻影響,因此建立新的內(nèi)部業(yè)務(wù)模式流程變得前所未有的緊迫。一些領(lǐng)先的企業(yè)認(rèn)識(shí)到,人工智能將對(duì)業(yè)務(wù)模式、員工結(jié)果及客戶(hù)和員工期望獲得的體驗(yàn)產(chǎn)生重大影響。智言科技AI團(tuán)隊(duì)對(duì)于自然語(yǔ)言處理技術(shù)以及知識(shí)圖譜技術(shù)在不斷地探索和研發(fā)。智言科技也希望通過(guò)搜索、推薦、語(yǔ)音及語(yǔ)義識(shí)別等人工智能算法,能夠滿(mǎn)足業(yè)務(wù)量快速增長(zhǎng)的目標(biāo),助力企業(yè)完成在新的業(yè)務(wù)模式和傳統(tǒng)系統(tǒng)之間的平穩(wěn)過(guò)渡。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 比亞迪第五代DM技術(shù)問(wèn)世,首搭秦L/海豹06 DM-i,開(kāi)創(chuàng)油耗2時(shí)代!
- 小紅書(shū)沉帖降權(quán)怎么做,有效方法大盤(pán)點(diǎn)!
- 亞洲時(shí)刻京東送上電視好禮 以舊換新一體化服務(wù)讓低價(jià)更靠譜
- 互聯(lián)網(wǎng)營(yíng)銷(xiāo)師和全媒體運(yùn)營(yíng)師的區(qū)別?
- 聯(lián)想集團(tuán)車(chē)計(jì)算“超級(jí)大腦”概念機(jī)亮相
- 華策影視設(shè)立專(zhuān)項(xiàng)基金成立AIGC應(yīng)用研究院
- 三部委審批,聯(lián)合發(fā)布9個(gè)新職業(yè),“互聯(lián)網(wǎng)營(yíng)銷(xiāo)師”上榜
- 互聯(lián)網(wǎng)營(yíng)銷(xiāo)師的報(bào)考條件是什么?
- 互聯(lián)網(wǎng)營(yíng)銷(xiāo)師的適合人群有哪些?
- 互聯(lián)網(wǎng)營(yíng)銷(xiāo)師行業(yè)前景怎么樣?
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。