本周要跟大家分享的是來自TechBeat社區(qū)的一篇優(yōu)質(zhì)好文。本文中,車萬翔教授從ACL的投稿及錄用趨勢(shì),到各個(gè)研究領(lǐng)域的發(fā)展現(xiàn)狀,都發(fā)表了自己的一些看法,希望對(duì)相關(guān)領(lǐng)域的研究者能有所幫助!
導(dǎo)讀:
2020年5月23日,有幸受邀在中國(guó)中文信息學(xué)會(huì)青年工作委員會(huì)主辦的AIS(ACL-IJCAI-SIGIR)2020頂會(huì)論文預(yù)講會(huì)上介紹了ACL會(huì)議近年來的研究趨勢(shì),特整理成幻燈片配文字版,希望對(duì)相關(guān)領(lǐng)域的研究者有所幫助。由于視野所限,時(shí)間倉(cāng)促,特別是ACL 2020的錄用論文列表剛發(fā)布不久,因此統(tǒng)計(jì)的數(shù)據(jù)和得出的結(jié)論難免有失偏頗,如有不當(dāng)之處,還敬請(qǐng)指出。另外,特別感謝組內(nèi)的多位博士生幫助進(jìn)行數(shù)據(jù)整理。
首先來看一下2010年到2020年這11年來,ACL長(zhǎng)文的錄用情況和趨勢(shì),可以看出從2018年開始,投稿和錄用的數(shù)量急劇上升,說明作為人工智能皇冠上的明珠,自然語言處理領(lǐng)域越來越受到研究界的關(guān)注。另外,ACL的錄用率多年來基本保持穩(wěn)定,一直在25%左右。
再來看一下今年錄用文章標(biāo)題的詞云,從中可以看出大家關(guān)注比較多的任務(wù)有生成、翻譯、對(duì)話、問答、抽取、句法等方向,用到的方法多涉及到神經(jīng)、網(wǎng)絡(luò)、注意力、圖等。另外,從文章作者的詞云可以看出前幾名的基本都是中國(guó)的大姓,這也反應(yīng)出華人作者在ACL頂會(huì)上已經(jīng)占據(jù)非常大的比例。
為了更直觀的了解近年來ACL各個(gè)研究領(lǐng)域的變化趨勢(shì),我們做了一個(gè)領(lǐng)域趨勢(shì)競(jìng)賽圖,幫助大家更好地看出各個(gè)研究領(lǐng)域此消彼長(zhǎng)的變化過程。特別說明的是,我們的領(lǐng)域是參考ACL 2019進(jìn)行劃分的,由于其它年份的領(lǐng)域劃分方式不盡相同,我們采用人工的方式進(jìn)行了映射。另外,由于2020年目前只有文章列表,還沒有領(lǐng)域數(shù)據(jù),所以也是人工逐篇文章分的類,因此具有一定的主觀性,有可能不是特別準(zhǔn)確。
從這段視頻中,我們可以看到幾個(gè)非常明顯的趨勢(shì),比如人機(jī)對(duì)話等新興領(lǐng)域上升勢(shì)頭迅猛,而句法分析、機(jī)器翻譯等傳統(tǒng)領(lǐng)域有所衰落。下面,就幾個(gè)變化比較明顯的領(lǐng)域分別加以介紹。
人機(jī)對(duì)話異軍突起
2015年之前,ACL上幾乎沒有人機(jī)對(duì)話的文章發(fā)表,但是從2016年開始,隨著語音識(shí)別技術(shù)的突破,NLPer開始重視人機(jī)對(duì)話的研究,今年ACL該方向上的研究重點(diǎn)和研究趨勢(shì)如下圖所示。
機(jī)器學(xué)習(xí)持續(xù)熱門
可以看到近10年來,機(jī)器學(xué)習(xí)的熱度一直居高不下,特別是隨著預(yù)訓(xùn)練模型的成功,NLP模型大有被大一統(tǒng)的趨勢(shì)。下面的一些機(jī)器學(xué)習(xí)研究方向?yàn)榻衲闍CL所重點(diǎn)關(guān)注。
123下一頁(yè)>(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )