本周要跟大家分享的是來自TechBeat社區(qū)的一篇優(yōu)質(zhì)好文。本文中,車萬翔教授從ACL的投稿及錄用趨勢,到各個研究領域的發(fā)展現(xiàn)狀,都發(fā)表了自己的一些看法,希望對相關領域的研究者能有所幫助!
導讀:
2020年5月23日,有幸受邀在中國中文信息學會青年工作委員會主辦的AIS(ACL-IJCAI-SIGIR)2020頂會論文預講會上介紹了ACL會議近年來的研究趨勢,特整理成幻燈片配文字版,希望對相關領域的研究者有所幫助。由于視野所限,時間倉促,特別是ACL 2020的錄用論文列表剛發(fā)布不久,因此統(tǒng)計的數(shù)據(jù)和得出的結(jié)論難免有失偏頗,如有不當之處,還敬請指出。另外,特別感謝組內(nèi)的多位博士生幫助進行數(shù)據(jù)整理。
首先來看一下2010年到2020年這11年來,ACL長文的錄用情況和趨勢,可以看出從2018年開始,投稿和錄用的數(shù)量急劇上升,說明作為人工智能皇冠上的明珠,自然語言處理領域越來越受到研究界的關注。另外,ACL的錄用率多年來基本保持穩(wěn)定,一直在25%左右。
再來看一下今年錄用文章標題的詞云,從中可以看出大家關注比較多的任務有生成、翻譯、對話、問答、抽取、句法等方向,用到的方法多涉及到神經(jīng)、網(wǎng)絡、注意力、圖等。另外,從文章作者的詞云可以看出前幾名的基本都是中國的大姓,這也反應出華人作者在ACL頂會上已經(jīng)占據(jù)非常大的比例。
為了更直觀的了解近年來ACL各個研究領域的變化趨勢,我們做了一個領域趨勢競賽圖,幫助大家更好地看出各個研究領域此消彼長的變化過程。特別說明的是,我們的領域是參考ACL 2019進行劃分的,由于其它年份的領域劃分方式不盡相同,我們采用人工的方式進行了映射。另外,由于2020年目前只有文章列表,還沒有領域數(shù)據(jù),所以也是人工逐篇文章分的類,因此具有一定的主觀性,有可能不是特別準確。
從這段視頻中,我們可以看到幾個非常明顯的趨勢,比如人機對話等新興領域上升勢頭迅猛,而句法分析、機器翻譯等傳統(tǒng)領域有所衰落。下面,就幾個變化比較明顯的領域分別加以介紹。
人機對話異軍突起
2015年之前,ACL上幾乎沒有人機對話的文章發(fā)表,但是從2016年開始,隨著語音識別技術的突破,NLPer開始重視人機對話的研究,今年ACL該方向上的研究重點和研究趨勢如下圖所示。
機器學習持續(xù)熱門
可以看到近10年來,機器學習的熱度一直居高不下,特別是隨著預訓練模型的成功,NLP模型大有被大一統(tǒng)的趨勢。下面的一些機器學習研究方向為今年ACL所重點關注。
123下一頁>(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )