自然語言處理(NLP)是人工智能皇冠上的一顆明珠。
這樣的說法在人工智能領(lǐng)域流傳許久,現(xiàn)實(shí)中發(fā)生的卻是這樣一幕:計(jì)算機(jī)視覺、語音識(shí)別等領(lǐng)域紛紛跑出了多個(gè)獨(dú)角獸,沖刺IPO的消息也時(shí)常出現(xiàn)??勺鳛椤盎使谏系拿髦椤钡腘LP領(lǐng)域,卻難見獨(dú)角獸的影子,大多數(shù)創(chuàng)業(yè)者還停留在A輪或B輪融資。
NLP如何走出困局?
在NLP領(lǐng)域深耕十年,被稱作“中國NLP燈塔”的百度給出了切實(shí)的答案。8月25日舉行的百度大腦語言與知識(shí)技術(shù)峰會(huì)上,伴隨著一系列語言與知識(shí)產(chǎn)品的發(fā)布與升級(jí),百度NLP的全景布局和鉆研了十幾年的核心技術(shù)一一亮相。
01 翻越認(rèn)知智能的高山
把時(shí)間調(diào)回一個(gè)多月前的ACL 2020。
作為NLP領(lǐng)域最負(fù)盛名的國際頂會(huì),ACL 2020收到了3429 篇論文投稿,其中被接收的779篇論文中有185 篇來自中國大陸,占比僅次于美國。距離2010年首次有中國科技企業(yè)的論文入選ACL,僅僅過去了10年時(shí)間。
除了論文數(shù)量的逐年增長,中國NLP學(xué)者的面孔也陸續(xù)在ACL上出現(xiàn)。
2013年,百度CTO王海峰成為ACL歷史上首位華人主席;2014 年,同樣來自百度的吳華出任 ACL 程序委員會(huì)主席;2015年,哈工大教育部語言語音重點(diǎn)實(shí)驗(yàn)室主任李生教授獲得 ACL 終身成就獎(jiǎng);2016 年,百度的趙世奇當(dāng)選 ACL 秘書長;2018年,ACL 宣布創(chuàng)建亞太區(qū)域分會(huì),王海峰擔(dān)任創(chuàng)始主席;2020 年,百度組織了 ACL 大會(huì)上首場同聲傳譯研討會(huì)……
以百度為代表的中國力量在NLP的世界舞臺(tái)上不斷出彩,本身就是一種話語權(quán)的象征,而左右話語權(quán)的核心因素正是學(xué)術(shù)成就。
僅以百度為例,過去十年是百度NLP高速增長的十年,在NLP領(lǐng)域摘得了包括國家科技進(jìn)步獎(jiǎng)在內(nèi)的20多個(gè)獎(jiǎng)項(xiàng),在30多項(xiàng)國際競賽中奪得冠軍,累計(jì)發(fā)表的學(xué)術(shù)論文超過300篇,專利申請(qǐng)高達(dá)2000多項(xiàng)。
其中最具代表性的無疑就是百度的語義理解技術(shù)與平臺(tái)文心(ERNIE)。
2019年12月,基于ERNIE 2.0改進(jìn)的模型在權(quán)威榜單GLUE上首次突破90大關(guān),超越人類基線3個(gè)點(diǎn),獲得全球第一;3個(gè)月后的人工智能頂級(jí)會(huì)議AAAI 2020上,NLP預(yù)訓(xùn)練領(lǐng)域入選論文《ERNIE 2.0: A Continual Pre-Training Framework for Language Understanding》被選為Oral展示;2020年的世界人工智能大會(huì)上,ERNIE有了中文名字“文心”,并一舉斬獲最高獎(jiǎng)項(xiàng)SAIL獎(jiǎng)(Super AI Leader,卓越人工智能引領(lǐng)者)。
學(xué)術(shù)上的一系列成就,意味著百度已經(jīng)站在了NLP研究的最前沿,成為中國NLP領(lǐng)域的領(lǐng)軍者,并與谷歌、微軟一道被視為“全球AI三巨頭”。
可對(duì)于百度來說,技術(shù)的價(jià)值絕不只是在象牙塔中“高光”,在NLP的學(xué)術(shù)領(lǐng)域走進(jìn)殿堂的同時(shí),也在循序推進(jìn)應(yīng)用場景中的落地。
剛剛結(jié)束的百度大腦語言與知識(shí)技術(shù)峰會(huì)上,第一個(gè)重磅產(chǎn)品就是在NLP核心技術(shù)基礎(chǔ)上延展開發(fā)的文心ERNIE——語義理解技術(shù)與平臺(tái),針對(duì)傳統(tǒng)NLP定制常見的成本高、耗時(shí)長、可迭代性差等短板,文心集成了優(yōu)秀的預(yù)訓(xùn)練模型、全面的NLP算法集、端到端開發(fā)套件和平臺(tái)化服務(wù),提供了一站式NLP開發(fā)與服務(wù)。
這或許就是百度給出的答案,想要推動(dòng)NLP的產(chǎn)業(yè)應(yīng)用,僅僅在學(xué)術(shù)上站在山巔還不夠,需要的是幫助整個(gè)行業(yè)翻越認(rèn)知智能的高山,以低門檻、低成本、高效率的平臺(tái)優(yōu)勢加速NLP的落地。
正如百度CTO王海峰所言,百度“致力于更好的與學(xué)術(shù)界、產(chǎn)業(yè)界攜手,推動(dòng)語言與知識(shí)技術(shù)發(fā)展,進(jìn)而推動(dòng)人工智能技術(shù)持續(xù)進(jìn)步,為產(chǎn)業(yè)持續(xù)升級(jí)、社會(huì)經(jīng)濟(jì)高質(zhì)量發(fā)展貢獻(xiàn)力量?!?/p> 123下一頁>
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )