七夕是什么?
對于中國人來說,七夕絕不僅僅是一個關(guān)于愛情和浪漫的節(jié)日記憶。它是對美好的詩性眷戀,對想象的包容,對不可能的掙脫,對星辰大海與人間煙火的歸一。
而今人與古人最大的區(qū)別在于,今天我們有了科學(xué)的工具。在古人只能想象牛郎織女的故事時,在同樣的七夕,今人可以自己動手去變不可能為可能。
英國詩人塞繆爾·約翰遜說,語言是科學(xué)的唯一工具。古時候,人類很早就有了巴別塔的傳說,希望讓不同國家、族群的人享受無界限的語言;而在今天,各行各業(yè)都需要語音、語義、知識相關(guān)的自然語言技術(shù),來提高產(chǎn)業(yè)智能化水準(zhǔn),升級工作間的溝通與交流效率;面向未來,人類還希望通過自然語言與機器對話,與萬物交互,讓語言跨過人機交互的界限。
這些希望,就像這個時代關(guān)于牽??椗膲艟?,但區(qū)別在于,這個七夕有人正在努力讓夢境變成現(xiàn)實。并且為了這個目標(biāo),他們已經(jīng)奔跑了整整十年。
用技術(shù)破解語言的謎題的實現(xiàn)方式,就是AI的重要分支NLP技術(shù)。而國內(nèi)最著名的NLP技術(shù)團(tuán)隊與產(chǎn)業(yè)旗幟,就是百度NLP。
8月25日七夕這天,以“掌握知識、理解語言、擁有智能”為主題的百度大腦語言與知識技術(shù)峰會在線上開啟。百度CTO王海峰發(fā)表主旨演講,解讀百度語言與知識技術(shù)的發(fā)展歷程與最新成果,與產(chǎn)學(xué)研各界分享技術(shù)及產(chǎn)業(yè)發(fā)展趨勢和展望。
百度集團(tuán)副總裁吳甜和百度技術(shù)委員會主席吳華分別發(fā)布百度語言與知識技術(shù)系列產(chǎn)品和數(shù)據(jù)集共建計劃,推出3大新品和6項升級,全面加速NLP技術(shù)大規(guī)模產(chǎn)業(yè)應(yīng)用。
成立十年以來,百度NLP團(tuán)隊始終都是中國NLP在學(xué)術(shù)探索與產(chǎn)業(yè)落地方面的雙向引領(lǐng)者。王海峰認(rèn)為,“在百度語言與知識技術(shù)的布局和發(fā)展中,我們始終在注意把握兩個趨勢,即技術(shù)發(fā)展趨勢和產(chǎn)業(yè)發(fā)展趨勢,并力爭引領(lǐng)趨勢。”
從研究方法、研究對象、研究方向、產(chǎn)業(yè)應(yīng)用等各個層面來看,百度NLP都是今天中國布局最完整,與產(chǎn)業(yè)接軌最成熟,技術(shù)前沿性最豐富的產(chǎn)業(yè)力量。十年來,百度在NLP領(lǐng)域獲得包括國家科技進(jìn)步獎在內(nèi)的20多個獎項,30多項國際競賽冠軍,發(fā)表學(xué)術(shù)論文超過300篇,申請專利2000多項。同時也積極推動NLP技術(shù)產(chǎn)業(yè)落地,與行業(yè)發(fā)展緊密結(jié)合,將NLP技術(shù)優(yōu)勢平臺化開放給廣大開發(fā)者,引領(lǐng)智能語言技術(shù)與千行萬業(yè)結(jié)合。
如果說,古人想象的最大界限,就是牛郎織女間的銀河,那么全球化的今天,人與人、人與機器間的最大界限,就是語言的界限。神話的鵲橋橫穿銀河兩端,今天百度NLP所做的事情,就是為智能時代搭建一座新的語言鵲橋。解析這場峰會,我們可以讀懂:
過去十年,百度打造了怎樣的NLP藍(lán)圖?
此刻的產(chǎn)業(yè)機遇期,百度如何為千行萬業(yè)提供NLP的動力與加速度?
面向未來,人類的新巴別塔上,還有哪些待解之謎?
一座語言的鵲橋,在此刻的煙火塵世與未來的智能時代間凝結(jié)——以百度NLP之名。
往昔的耕耘:十年蘊育百度NLP藍(lán)圖
十年發(fā)展的百度NLP,確實已經(jīng)積累了太多技術(shù)、應(yīng)用與產(chǎn)業(yè)案例。但百度今天的NLP實力,又是牢牢建立在過往十年的產(chǎn)業(yè)發(fā)展底座上。所以在百度大腦語言與知識技術(shù)峰會中,王海峰首先全面分享了百度在語言與知識技術(shù)領(lǐng)域的完整布局和最新成果。為我們展示了一張歷時十年,耕耘而出的百度NLP全景圖:
在堪稱NLP底座的知識領(lǐng)域,百度打造了世界上最大規(guī)模知識圖譜,擁有超過50億實體和5500億事實,并在不斷演進(jìn)和更新。百度知識圖譜應(yīng)用于各行各業(yè),每天的調(diào)用次數(shù)超過400億次。
在此基礎(chǔ)上,百度不斷強化堪稱NLP核心的語義理解技術(shù)能力。2019年3月,百度提出知識增強的語義理解框架ERNIE,在深度學(xué)習(xí)的基礎(chǔ)上融入知識,具備人類一樣的學(xué)習(xí)能力,曾一舉登頂全球權(quán)威數(shù)據(jù)集GLUE榜單,首次突破90分大關(guān)?;谥R圖譜和語義表示,實現(xiàn)了閱讀理解、對話理解以及跨模態(tài)深度語義理解。
為了讓人機交互自然流暢,語言生成技術(shù)是NLP體驗的關(guān)鍵?;陬A(yù)訓(xùn)練技術(shù)的成功經(jīng)驗,百度提出基于多流機制的語言生成預(yù)訓(xùn)練技術(shù),兼顧詞、短語等不同粒度的語義信息,顯著提升生成效果。百度也探索了多文檔摘要生成,通過圖結(jié)構(gòu)語義表示引入篇章知識,在單文檔和多文檔摘要生成效果都有提升。
這些技術(shù)藍(lán)圖流入產(chǎn)業(yè)譜系,就構(gòu)成了百度NLP技術(shù)在應(yīng)用層面的深耕與實踐。在對話系統(tǒng)領(lǐng)域,百度提出了知識圖譜驅(qū)動的對話控制技術(shù),以及首個基于隱空間的大規(guī)模開放域?qū)υ捘P蚉LATO等,并推出智能對話定制和服務(wù)平臺UNIT,可幫助開發(fā)者高效構(gòu)建智能對話系統(tǒng),實現(xiàn)規(guī)?;瘧?yīng)用。
在另一個重要的NLP應(yīng)用機器翻譯領(lǐng)域,百度翻譯目前能夠支持200多種語言,每日響應(yīng)超過千億字符的翻譯請求,支持超過40多萬家第三方應(yīng)用,技術(shù)上,提出了多智能體聯(lián)合學(xué)習(xí)、基于語義單元的同傳模型、稀缺語種分組混合訓(xùn)練算法等。
百度大腦語言與知識技術(shù)的探索,同時還以平臺化的方式輸出,賦能千行萬業(yè),提升社會生產(chǎn)的普遍智能化水準(zhǔn)。
從這張根據(jù)公開數(shù)據(jù)整理的全球NLP巨頭產(chǎn)業(yè)布局對比圖中,我們可以發(fā)現(xiàn)百度NLP在核心技術(shù)、產(chǎn)品應(yīng)用布局,以及研發(fā)力量儲備上,都已經(jīng)具備了國際一流水準(zhǔn),可以與谷歌、微軟兩大AI巨頭一教高下。百度NLP的產(chǎn)業(yè)成績,已經(jīng)客觀達(dá)成了國內(nèi)最強、世界頂級,開啟了代表中國NLP產(chǎn)業(yè)向未來航行的領(lǐng)軍者態(tài)勢。
十年蘊育成了百度NLP藍(lán)圖,同時也蘊育了百度在語言與知識領(lǐng)域的不斷突破與創(chuàng)新能力。今天,百度NLP并沒有停下腳步,而是為千行萬業(yè)與廣大AI開發(fā)者帶來了最浪漫的七夕禮物。
此刻的浪漫:5款新產(chǎn)品、2大計劃,推動NLP邂逅產(chǎn)業(yè)
推動NLP技術(shù)走向產(chǎn)業(yè),融入智能化進(jìn)程,是以深度學(xué)習(xí)為代表的AI第四次興起周期中最重要的產(chǎn)業(yè)議題之一。而這一目標(biāo),是建立在大量可規(guī)?;瘡?fù)用、能夠支撐工業(yè)級應(yīng)用的NLP技術(shù)與產(chǎn)品基礎(chǔ)上的。為此,百度在七夕這天帶來了重磅的NLP禮物——百度集團(tuán)副總裁吳甜接續(xù)發(fā)布文心(ERNIE)、TextMind、AI同傳會議解決方案、智能創(chuàng)作平臺、智能對話定制與服務(wù)平臺UNIT等5款新產(chǎn)品:
百度推出的語義理解技術(shù)與平臺文心(ERNIE),基于深度學(xué)習(xí)平臺飛槳打造,提供一站式NLP開發(fā)與服務(wù),將減少開發(fā)者90%數(shù)據(jù)標(biāo)注量、90%算力投入、85%模型開發(fā)時長,進(jìn)而全面降低NLP定制開發(fā)的成本,讓開發(fā)者更簡單、高效地定制企業(yè)級NLP模型。
全新發(fā)布TextMind智能文檔分析平臺,基于OCR、NLP技術(shù),以文檔解析為核心能力,支持文檔對比與文檔審核,具備“多快好省”的核心優(yōu)勢,促進(jìn)企業(yè)辦公智能升級。
全新發(fā)布AI同傳會議解決方案,覆蓋會議全場景、全流程,旨在打造用戶隨身的“會議同傳專家”。在邀測期間,百度AI同傳會議解決方案已經(jīng)支持了上百場會議,覆蓋數(shù)十個領(lǐng)域,包括線上遠(yuǎn)程會議、線下會議。
百度大腦智能創(chuàng)作平臺針對媒體應(yīng)用場景再升級,全新推出智能策劃、智能采編、智能審校三大媒體場景方案,進(jìn)一步助力媒體效率,加強采編能力。
智能對話定制與服務(wù)平臺UNIT升級3大特性:更智能的任務(wù)式對話理解、極致便捷的表格問答和融合通用的新引擎。截至目前,UNIT平臺已有2.7萬開發(fā)者,10萬應(yīng)用,累計交互4200億,并積累知識2.4億。此次UNIT全新推出的三大能力,將進(jìn)一步降低任務(wù)式對話、智能問答的定制成本,并融合通用對話能力,提升交互體驗。
在NLP產(chǎn)業(yè)化落地中,另一個長期挑戰(zhàn)是數(shù)據(jù)匱乏、算力不足。為應(yīng)對挑戰(zhàn),百度聯(lián)合中國計算機學(xué)會、中國中文信息學(xué)會發(fā)起全球首個中文自然語言處理數(shù)據(jù)共建計劃——千言,解決數(shù)據(jù)稀缺問題。
千言一期由來自國內(nèi)11家高校和企業(yè)的數(shù)據(jù)資源研發(fā)者共同建設(shè),已涵蓋開放域?qū)υ挕㈤喿x理解等7大任務(wù),20余個中文開源數(shù)據(jù)集。百度技術(shù)委員會主席吳華表示,百度計劃在未來3年,面向20余個任務(wù),收集和建設(shè)不少于100個中文自然語言處理數(shù)據(jù)集,覆蓋語言與知識技術(shù)全部領(lǐng)域。
吳華還發(fā)布了百度語言與知識技術(shù)算力共享計劃,通過百度AI STUDIO平臺提供算力支持,讓廣大開發(fā)者破除算力桎梏,專注于技術(shù)創(chuàng)新。
全新的技術(shù)、產(chǎn)品與產(chǎn)業(yè)合作計劃,構(gòu)成了百度NLP與千行萬業(yè)智能升級進(jìn)一步“相知相戀”的契機。在這個七夕里,最好的禮物是美好的未來,而這也是百度NLP的長久努力方向。
未來的銀河:從NLP到智能時代
十年堅守,是為未來。
在AI技術(shù)推動第四次工業(yè)革命到來的關(guān)鍵契機中,NLP技術(shù)構(gòu)成了變局的核心。從技術(shù)特征上看,NLP最大的潛力在于其探索深度是近乎無限的,并且將始終激發(fā)新的需求、新的產(chǎn)業(yè)邏輯與落地場景。
無論是從百度過往布局的技術(shù)藍(lán)圖,還是今天推動的新技術(shù)、新產(chǎn)品,百度NLP始終在指向宏偉的未來,也就是百度NLP在部門成立時提出的“掌握知識、理解語言、擁有智能”。為了不斷走近NLP指向的智能時代,百度NLP始終堅持人才為本,不斷在發(fā)展過程中培養(yǎng)、吸引全球頂尖人才,為長期發(fā)展探索做出堅實準(zhǔn)備。在峰會上,百度推出以王海峰為代表的百度NLP“十年十人”,也正是他們的十年堅守,不忘初心,才讓NLP技術(shù)從科幻作品中走到現(xiàn)實,變成通往未來的康莊大道。
今天的NLP技術(shù)發(fā)展,還遠(yuǎn)遠(yuǎn)沒有走到盡頭。雖然百度NLP成果輝煌,但我們眼前更多的是未知與挑戰(zhàn)。峰會上,王海峰也提到了語言與知識技術(shù)發(fā)展面臨的難題。他表示,復(fù)雜知識表示和快速構(gòu)建技術(shù),知識與深度學(xué)習(xí)進(jìn)一步融合,深度融合感知和認(rèn)知的跨模態(tài)語義理解技術(shù),模型可解釋性和魯棒性等等,仍有很多技術(shù)難題需要持續(xù)研究和解決。
而正是始終有未知,始終在探索,才讓未來的銀河絢爛于今夜的七夕。百度NLP的技術(shù)藍(lán)圖、新品發(fā)布,更遠(yuǎn)處指向著智能時代的洪流,指向著解開語言之謎的可能與執(zhí)著。
關(guān)于百度NLP的未來發(fā)展,王海峰提出:“我們致力于更好的與學(xué)術(shù)界、產(chǎn)業(yè)界攜手,推動語言與知識技術(shù)發(fā)展,進(jìn)而推動人工智能技術(shù)持續(xù)進(jìn)步,為產(chǎn)業(yè)持續(xù)升級、社會經(jīng)濟(jì)高質(zhì)量發(fā)展貢獻(xiàn)力量。我們對未來充滿信心,堅持掌握知識、理解語言、擁有智能,繼續(xù)突破和創(chuàng)新,為技術(shù)和社會進(jìn)步做出更大貢獻(xiàn)?!?/p>
當(dāng)自然語言的奧秘,邂逅千行萬業(yè)的智能化升級——金風(fēng)玉露一相逢,便勝卻人間無數(shù)。
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 阿里獨家合作,亞馬遜“親測”代言,雷鳥創(chuàng)新打造 AI 眼鏡新標(biāo)桿,媲美 Meta !
- CES 2025 搶先揭秘:XR領(lǐng)域新品爆料,AI眼鏡成焦點
- 2024 XR年度大事件TOP 10
- 先誅蘋果,再滅Meta?三星、谷歌、高通組“失敗者聯(lián)盟”,能否贏得XR領(lǐng)域終局之戰(zhàn)?
- Meta高端AR眼鏡Orion全揭秘:五年內(nèi)上市,或無緣國內(nèi)市場,大概率撞車蘋果
- 庫克進(jìn)軍游戲圈?蘋果Vision Pro與索尼達(dá)成合作 后者發(fā)行游戲剛拿下TGA年度最佳
- 2024年VR/AR行業(yè)年終盤點之融資篇
- 三星首款A(yù)R眼鏡全揭秘:目前我們所了解的一切
- 萬花筒 | 2025年AI/AR眼鏡這些看點值得期待:Android XR商用、羅永浩入局
- 萬花筒 | 這七大特性,有望出現(xiàn)在Meta明年發(fā)布的頭顯產(chǎn)品上
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。