百度大腦開放日NLP專場 感受技術(shù)如何讓機器更“懂”人類

7月31日,第四期百度大腦開放日在北京中關(guān)村創(chuàng)業(yè)大街百度大腦創(chuàng)新體驗中心舉行,迎來首次NLP專場。本期活動一如既往介紹了百度大腦近期最新開放和升級的能力,還重點解讀了百度大腦在自然語言處理方向的最新技術(shù)突破與開放布局,同時邀請央視網(wǎng)、國美管家、縱橫文學(xué)的技術(shù)負責(zé)人分享了基于百度自然語言處理技術(shù)的應(yīng)用創(chuàng)新與已落地的場景案例,切實展現(xiàn)了百度大腦AI產(chǎn)業(yè)化加速落地的成果。

AI大生產(chǎn)平臺 將“軟硬一體”同步升級進行到底

2019年百度AI開發(fā)者大會上,百度大腦5.0全面跨越升級為軟硬一體的AI大生產(chǎn)平臺,在算法突破、計算架構(gòu)升級的基礎(chǔ)上,實現(xiàn)AI算法、計算架構(gòu)與應(yīng)用場景融合創(chuàng)新,并實現(xiàn)AI技術(shù)的標準化、自動化、模塊化。目前,百度大腦已是服務(wù)規(guī)模最大的AI開放平臺,有超過130萬開發(fā)者使用,開放了超過210項核心技術(shù)能力,并面向廣泛的企業(yè)和開發(fā)者,不斷降低著AI應(yīng)用落地的門檻。

百度大腦開放日NLP專場 感受技術(shù)如何讓機器更“懂”人類

在第四期開放日上,百度AI技術(shù)生態(tài)部高級產(chǎn)品經(jīng)理婁雙雙詳細介紹了百度大腦在6-7月新開放與升級的產(chǎn)品能力共22項,包含新能力開放、開發(fā)平臺的全新升級、以及新硬件的發(fā)布等,還與現(xiàn)場的合作伙伴、開發(fā)者們互動,分享了這些技術(shù)賦能行業(yè)的實際案例。

在視覺方向,人體分析與車輛識別方向有3項新能力開放包括:手部關(guān)鍵點識別、危險行為識別、車輛分割;3款產(chǎn)品能力升級包括:人體關(guān)鍵點識別、人流量統(tǒng)計、駕駛行為分析。更精細的關(guān)鍵點定位,將助力人機交互、互動娛樂等場景應(yīng)用,而更豐富、精準的行為分析與識別能力,也將有效助力公共和交通安全。OCR方向,車牌、表格文字、通用文字(高精度/高精度含位置版)以及行駛證5款產(chǎn)品識別召回率均有不同程度的提升。同時人臉離線識別SDK升級至3.0版本,活體檢測與通行全流程耗時低于300ms;人臉識別私有化部署包適配了最新的RTX系列2080顯卡,并進一步提升模型性能。

百度大腦開放日NLP專場 感受技術(shù)如何讓機器更“懂”人類

EasyDL定制化模型訓(xùn)練與服務(wù)平臺在數(shù)據(jù)標注、模型、服務(wù)部署三方面再度更新。在AI模型開發(fā)過程中,數(shù)據(jù)標注往往占據(jù)了一半以上的時間和金錢成本,而此次全新推出的智能標注,可節(jié)約70%的數(shù)據(jù)標注成本。例如在開發(fā)一個物體檢測模型時,以5000張圖片樣本為例,在啟動智能標注后,人工標注約30%的圖片,剩余70%的圖片機器自動完成標注,也就是說人工僅需標注1500張圖片,相當(dāng)于單模型可節(jié)約3000~40000元標注的成本。同時,EasyDL物體檢測模型也迎來了進一步的升級,云服務(wù)時延和端SDK精度均有大幅提升。

AI模型在端上的落地應(yīng)用往往伴隨著復(fù)雜的硬件選型、軟硬件適配,耗時耗力。為此,百度大腦本次推出了三款全新的硬件方案:EdgeBoard邊緣AI計算盒、EasyDL開發(fā)套件(十目)、EdgeBoard全目標抓拍機,為終端應(yīng)用場景提供最佳實踐。EdgeBoard邊緣AI計算盒,適用于多路視頻、多模型、實時性要求高的本地計算場景,可靈活加載開發(fā)者自定義的模型,并聯(lián)合EasyDL推出了軟硬一體方案——EasyDL邊緣AI計算盒(EdgeBoard),預(yù)置EasyDL專用SDK。EasyDL開發(fā)套件(十目)適用于小型終端設(shè)備、單模型實時處理場景;EdgeBoard多目標抓拍機實測可達55FPS,可靈活搭載視覺模型應(yīng)用于安防監(jiān)控、工業(yè)質(zhì)檢、氣象監(jiān)控等場景。目前,三款產(chǎn)品方案均已在百度AI市場上線。同時,EdgeBoard高性能計算卡本次活動上也面向開發(fā)者推出了直減1000元的活動,在邊緣高性能計算場景為開發(fā)者提供更優(yōu)惠的價格探索應(yīng)用。

百度大腦開放日NLP專場 感受技術(shù)如何讓機器更“懂”人類

語音自訓(xùn)練平臺在原有搜索模型、輸入法模型的基礎(chǔ)上,本次進一步支持了呼叫中心語音識別模型的自訓(xùn)練,支持智能客服場景實時語音識別和音頻文件轉(zhuǎn)寫場景應(yīng)用。智能創(chuàng)作平臺也迎來了2.0版本的全新升級。

在深度學(xué)習(xí)平臺方面,源于產(chǎn)業(yè)實踐的開源深度學(xué)習(xí)平臺飛槳(PaddlePaddle)此次主要升級的內(nèi)容包括:核心框架Paddle Fluid v1.5版本發(fā)布,PaddleNLP,PaddleCV,發(fā)布動態(tài)圖,訓(xùn)練性能優(yōu)化;工具組件PaddleHub新增29個預(yù)訓(xùn)練模型、發(fā)布圖學(xué)習(xí)框架PGL Preview版。其中,PaddleNLP作為百度大腦工業(yè)級NLP開源工具與預(yù)訓(xùn)練模型集,具備了中文詞法分析、文本情感分類等10項NLP應(yīng)用任務(wù),并且網(wǎng)絡(luò)可靈活調(diào)整,場景也可高效遷移,具備業(yè)內(nèi)領(lǐng)先的語義表示模型,可實現(xiàn)工業(yè)級的靈活應(yīng)用,它也是當(dāng)前業(yè)內(nèi)最大的工業(yè)訓(xùn)練集。

AI Studio是基于飛槳(PaddlePaddle)的深度學(xué)習(xí)在線實訓(xùn)與教育平臺,面向個人開發(fā)者提供在線編程環(huán)境、免費GPU算力、海量開源算法和開放數(shù)據(jù),幫助開發(fā)者快速創(chuàng)建和部署模型,同時提供比賽環(huán)境, 供各路選手脫穎而出。AI Studio全新功能升級包括:上線圖形化編程,可用圖形拖拽方式構(gòu)建模型訓(xùn)練過程,并生成可執(zhí)行代碼方便學(xué)習(xí)和調(diào)整;NoteBook在運行監(jiān)控等方面也進行了體驗升級;在算力方面,GPU下配套環(huán)境的CPU升至8核, 內(nèi)存升至32GB。

為了幫助開發(fā)者更好地上手和應(yīng)用深度學(xué)習(xí)技術(shù), 百度大腦AI Studio億元算力支持計劃也在進一步擴容, 增加更多的計算資源。不論是一人一卡模式,還是遠程集群模式,都將為開發(fā)者們提供大量的免費算力資源,普惠開發(fā)者, 以促進行業(yè)更好發(fā)展。同時,每年舉辦10余場賽事的百度AI Studio人工智能競賽也在火熱招募中,總獎金超百萬元。

NLP技術(shù)領(lǐng)先 智能創(chuàng)作讓內(nèi)容創(chuàng)作者更輕松

百度大腦開放日第四期首次迎來NLP專場,百度自然語言處理部副總監(jiān)忻舟為參會的開發(fā)者們詳解了有關(guān)百度大腦NLP技術(shù)以及應(yīng)用實踐。央視網(wǎng)、國美零售、縱橫文學(xué)的相關(guān)技術(shù)負責(zé)人也分別通過實際案例,與大家分享了企業(yè)如何通過百度大腦NLP能力的賦能,實現(xiàn)自身業(yè)務(wù)的智能化演進。

百度大腦開放日NLP專場 感受技術(shù)如何讓機器更“懂”人類

據(jù)忻舟在會上介紹,作為百度大腦開放AI能力的重要組成部分,百度大腦語言與知識技術(shù)擁有最大的多元語義知識圖譜以及最好的中文語義表示模型,目前可提供30+項技術(shù)工具,囊括了文本審核、機器翻譯、語言生成等多項能力,服務(wù)方式多樣、靈活、可定制,含有多套場景技術(shù)方案。

現(xiàn)場還介紹了可持續(xù)學(xué)習(xí)語義理解框架ERNIE 2.0和基于此框架的ERNIE 2.0預(yù)訓(xùn)練模型。ERNIE2.0可通過建模海量數(shù)據(jù)中的詞、實體及實體關(guān)系,學(xué)習(xí)真實世界的語義知識,目前累計學(xué)習(xí)超過10億條知識,已在百度眾多產(chǎn)品應(yīng)用中顯現(xiàn)效果。根據(jù)測試對比,ERNIE2.0在16個中英文任務(wù)上表現(xiàn)優(yōu)于BERT和XLNet。

而此次重點介紹的智能創(chuàng)作平臺2.0,正是集合了百度領(lǐng)先的自然語言處理、知識圖譜以及大數(shù)據(jù)技術(shù),可實現(xiàn)自動創(chuàng)作、輔助創(chuàng)作等功能。具體而言,智能創(chuàng)作平臺2.0在創(chuàng)作前,能夠提供實時領(lǐng)域熱點、地域熱點信息,同時對TOP熱點事件提供Topic實時熱度分析;創(chuàng)作中,能夠預(yù)置素材數(shù)據(jù),提供多模素材推薦,同時進行實時智能糾錯;創(chuàng)作后,能夠自動審校、自動標簽分類,生成自動摘要,提供用詞潤色建議及多模發(fā)布功能。整個創(chuàng)作過程可節(jié)約大概80%的時間。

百度大腦開放日NLP專場 感受技術(shù)如何讓機器更“懂”人類

央視網(wǎng)技術(shù)事業(yè)群副總經(jīng)理朱立松在現(xiàn)場分享時表示:“當(dāng)前傳統(tǒng)視頻生產(chǎn)運營面臨著智能化生產(chǎn)、信息風(fēng)險管控、內(nèi)容創(chuàng)新等挑戰(zhàn),中央電視總臺就人工智能賦能新媒體做出了大量的探索與嘗試,而NLP技術(shù)是自動文摘、文本挖掘(文本分類)、信息檢索等AI應(yīng)用的基礎(chǔ)。” 朱立松還透露,央視網(wǎng)已經(jīng)與百度合作,共建人工智能媒體研發(fā)中心,聯(lián)合打造媒體產(chǎn)業(yè)人工智能產(chǎn)品,包括智能創(chuàng)作、智能分析、智能審核、智能搜索、智能推薦等。

國美零售控股國美管家技術(shù)總監(jiān)高旭介紹,借助百度大腦NLP的情感傾向分析功能與評論觀點抽取功能,國美上線了“服務(wù)評分智能化解決方案”,可自動分析用戶評論并自動處理:“百度大腦在這套智能評分平臺的效果準確率很高,現(xiàn)在國美客服運營人力需求從一天5人降低到3人,負面問題處理率從60%飆升至100%,售后師傅的差評率也整體降低了7%。”

縱橫文學(xué)產(chǎn)品總監(jiān)張皓也肯定了百度大腦NLP對內(nèi)容產(chǎn)業(yè)的價值。在接入了文本審核能力之后,機器初審替代人工評級,審核速度由每人每天60萬字提升到600萬字,并且對于風(fēng)險內(nèi)容和問題章節(jié)能夠及時處理,只要兩人就能完成。“百度大腦NLP文本審核的優(yōu)點在于,詞庫、審核力度、監(jiān)控維度都可以自定義,對內(nèi)容平臺管理而言相當(dāng)靈活。”張皓說。

百度大腦開放日NLP專場 感受技術(shù)如何讓機器更“懂”人類

(從左至右:央視網(wǎng)技術(shù)事業(yè)群副總經(jīng)理朱立松、國美管家技術(shù)總監(jiān)高旭、縱橫文學(xué)產(chǎn)品總監(jiān)張皓)

近年來,AI已經(jīng)被廣泛應(yīng)用到各個領(lǐng)域,而NLP技術(shù)的發(fā)展讓機器更懂人的語言和知識,不斷的場景落地應(yīng)用,也在進一步推動人機交互走向一個新的時代。在產(chǎn)業(yè)智能化的大時代背景下AI技術(shù)必須與千行萬業(yè)、多種產(chǎn)業(yè)實體相結(jié)合,像潤滑劑一樣融入行業(yè)的生產(chǎn)核心領(lǐng)域,從而起到激發(fā)生產(chǎn)效率,為行業(yè)提質(zhì)增效的目標。未來,百度大腦也將聚焦更多行業(yè)領(lǐng)域,通過AI技術(shù)在產(chǎn)業(yè)中的落地,推導(dǎo)出AI對社會經(jīng)濟的促進作用,最大化發(fā)揮AI技術(shù)價值與AI企業(yè)能動性。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2019-07-31
百度大腦開放日NLP專場 感受技術(shù)如何讓機器更“懂”人類
7月31日,第四期百度大腦開放日在北京中關(guān)村創(chuàng)業(yè)大街百度大腦創(chuàng)新體驗中心舉行,迎來首次NLP專場。

長按掃碼 閱讀全文