百度世界2020再曝百度知識圖譜最新進(jìn)展:已覆蓋100多個行業(yè)場景

知識圖譜是機(jī)器認(rèn)知世界的基礎(chǔ),是AI進(jìn)步的階梯。9月15日,百度世界2020大會以線上直播的形式召開,會上驚喜亮相的具有認(rèn)知能力的虛擬人,一度引發(fā)眾多開發(fā)者、媒體的熱議,而這背后離不開百度AI“知識”的賦能。主論壇上,百度CTO王海峰在致辭中提到:“百度構(gòu)建了世界上最大規(guī)模的知識圖譜,擁有超過50億實(shí)體,5500億事實(shí),能夠通過語言、聽覺、視覺等獲得對世界的統(tǒng)一認(rèn)知,突破了實(shí)際應(yīng)用中場景復(fù)雜多變、數(shù)據(jù)稀缺等難題。”

image.png

(百度知識圖譜部、大數(shù)據(jù)部高級總監(jiān)朱勇)

在當(dāng)天下午的百度大腦分論壇上,百度知識圖譜部、大數(shù)據(jù)部高級總監(jiān)朱勇也從技術(shù)層面詳細(xì)介紹了百度知識圖譜的最新進(jìn)展:全新升級了多模態(tài)語義理解技術(shù),可以支撐更加復(fù)雜的應(yīng)用場景;百度知識中臺提供的一站式解決方案,可助力企業(yè)提升運(yùn)行效率和決策智能化水平。目前,百度知識圖譜技術(shù)產(chǎn)品已覆蓋100多個行業(yè)場景,每天的調(diào)用次數(shù)超過400億次,在包括醫(yī)療、金融、能源等多個行業(yè)領(lǐng)域廣泛落地。再一次全方位展現(xiàn)了百度大腦在知識圖譜技術(shù)領(lǐng)域的領(lǐng)先地位。

世界規(guī)模最大的知識圖譜再度全面升級

百度構(gòu)建了世界上最大規(guī)模的知識圖譜,除了基礎(chǔ)的由實(shí)體、屬性、關(guān)系構(gòu)成的通用圖譜之外,百度還針對不同的應(yīng)用場景和知識形態(tài),構(gòu)建了事件圖譜、多媒體圖譜、行業(yè)知識圖譜等多種圖譜。

具體而言,在通用圖譜方面提出了基于深度自注意力機(jī)制的知識表示框架,通過深度自注意力網(wǎng)絡(luò)對知識圖譜中的實(shí)體和關(guān)系進(jìn)行連續(xù)向量表示,在此基礎(chǔ)上,進(jìn)一步引入預(yù)訓(xùn)練語言模型助力結(jié)構(gòu)化知識表示,二元關(guān)系推理能力全面超越現(xiàn)有方法,語言學(xué)知識圖譜上提升尤為顯著。此外,利用多元關(guān)系異構(gòu)圖表示,實(shí)現(xiàn)了簡單知識表示到復(fù)雜知識表示的躍遷,多元關(guān)系推理效果大幅提升,關(guān)鍵指標(biāo)平均提升10%+。

image.png

在關(guān)系抽取技術(shù)上,提出了基于文本圖譜聯(lián)合預(yù)訓(xùn)練的關(guān)系抽取,通過聯(lián)合文本語境與圖譜路徑,共同推斷實(shí)體間的語義關(guān)系,從而大幅提升關(guān)系抽取效果。目前,關(guān)系抽取在公開數(shù)據(jù)集上達(dá)到了業(yè)界最好的效果。

image.png

在事件圖譜方面,百度已經(jīng)形成了事件檢測、事件表示、事件抽取、事件關(guān)系挖掘等核心能力,可實(shí)現(xiàn)分鐘級檢測熱點(diǎn)、構(gòu)建了包含4000多種事件類型、千萬量級的事件庫,并發(fā)布了業(yè)界規(guī)模最大的中文事件抽取數(shù)據(jù)集DuEE,助力業(yè)界事件抽取技術(shù)的發(fā)展。百度還研發(fā)了事理圖譜,包括事件抽象、事理表示、事理挖掘?yàn)楹诵牡年P(guān)鍵技術(shù),形成了數(shù)十萬事理節(jié)點(diǎn)、160多萬的事理關(guān)系。在真實(shí)的應(yīng)用場景中,實(shí)現(xiàn)了從具體事件到抽象事件的知識的跨越。

image.png

除此之外,還全新升級了多模態(tài)語義理解技術(shù),可以支撐更加復(fù)雜的應(yīng)用場景。同時,通過多模態(tài)預(yù)訓(xùn)練技術(shù)和跨模態(tài)語義對齊與計算技術(shù),實(shí)現(xiàn)了視頻語義理解的跨領(lǐng)域知識遷移,在真實(shí)的行業(yè)視頻搜索的場景中取得了超過92%的檢索精度。

知識圖譜賦能千行萬業(yè)智能化發(fā)展

知識圖譜對于 AI基礎(chǔ)技術(shù)領(lǐng)域的研究具有重大意義,同時在行業(yè)落地、產(chǎn)業(yè)智能化當(dāng)中也發(fā)揮著重要作用。隨著行業(yè)對知識圖譜的需求越來越多,在知識圖譜構(gòu)建上,百度面向行業(yè)客戶提供了行業(yè)知識圖譜一體化的服務(wù)。

據(jù)朱勇介紹,這整套完整的行業(yè)知識圖譜的技術(shù)體系有三個主要的特點(diǎn):第一,專業(yè)性強(qiáng),行業(yè)知識圖譜技術(shù)面向行業(yè)內(nèi)的專業(yè)復(fù)雜知識,實(shí)現(xiàn)了基于超圖的知識表達(dá);第二,構(gòu)建效率高,支持低資源的學(xué)習(xí)機(jī)制,人機(jī)協(xié)同的圖譜構(gòu)建相對于傳統(tǒng)的人工構(gòu)建方法,效率提升百倍以上;第三,具有很強(qiáng)的可遷移性,實(shí)現(xiàn)了從通用到行業(yè),以及跨行業(yè)的多層次遷移學(xué)習(xí),目前已經(jīng)覆蓋了100多個行業(yè)的應(yīng)用場景。

image.png

其實(shí),在行業(yè)知識圖譜的技術(shù)基礎(chǔ)上,早在今年5月的百度云智峰會上還發(fā)布了基于百度多年積累的知識圖譜、自然語言處理、多模態(tài)語義理解、智能搜索等 AI核心技術(shù)打造的知識中臺,提供面向企業(yè)知識應(yīng)用全生命周期的一站式解決方案。知識中臺可以幫助企業(yè)高效地生產(chǎn)知識、靈活地組織知識、便捷的獲取知識、智能地應(yīng)用知識,從而全面提升企業(yè)運(yùn)行效率和決策的智能化水平。

例如,基于醫(yī)療知識中臺快速構(gòu)建的醫(yī)學(xué)專業(yè)知識體系,可提供具備輔助診斷、醫(yī)療質(zhì)控、合理用藥、健康管理等能力的智慧醫(yī)療解決方案,有效降低了32%的基層試點(diǎn)區(qū)域誤診/漏診率;攔截了大于90%的不合理用藥;對比人工檢查效率提升超20倍。據(jù)悉,目前百度的智慧醫(yī)療產(chǎn)品已實(shí)現(xiàn)規(guī)?;涞兀?wù)數(shù)萬名醫(yī)生,觸達(dá)27個省市自治區(qū)300多家醫(yī)院,超過1500多家基層醫(yī)療機(jī)構(gòu)。

另外一個典型的場景是智慧法律,在類案檢索方面,類案推薦準(zhǔn)確率超過90%,與過去相比結(jié)案率提高一倍以上;而在要素提取方面,不僅降低了人工處理卷宗的成本,庭審案件要素分析技術(shù)點(diǎn)平均準(zhǔn)確率達(dá)到90%,召回率為85%。此外,在能源電力、司法庭審、企業(yè)辦公等領(lǐng)域,百度知識圖譜也均已廣泛落地。目前,知識圖譜每天的調(diào)用次數(shù)超過了400億次。

正如王海峰所言:“在百度語言與知識技術(shù)的布局和發(fā)展中,我們始終在注意把握兩個趨勢,即技術(shù)發(fā)展趨勢和產(chǎn)業(yè)發(fā)展趨勢,并力爭引領(lǐng)趨勢?!卑俣仍谡Z言與知識領(lǐng)域的十年技術(shù)積累和產(chǎn)業(yè)實(shí)踐,都在不斷加速著產(chǎn)業(yè)智能化進(jìn)程。同時,也讓業(yè)界看到百度在前瞻技術(shù)上的每一次突破,無不彰顯著百度背后的技術(shù)戰(zhàn)略與實(shí)力。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )