說到人工智能技術(shù),人們首先會(huì)聯(lián)想到深度學(xué)習(xí)、機(jī)器學(xué)習(xí)技術(shù);談到人工智能應(yīng)用,人們很可能會(huì)馬上想起語音助理、自動(dòng)駕駛等等,不過,在AI World 2017世界人工智能大會(huì)上,百度副總裁、AI技術(shù)平臺(tái)體系(AIG)總負(fù)責(zé)人王海峰卻沒有講這些,這次他聊的是知識(shí)圖譜。
雖然你可能說不出知識(shí)圖譜的具體定義,但其實(shí)每天都在使用它。當(dāng)你在百度搜索時(shí),搜索結(jié)果右側(cè)的聯(lián)想,就來自于知識(shí)圖譜技術(shù)的應(yīng)用;你問百度某個(gè)字怎么念,答案也來自知識(shí)圖譜的應(yīng)用;你和度秘聊天,問他詹姆斯和科比誰厲害、都取得了哪些成就等等,背后都是知識(shí)圖譜在發(fā)揮作用……王海峰在演講中甚至表示,百度搜索、地圖、金融……越來越多的應(yīng)用,都越來越依賴知識(shí)圖譜。
聽完王海峰的演講,我的第一個(gè)反應(yīng)就是:知識(shí)圖譜的價(jià)值被行業(yè)低估了,各行各業(yè)都在研發(fā)底層技術(shù)和尋求AI場景,卻忽視了最成熟也很重要的AI技術(shù):知識(shí)圖譜。
知識(shí)圖譜跟人工智能有什么關(guān)系?
知識(shí)圖譜不難理解——就是通過不同知識(shí)的關(guān)聯(lián)性形成成一個(gè)網(wǎng)狀的知識(shí)結(jié)構(gòu),對機(jī)器來說就是圖譜,形成知識(shí)圖譜的過程本質(zhì)是在建立認(rèn)知,理解世界,理解應(yīng)用的行業(yè)或者說領(lǐng)域,每個(gè)人都有自己的知識(shí)面,或者說知識(shí)結(jié)構(gòu),本質(zhì)就是不同的知識(shí)圖譜,正是因?yàn)橛蝎@取和形成知識(shí)的能力,人類才可以不斷進(jìn)步。
王海峰認(rèn)為,知識(shí)圖譜對于人工智能的重要價(jià)值在于,知識(shí)是人工智能的基石。機(jī)器可以模仿人類的視覺、聽覺等感知能力,但這種感知能力不是人類的專屬,動(dòng)物也具備感知能力,甚至某些感知能力比人類更強(qiáng),比如狗的嗅覺。而 “認(rèn)知語言是人區(qū)別于其他動(dòng)物的能力,同時(shí),知識(shí)也使人不斷地進(jìn)步,不斷地凝練、傳承知識(shí),是推動(dòng)人不斷進(jìn)步的重要基礎(chǔ)。” 而知識(shí)對于人工智能的價(jià)值就在于,讓機(jī)器具備認(rèn)知能力。
知識(shí)對于AI的價(jià)值,王海峰的總結(jié)是兩者結(jié)合可以正循環(huán):
“有了知識(shí)的人工智能會(huì)變得更強(qiáng)大,可以做更多的事情。反過來,因?yàn)楦鼜?qiáng)大的人工智能,可以幫我們更好地從客觀世界中去挖掘、獲取和沉淀知識(shí),這些知識(shí)和人工智能系統(tǒng)形成正循環(huán),兩者共同進(jìn)步?!?/p>
在此之前,人工智能的基礎(chǔ)是什么?行業(yè)有不同聲音,比如馬云說數(shù)據(jù)就是未來的能源,與云計(jì)算和互聯(lián)網(wǎng)一起構(gòu)成智能世界的基礎(chǔ);李彥宏說算法很重要,數(shù)據(jù)秒殺算法;馬化騰說AI的四個(gè)要素是數(shù)據(jù)、場景、計(jì)算力和人才。總體來說,數(shù)據(jù)和算法是大家認(rèn)為比較基礎(chǔ)的東西。王海峰從技術(shù)層面將將AI核心技術(shù)分為感知層與認(rèn)知層,提出認(rèn)知層的基礎(chǔ)是知識(shí)的觀點(diǎn),與行業(yè)的看法并不矛盾。因?yàn)橹R(shí)圖譜的基礎(chǔ),就是數(shù)據(jù)和算法,它需要應(yīng)用自然語言處理和深度學(xué)習(xí)技術(shù)來進(jìn)行數(shù)據(jù)挖掘,在海量知識(shí)中找出關(guān)聯(lián)性,形成圖譜。
為什么王海峰如此重視知識(shí)圖譜技術(shù)?
構(gòu)建知識(shí)圖譜這個(gè)過程的本質(zhì),就是讓機(jī)器形成認(rèn)知能力,理解這個(gè)世界。事實(shí)上,現(xiàn)在機(jī)器的感知能力已經(jīng)越來越接近于人類了,語音識(shí)別準(zhǔn)確率達(dá)到97%甚至更高,圖像識(shí)別某些領(lǐng)域如人臉識(shí)別,比人類個(gè)體更加準(zhǔn)確和迅速。所以,未來人工智能的重點(diǎn)進(jìn)步方向?qū)⑹钦J(rèn)知層,機(jī)器理解這個(gè)世界,才能更好地與世界交互,為人類服務(wù)。百度是中國最積極和大力布局人工智能的科技巨頭,作為百度人工智能技術(shù)體系的最高負(fù)責(zé)人,王海峰重視知識(shí)圖譜也表明百度未來會(huì)強(qiáng)化機(jī)器認(rèn)知能力。
當(dāng)然,王海峰為什么如此重視知識(shí)圖譜,還有兩層不容忽視的原因。
第一,王海峰本人的研究方向和從業(yè)經(jīng)歷決定他是務(wù)實(shí)派。
王海峰不是從研究學(xué)者轉(zhuǎn)型而來的技術(shù)管理者,而是學(xué)術(shù)和工程并舉,從實(shí)踐中成長起來的科學(xué)家。王海峰2010年加入百度時(shí),這一輪AI熱還沒爆發(fā),即便是最早布局AI的百度,成立深度學(xué)習(xí)實(shí)驗(yàn)室也是在2013年。王海峰加入百度后,先后為百度創(chuàng)建了自然語言處理部、互聯(lián)網(wǎng)數(shù)據(jù)研發(fā)部(包括知識(shí)圖譜和互聯(lián)網(wǎng)數(shù)據(jù)挖掘)、推薦引擎和個(gè)性化部、多媒體部(包括語音和圖像技術(shù))、圖片搜索部、語音技術(shù)部等。
不難發(fā)現(xiàn),百度最核心的AI相關(guān)技術(shù)王海峰都有經(jīng)手甚至牽頭主導(dǎo),與自動(dòng)駕駛等技術(shù)的不同之處在于,這些技術(shù)都是直接影響上億用戶的應(yīng)用型技術(shù),而且相當(dāng)一部分與知識(shí)圖譜有直接或間接關(guān)系。2013年上半年,王海峰作為執(zhí)行負(fù)責(zé)人協(xié)助創(chuàng)建了百度深度學(xué)習(xí)研究院(IDL),百度正式進(jìn)入AI行業(yè),他此前幾年為百度布局的技術(shù),為百度進(jìn)入AI領(lǐng)域打下了基礎(chǔ)。我想正是這幾年讓王海峰的技術(shù)研發(fā)更偏應(yīng)用性,注重實(shí)用價(jià)值,今天提出“知識(shí)圖譜對AI是基石”也許與這個(gè)思維方式有關(guān)系。
王海峰在學(xué)術(shù)上也居于大師級(jí)地位。在自然語言處理領(lǐng)域,他是世界上影響力最大的國際學(xué)術(shù)組織ACL(計(jì)算語言學(xué)協(xié)會(huì))最年輕的會(huì)士,也是ACL 50多年來唯一的華人主席。百度搜索、翻譯、語音、輸入法以及知識(shí)圖譜等等產(chǎn)品,都是基于NLP技術(shù)。因?yàn)樵谌斯ぶ悄苌系某删?,王海峰在今?月還獲得了國家級(jí)科技獎(jiǎng)“全國創(chuàng)新爭先獎(jiǎng)”。
無論是作為百度AIG的負(fù)責(zé)人,還是學(xué)術(shù)大師,王海峰看重知識(shí)圖譜的價(jià)值都不奇怪。
第二,百度很早便在知識(shí)圖譜上進(jìn)行布局,儲(chǔ)備充分。
百度很早就在研發(fā)知識(shí)圖譜技術(shù)。2014年開始,百度在搜索中將知識(shí)圖譜產(chǎn)品規(guī)?;瘧?yīng)用,3年應(yīng)用量增加了160倍,百度的知識(shí)圖譜的知識(shí)點(diǎn)已經(jīng)達(dá)到幾個(gè)億;在技術(shù)層面,百度知識(shí)圖譜技術(shù)已經(jīng)實(shí)現(xiàn)了動(dòng)態(tài)技術(shù),每天有幾百個(gè)數(shù)據(jù)流同時(shí)工作,支持秒級(jí)更新和多層查詢。世界是變化的,百度知識(shí)圖譜對世界的認(rèn)知也是變化的,動(dòng)態(tài)知識(shí)圖譜,需要很強(qiáng)的數(shù)據(jù)、算法和計(jì)算基礎(chǔ)。
百度知識(shí)圖譜不只是被應(yīng)用在搜索系產(chǎn)品中(包含問答、百科等),DuerOS、信息流、甚至以圖搜圖,都在應(yīng)用知識(shí)圖譜。王海峰在演講中透露,百度知識(shí)圖譜已經(jīng)應(yīng)用到幾十個(gè)領(lǐng)域。我記得2015年,百度還將知識(shí)圖譜應(yīng)用在股票領(lǐng)域,旗下產(chǎn)品股市通通過數(shù)據(jù)、信息與股票的關(guān)系,以及股票與股票之間的關(guān)系,在股票領(lǐng)域首創(chuàng)知識(shí)圖譜,實(shí)現(xiàn)智能選股。
可以說,百度在知識(shí)圖譜上已經(jīng)在數(shù)據(jù)、算法、計(jì)算和場景上形成了優(yōu)勢,這也是百度被嚴(yán)重低估的一個(gè)優(yōu)勢。算法、數(shù)據(jù)、計(jì)算力,每家公司都有,但在知識(shí)上百度卻是積累最豐富的,不只是狹義的百科、知道、文庫等等知識(shí)產(chǎn)品,搜索引擎與用戶交互的過程本身也是在完善知識(shí)體系。所以百度自然要用其擅長的知識(shí)圖譜,去強(qiáng)化在AI領(lǐng)域的優(yōu)勢,尤其是機(jī)器認(rèn)知能力和應(yīng)用價(jià)值。
知識(shí)圖譜成為AI應(yīng)用行業(yè)的先決條件
人工智能已受到各行各業(yè)的關(guān)注,不只是BAT在戰(zhàn)略投資人工智能,金融、汽車、零售、娛樂、制造等等行業(yè)都在積極擁抱人工智能技術(shù)。然而,人工智能要在行業(yè)中得到應(yīng)用的先決條件,首先要對行業(yè)建立起認(rèn)知,只有理解了行業(yè)和場景,才能真正智能化。說白了,就是要建立行業(yè)知識(shí)圖譜,才能給行業(yè)AI方案。
一個(gè)例子是零售行業(yè),如果真要實(shí)現(xiàn)個(gè)性化的商品推薦,機(jī)器必須理解不同商品的特性,以及商品與銷售場景(如季節(jié)、地區(qū)、時(shí)段)、與促銷行為(打折、送券)、與用戶需求之間的關(guān)系,才能推薦滿足用戶需求的產(chǎn)品。這也是一個(gè)優(yōu)秀的推銷員或商場導(dǎo)購的思考邏輯。然而,要理解這些要素之間的聯(lián)系,就必須構(gòu)建零售行業(yè)的知識(shí)圖譜,且需要不斷動(dòng)態(tài)學(xué)習(xí)來完善認(rèn)知,才能進(jìn)行有效的推薦,這就是“零售知識(shí)圖譜”。當(dāng)然,針對不同的零售細(xì)分領(lǐng)域,比如美妝、3C、食品等,可能又要建立完全不同的知識(shí)圖譜,就像人類社會(huì)的細(xì)分一樣,在每個(gè)行業(yè)都建立起特有的知識(shí)圖譜。
類似邏輯同樣適用于客服、金融、制造、娛樂等場景,總而言之,人工智能要在一個(gè)行業(yè)得到應(yīng)用的前提,就是要讓機(jī)器建立起對應(yīng)行業(yè)的認(rèn)知,形成行業(yè)知識(shí)圖譜。王海峰在演講中也指出,
“人工智能與傳統(tǒng)產(chǎn)業(yè)融合的過程中,要想為這個(gè)行業(yè)提供更好的服務(wù),就需要對這個(gè)行業(yè)進(jìn)行定制化,要有行業(yè)知識(shí),這時(shí)候就需要在通用知識(shí)圖譜的基礎(chǔ)上,有相應(yīng)的行業(yè)知識(shí)圖譜,進(jìn)而幫助這個(gè)行業(yè)提升生產(chǎn)力,幫助這些行業(yè)、產(chǎn)業(yè)升級(jí)?!?/p>
王海峰的邏輯,也是未來人工智能走向應(yīng)用的必經(jīng)之路:機(jī)器通過人工智能技術(shù)與用戶的互動(dòng),從中獲取數(shù)據(jù)、優(yōu)化算法,更重要的是構(gòu)建和完善知識(shí)圖譜,認(rèn)知和理解世界,進(jìn)而服務(wù)于這個(gè)世界,讓人類的生活更加美好。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個(gè)大計(jì)劃瞄準(zhǔn)AI機(jī)器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費(fèi)引熱議
- 消息稱塔塔集團(tuán)將收購和碩印度iPhone代工廠60%股份 并接管日常運(yùn)營
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達(dá)新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關(guān)注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號(hào)發(fā)布,意外泄露引發(fā)關(guān)注
- 無人機(jī)“黑科技”亮相航展:全球首臺(tái)低空重力測量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機(jī)器人合作
- 賽力斯觸及漲停,汽車整車股盤初強(qiáng)勢拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。