10月28日,由網(wǎng)易科技和網(wǎng)易智能主辦的第七季“網(wǎng)易開物沙龍”在杭州浙江大學(xué)召開,本次沙龍的主題為“AI將引發(fā)生活大爆炸?”。會(huì)上,網(wǎng)易杭州研究院執(zhí)行院長(zhǎng)汪源發(fā)表了關(guān)于人工智能發(fā)展的演講。
汪源認(rèn)為,當(dāng)前人工智能技術(shù)發(fā)展分為三個(gè)層次,第一個(gè)層次是底層的平臺(tái)層,包括深度學(xué)習(xí)平臺(tái)。中間的層次是能力層,云計(jì)算、自然語(yǔ)言處理、視覺處理等技術(shù)處于能力層中。第三個(gè)層次是應(yīng)用層,人工智能各種落地的應(yīng)用產(chǎn)品在這一層次中。中間的能力層是當(dāng)前人工智能公司主要的發(fā)力點(diǎn)。
對(duì)于人工智能在工程領(lǐng)域應(yīng)用的看法,他認(rèn)為所有的人工智能都是從語(yǔ)音識(shí)別,到圖像識(shí)別再到自然語(yǔ)言處理。在實(shí)際應(yīng)用場(chǎng)景中,一個(gè)通用的處理技術(shù),比如語(yǔ)音識(shí)別,在應(yīng)用到特定場(chǎng)景里的時(shí)候,可能達(dá)不到較好的使用效果。在自然語(yǔ)言處理方面,以客服機(jī)器人舉例,基于傳統(tǒng)知識(shí)庫(kù)的客服機(jī)器人不是真正意義上的人工智能解決方案,只是通過(guò)問(wèn)題來(lái)檢索知識(shí)庫(kù)。客服機(jī)器人要解決多輪對(duì)話的問(wèn)題,涉及到M的機(jī)制、A的機(jī)制,同時(shí)也要解決知識(shí)領(lǐng)域的一些問(wèn)題,客服機(jī)器人實(shí)際上是知識(shí)庫(kù)的動(dòng)態(tài)學(xué)習(xí),以上這些機(jī)制是為了提高知識(shí)庫(kù)學(xué)習(xí)的效率。
汪源表示,圖像識(shí)別的應(yīng)用場(chǎng)景同文本識(shí)別的原理相似,傳統(tǒng)方法在圖片過(guò)濾應(yīng)用中解決不了的問(wèn)題,通過(guò)深度學(xué)習(xí)的方式可以做到非常精準(zhǔn)。以網(wǎng)易的圖片鑒黃為例,之前需要一些鑒黃師手動(dòng)篩選,現(xiàn)在依靠深度學(xué)習(xí)的算法能夠做到99.8%的準(zhǔn)確率。
最后,汪源稱當(dāng)前網(wǎng)易的近萬(wàn)名開發(fā)工程師需要用到機(jī)器學(xué)習(xí)、深度學(xué)習(xí)來(lái)解決很多問(wèn)題,機(jī)器學(xué)習(xí)的能力需要民主化,讓更多的工程師享受到這一技術(shù)成果帶來(lái)的紅利,同時(shí)語(yǔ)音識(shí)別、圖像識(shí)別和智能創(chuàng)作等更多的領(lǐng)域需要應(yīng)用深度學(xué)習(xí)。
以下為演講實(shí)錄:
汪源:剛才吳院長(zhǎng)高瞻遠(yuǎn)矚,然后講了很多人工智能激動(dòng)人心的前沿的一些課題。網(wǎng)易作為一家公司,比較側(cè)重于注重技術(shù)跟業(yè)務(wù)相結(jié)合,所以我講的東西可能會(huì)比較落地、比較實(shí)際,沒(méi)有特別高大上的一些話題,我們可能會(huì)先樹立一些小目標(biāo),先解決一些小問(wèn)題。
先總體上給大家介紹一下網(wǎng)易在人工智能做的相關(guān)工作,分成五六個(gè)部分。
第一個(gè)是介紹一下網(wǎng)易杭州研究院的定位。研究院是06年成立,我剛好在成立的時(shí)候進(jìn)入研究院。網(wǎng)易杭州研究院負(fù)責(zé)創(chuàng)新業(yè)務(wù)的孵化,同時(shí)也負(fù)責(zé)給整個(gè)公司提供公共的基礎(chǔ)平臺(tái)的支撐。這個(gè)機(jī)制還是比較特殊的,在國(guó)內(nèi)互聯(lián)網(wǎng)企業(yè)中,唯有網(wǎng)易杭州研究院兼具產(chǎn)品、運(yùn)維和公共技術(shù)平臺(tái)三重職能和唯一性,為互聯(lián)網(wǎng)技術(shù)研究提供了得天獨(dú)厚的條件。
對(duì)于我來(lái)講,我要為公司的業(yè)務(wù)提供非常多的技術(shù)支撐,從高大上的人工智能,到不太高大上的質(zhì)量保障都得做。質(zhì)量保障我們也跟人工智能做了相應(yīng)的很好的結(jié)合。
整個(gè)網(wǎng)易杭州研究院主要負(fù)責(zé)構(gòu)建的是互聯(lián)網(wǎng)的技術(shù)體系,七大技術(shù)體系里面其中一個(gè)就是多媒體以及人工智能方向,所以今天講的主要是人工智能方向我們做的一些工作。
這張圖可以囊括一下我們現(xiàn)在人工智能方向主要的工作,其實(shí)人工智能是一個(gè)非常基礎(chǔ)的技術(shù),我在這張圖里面大概做了一個(gè)概括。這里面可以看到分成三個(gè)層次,第一個(gè)層次在底層是平臺(tái)層,包括深度學(xué)習(xí)的一個(gè)平臺(tái)。中間這個(gè)層次是能力層,云的技術(shù)、自然語(yǔ)言處理的技術(shù)、智能頭像處理的技術(shù)。第三個(gè)是應(yīng)用層,應(yīng)用在網(wǎng)易云、游戲、有道翻譯等產(chǎn)品里面,對(duì)公司來(lái)講我們從三個(gè)層面,從品牌、能力最后到應(yīng)用的場(chǎng)景,今天主要從中間的能力層展開來(lái)講。
第一塊是語(yǔ)音技術(shù)。網(wǎng)易在語(yǔ)音技術(shù)上為了去解決超大規(guī)模的、上萬(wàn)個(gè)小時(shí)的語(yǔ)音訓(xùn)練問(wèn)題,我們?cè)谠七@一塊就把深度學(xué)習(xí)的一個(gè)平臺(tái)的技術(shù)帶動(dòng)出來(lái)了。
我們大概是在13年的時(shí)候開始做語(yǔ)音識(shí)別,網(wǎng)易在現(xiàn)在所有的游戲、社交、易信這些產(chǎn)品里面都是采用我們自研的語(yǔ)音技術(shù)。具體的應(yīng)用場(chǎng)景最主要的是在手游里面使用量非常大,每天的處理請(qǐng)求量達(dá)到五千萬(wàn),根據(jù)公開的一個(gè)數(shù)據(jù)來(lái)看,這個(gè)量達(dá)到蘋果系統(tǒng)的1/3左右。
這里面我想突出說(shuō)一點(diǎn),這一點(diǎn)也是我們對(duì)人工智能在工程領(lǐng)域應(yīng)用的一個(gè)核心認(rèn)識(shí):所有的人工智能這些能力從語(yǔ)音到圖象到自然語(yǔ)音理解,其實(shí)它都沒(méi)有辦法提供一個(gè)非常通用的解決方案。
所以在語(yǔ)音識(shí)別我們一開始用的是通用的,后來(lái)覺得在游戲里面效果不太理想的,游戲里面涉及到太多跟游戲世界觀相關(guān)的詞匯,還有游戲里面特殊的一些詞。所以我們?cè)谧匝械倪^(guò)程中針對(duì)游戲特定的世界觀進(jìn)行優(yōu)化,獲得比一個(gè)通用的云識(shí)別要高一兩個(gè)點(diǎn)的效果。這個(gè)也是我們?cè)趯?shí)際的場(chǎng)景里面會(huì)不斷的去發(fā)現(xiàn)問(wèn)題。一個(gè)通用的人工智能能力它在應(yīng)用到特定的場(chǎng)景里面的時(shí)候,可能達(dá)不到一個(gè)很好的使用效果。
另外一個(gè)我們?cè)谧龅氖虑?,就是發(fā)音評(píng)測(cè)的工作,主要應(yīng)用在我們有道翻譯里面。
第二塊是自然語(yǔ)言理解方面做的工作,這邊有一些例子,對(duì)于自然語(yǔ)言理解,我們現(xiàn)在主要做的工作是用在客服機(jī)器人的應(yīng)用場(chǎng)景里面。
這邊舉了一些客服機(jī)器人的案例。對(duì)一個(gè)客服機(jī)器人來(lái)講,傳統(tǒng)來(lái)講,它是一個(gè)知識(shí)庫(kù)的一個(gè)檢索的問(wèn)題,傳統(tǒng)方式并不是一個(gè)人工智能的解決方案。這個(gè)用戶體驗(yàn)也是很差的。所以現(xiàn)在你如果要提供一個(gè)用戶體驗(yàn)比較好的客服機(jī)器人,那它需要支持比較智能的多輪對(duì)話的方式。人跟人之間的對(duì)話不是說(shuō)直接一問(wèn)一答問(wèn)題就解決了,它是需要機(jī)器人能夠了解到這個(gè)領(lǐng)域的知識(shí)。我舉個(gè)例子,比如我要打車,我說(shuō)我要打車到浙大紫金港校區(qū),他應(yīng)該知道浙大紫金港校區(qū)是有東門、南門的,它會(huì)追問(wèn)請(qǐng)問(wèn)你到哪個(gè)門,因?yàn)檫@是兩個(gè)不同的點(diǎn),這個(gè)其實(shí)就涉及到領(lǐng)域的知識(shí)。
我很難具體來(lái)講怎么樣從技術(shù)上、細(xì)節(jié)上做到這一點(diǎn),總體來(lái)講對(duì)于大家做客服機(jī)器人,首先要有一種方式解決多輪對(duì)話的問(wèn)題,這里面可能會(huì)涉及到M的機(jī)制、A的機(jī)制,同時(shí)也要解決領(lǐng)域知識(shí)的一些問(wèn)題。這里面就需要用到比如說(shuō)知識(shí)圖譜的方式,還需要針對(duì)特定的一個(gè)行業(yè)去做定制。我們做的像知識(shí)庫(kù)的一個(gè)動(dòng)態(tài)學(xué)習(xí),那這個(gè)機(jī)制是為了能夠提高知識(shí)庫(kù)學(xué)習(xí)的效率,但是并沒(méi)有一個(gè)特別通用的方案可以客服機(jī)器人一下能夠無(wú)所不能,能夠回答所有的問(wèn)題,這是不現(xiàn)實(shí)的。
這個(gè)是文本過(guò)濾。我們的網(wǎng)易新聞?dòng)幸粋€(gè)很好的功能叫跟貼,跟貼其實(shí)就是用戶發(fā)表評(píng)論,我們把它設(shè)計(jì)成蓋樓的方式,但這個(gè)評(píng)論里面會(huì)涉及到非常多垃圾有害信息。我們的人工智能技術(shù)也會(huì)用在這里。UGC的產(chǎn)品里面大量的用戶評(píng)論容易產(chǎn)生不恰當(dāng)?shù)牡胤?,傳統(tǒng)的關(guān)健詞過(guò)濾技術(shù)解決不了復(fù)雜的垃圾變化,比如拆字,各種組合方式。這時(shí)候,通過(guò)自然語(yǔ)言理解,通過(guò)深度學(xué)習(xí)的方式能夠做到比較好的效果。
第三塊智能圖象識(shí)別。智能圖象識(shí)別它的主要應(yīng)用場(chǎng)景跟剛才說(shuō)的文本的識(shí)別、文本的過(guò)濾是類似的。我們有很多產(chǎn)品里面用戶會(huì)曬圖,這個(gè)圖片是不是有不合適的內(nèi)容,里面有爆恐的、不良廣告或者色情的圖像,傳統(tǒng)的方式也解決不了,但是現(xiàn)在通過(guò)深度學(xué)習(xí)的方式也可以做到非常好的,非常精準(zhǔn)的效果。
對(duì)于色情圖片,對(duì)于圖片鑒黃,從06年我開始做研究院工作,06年我們的鑒黃師用什么來(lái)做的?在一個(gè)小黑屋養(yǎng)一堆鑒黃師,那時(shí)候量比較少,很辛苦也很幸福。那個(gè)時(shí)候如果用算法判斷,實(shí)際上是很困難的,比如用簡(jiǎn)單的一些膚色識(shí)別方式是很麻煩的。稍微做一些編輯你又被它逃掉了,而且你的庫(kù)不可能非常全面準(zhǔn)確。所以它的準(zhǔn)確率只有5%。
第二個(gè)階段通過(guò)膚色識(shí)別,準(zhǔn)確率只能做到60%,基本上處于不可用的狀態(tài),還有40%是錯(cuò)誤的,60減40就剩20%,這個(gè)技術(shù)基本上沒(méi)有用。
直到第三代深度學(xué)習(xí)的做法才做到99.8%這樣非常高的準(zhǔn)確率。同時(shí),我們還會(huì)用機(jī)器加人工智能的方式避免誤判。這個(gè)技術(shù)我們現(xiàn)在提供對(duì)外的服務(wù),叫網(wǎng)易易盾。
后面說(shuō)一下我們未來(lái)想做的事情,第一個(gè)進(jìn)一步加強(qiáng)人工智能的深度學(xué)習(xí)平臺(tái),因?yàn)槲覀儸F(xiàn)有非常多的應(yīng)用都需要用到深度學(xué)習(xí)。幾乎每過(guò)一年都會(huì)發(fā)現(xiàn)很多算法會(huì)被深度學(xué)習(xí)代替。比如我們現(xiàn)在在做基于深度學(xué)習(xí)的翻譯,翻譯效果比原來(lái)統(tǒng)計(jì)的翻譯效果會(huì)好很多。對(duì)于網(wǎng)易來(lái)講現(xiàn)在有近萬(wàn)名的開發(fā)工程師,這里面有很多的工程師可能就需要用到機(jī)器學(xué)習(xí),用到深度學(xué)習(xí)解決很多問(wèn)題。我們必須把這個(gè)機(jī)器學(xué)習(xí)的能力普及化,讓大家一些普通的工程師,前期比較優(yōu)秀的工程師都能夠使用這么一個(gè)工具,所以我們會(huì)去做一個(gè)深度學(xué)習(xí)的很便捷的機(jī)器學(xué)習(xí)平臺(tái),這個(gè)對(duì)于網(wǎng)易來(lái)講是一個(gè)非常基礎(chǔ)的工作。
第二個(gè)我們希望在語(yǔ)音識(shí)別、圖像識(shí)別、智能創(chuàng)作這些更多的領(lǐng)域來(lái)去深入應(yīng)用深度學(xué)習(xí)技術(shù)。
我今天的介紹就到這里,謝謝大家。
- F5中國(guó)擁抱未來(lái):三大策略引領(lǐng)AI應(yīng)用,汽車行業(yè)拓展及渠道伙伴拓展
- 小鵬汽車新征程:下半年邁入全場(chǎng)景L3自動(dòng)駕駛,智駕新紀(jì)元正式開啟
- 物質(zhì)豐富社會(huì)缺孩子時(shí)代來(lái)臨:梁建章警告
- 小鵬重返銷量冠軍,推出超值五年分期政策,讓購(gòu)車更輕松!
- 同程旅行發(fā)現(xiàn):跨境返崗更實(shí)惠,春節(jié)后熱門線路選擇新攻略
- 蔚來(lái)汽車公布維權(quán)進(jìn)展:部分侵權(quán)賬號(hào)負(fù)責(zé)人員遭法律制裁,正義終將到來(lái)
- 2025年春節(jié)檔票房達(dá)95.1億,新片《哪吒2》強(qiáng)勢(shì)奪冠,黑馬電影層出不窮
- 蘋果新應(yīng)用“Invites”助你輕松策劃活動(dòng),讓你的聚會(huì)更精彩!
- 谷歌涉嫌壟斷遭調(diào)查,公平競(jìng)爭(zhēng)市場(chǎng)秩序待維護(hù)
- 特斯拉"零息大禮包"送車險(xiǎn),Model 3車主笑開顏,保險(xiǎn)優(yōu)惠超8000元!
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。