網(wǎng)易易盾:以人工智能技術(shù)提升UGC產(chǎn)品內(nèi)容安全

互聯(lián)網(wǎng)發(fā)展至今,已經(jīng)成為人們的必需品。我們無論是在工作還是生活中,都會(huì)使用互聯(lián)網(wǎng)。在Web 2.0時(shí)代,用戶原創(chuàng)內(nèi)容UGC大量出現(xiàn),然而,一些垃圾信息、廣告、色情圖片等內(nèi)容,正破壞著互聯(lián)網(wǎng)的純凈度。

過去,多數(shù)企業(yè)會(huì)采用人工進(jìn)行內(nèi)容審核,然而誤報(bào)率較高,成本也很高,隨著音頻、視頻等流媒體的出現(xiàn),內(nèi)容審核的難度也越來越大。適應(yīng)這種需求,網(wǎng)易今年推出了內(nèi)容反垃圾產(chǎn)品網(wǎng)易易盾,為當(dāng)下解決互聯(lián)網(wǎng)內(nèi)容垃圾方面提供了新思路和新方法。

內(nèi)容反垃圾的重要性:規(guī)避風(fēng)險(xiǎn),提升體驗(yàn)

有數(shù)據(jù)顯示,僅2016年上半年,我國(guó)網(wǎng)民平均每周收到垃圾郵件高達(dá)18.9封、垃圾短信數(shù)量約為20.6條、騷擾電話更是多達(dá)21.3個(gè),緊跟其后的還有惡意電腦廣告彈窗和APP推送。而這些只是在網(wǎng)民體驗(yàn)層面的影響,對(duì)互聯(lián)網(wǎng)服務(wù)尤其是UGC類產(chǎn)品來說,網(wǎng)絡(luò)垃圾的泛濫無疑加重了運(yùn)營(yíng)風(fēng)險(xiǎn)。

(網(wǎng)易易盾總經(jīng)理周森接受記者采訪)

網(wǎng)易易盾的總經(jīng)理周森認(rèn)為,網(wǎng)絡(luò)垃圾帶來的風(fēng)險(xiǎn)主要集中在兩個(gè)方面,一是監(jiān)管,政策法規(guī)的安全,如果UGC產(chǎn)生的內(nèi)容違反了政策法規(guī),企業(yè)就會(huì)面臨關(guān)閉的風(fēng)險(xiǎn);二是用戶體驗(yàn),如果UGC不審核,會(huì)出現(xiàn)很多廣告、灌水、刷屏等現(xiàn)象,對(duì)于用戶體驗(yàn)來說會(huì)造成極大的影響。

既然網(wǎng)絡(luò)垃圾帶來如此大的風(fēng)險(xiǎn),什么樣的企業(yè)需要進(jìn)行內(nèi)容反垃圾呢?周森表示,只要網(wǎng)站上有UGC,就需要審核,進(jìn)行內(nèi)容反垃圾。過去,由于政府的監(jiān)管壓力,大多數(shù)企業(yè)都是自己來做內(nèi)容反垃圾,通過技術(shù)+人工審核的方式實(shí)現(xiàn),成本也相對(duì)比較高。

但是,內(nèi)容反垃圾不是三兩個(gè)人就可以完成的。周森告訴筆者,內(nèi)容反垃圾一般是通過技術(shù)手段以及運(yùn)營(yíng)的流程制度來保證的,需要一定規(guī)模的團(tuán)隊(duì)才能運(yùn)轉(zhuǎn)。通常情況下,審核團(tuán)隊(duì)最少需要7個(gè)人員,7*24小時(shí)運(yùn)轉(zhuǎn)才能保證內(nèi)容審核工作完成。而如今,網(wǎng)絡(luò)垃圾的形式也多種多樣,除了基本的文本、圖片,還有視頻、音頻等多媒體形式,內(nèi)容審核的難度也會(huì)加大,因此,企業(yè)不得不重視內(nèi)容反垃圾。

網(wǎng)易易盾的核心競(jìng)爭(zhēng)力:人工智能+億級(jí)特征庫(kù)

過去,我們所理解的網(wǎng)易主要是門戶網(wǎng)站、游戲、郵箱服務(wù),以及網(wǎng)易云音樂、網(wǎng)易考拉等口碑產(chǎn)品,那么,為什么網(wǎng)易要做內(nèi)容反垃圾的云服務(wù)呢?周森告訴筆者,基于網(wǎng)易十九年對(duì)互聯(lián)網(wǎng)產(chǎn)品研發(fā)體系及運(yùn)營(yíng)模式的豐富經(jīng)驗(yàn)和深入探索,網(wǎng)易自去年起,已經(jīng)面向市場(chǎng)推出一系列場(chǎng)景化云服務(wù),致力于更好更快地滿足B端客戶業(yè)務(wù)需求、幫助其解決業(yè)務(wù)痛點(diǎn)及實(shí)現(xiàn)業(yè)務(wù)目標(biāo)。而網(wǎng)易易盾是其中的智能反垃圾云服務(wù),是網(wǎng)易云計(jì)算的一部分,提供廣告過濾、智能鑒黃、暴恐識(shí)別及謠言排查等反垃圾服務(wù)。

網(wǎng)易易盾的核心思想就是用人工智能的技術(shù),來進(jìn)行反垃圾過濾,減少企業(yè)的人工審核,降低人工運(yùn)營(yíng)成本,以此來規(guī)避企業(yè)的運(yùn)營(yíng)風(fēng)險(xiǎn),提升產(chǎn)品的用戶體驗(yàn)。

周森介紹了網(wǎng)易易盾的產(chǎn)品實(shí)力:首先是特征庫(kù),基于網(wǎng)易19年的技術(shù)沉淀,積累了億級(jí)別的特征庫(kù),按照文本和圖片分類形成不同類別的特征庫(kù),同時(shí)還針對(duì)每個(gè)行業(yè)設(shè)定專門的特征庫(kù)。第二就是技術(shù)實(shí)力,網(wǎng)易擁有眾多專業(yè)的技術(shù)人員,也在多年實(shí)踐中積累下豐富的技術(shù)經(jīng)驗(yàn)。

網(wǎng)易易盾的產(chǎn)品共分為四類反垃圾服務(wù),首先是廣告過濾,基于網(wǎng)易郵件反垃圾的智能過濾技術(shù),以及億級(jí)廣告特征庫(kù),進(jìn)行精準(zhǔn)過濾;第二是智能鑒黃,基于智能識(shí)別及海量樣本庫(kù)、信用庫(kù),高效識(shí)別色情圖片;第三是暴恐識(shí)別,結(jié)合暴恐敏感圖像智能分析技術(shù),快速識(shí)別定位暴恐目標(biāo)圖像;第四是謠言排查,基于樣本庫(kù)及專業(yè)運(yùn)營(yíng)經(jīng)驗(yàn),快速排查謠言等有害信息。

云服務(wù)模式:SaaS級(jí)產(chǎn)品,便捷調(diào)用

過去,互聯(lián)網(wǎng)內(nèi)容以文字為主,所以大家最常用的就是關(guān)鍵詞匹配的方式進(jìn)行內(nèi)容識(shí)別。但是,關(guān)鍵詞的方式極易產(chǎn)生誤判,對(duì)于用戶的體驗(yàn)也不好,所以,網(wǎng)易易盾進(jìn)行了技術(shù)改進(jìn)。在文字方面,通過關(guān)鍵詞識(shí)別、規(guī)則引擎、自然語(yǔ)言處理三階段的技術(shù),來保證識(shí)別的準(zhǔn)確度。周森表示,目前,自然語(yǔ)言處理技術(shù)相對(duì)使用比較多,畢竟?jié)h語(yǔ)言博大精深,雙關(guān)、同音字、多音字等都相對(duì)比較復(fù)雜,采用自然語(yǔ)言技術(shù)可以提高準(zhǔn)確度。

網(wǎng)易易盾通過人工智能技術(shù)過濾掉垃圾信息,文本相對(duì)過濾速度比較快,圖片與視頻相對(duì)較慢,如果出現(xiàn)爭(zhēng)議的判斷,則由人工介入進(jìn)行再次審核。那么,機(jī)器過濾的速度有多快呢?周森告訴筆者,依托于網(wǎng)易云計(jì)算資源,網(wǎng)易易盾可以支持單日億級(jí)別數(shù)據(jù)的運(yùn)算能力,快速響應(yīng),實(shí)時(shí)返回。目前,網(wǎng)易易盾的準(zhǔn)確率已經(jīng)達(dá)到了99.8%以上。

網(wǎng)易易盾是SaaS級(jí)產(chǎn)品,而且使用的門檻也相對(duì)較低。主要是調(diào)用網(wǎng)易易盾的幾個(gè)接口,將內(nèi)容傳送給網(wǎng)易易盾就可以實(shí)時(shí)返回內(nèi)容的等級(jí),例如垃圾、疑似、正常等。企業(yè)的運(yùn)營(yíng)人員就很容易的來判別哪些內(nèi)容是有問題的,并且進(jìn)行處理。

周森透露,未來,網(wǎng)易易盾將會(huì)繼續(xù)深耕在網(wǎng)絡(luò)安全方面,會(huì)在近幾個(gè)月推出驗(yàn)證碼,保護(hù)產(chǎn)品的登錄注冊(cè)過程。

網(wǎng)易易盾免費(fèi)試用入口:http://dun.163.com/

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2016-11-10
網(wǎng)易易盾:以人工智能技術(shù)提升UGC產(chǎn)品內(nèi)容安全
互聯(lián)網(wǎng)發(fā)展至今,已經(jīng)成為人們的必需品。我們無論是在工作還是生活中,都會(huì)使用互聯(lián)網(wǎng)。在Web 2 0時(shí)代,用戶原創(chuàng)內(nèi)容UGC大量出現(xiàn),然而,一些垃圾信息、廣告、色情圖片等內(nèi)容,正破壞著互聯(lián)網(wǎng)的純凈度。

長(zhǎng)按掃碼 閱讀全文