網(wǎng)易跟帖養(yǎng)成記,這款反垃圾云服務(wù)功不可沒

從2003年至今,網(wǎng)易跟帖在不知不覺中已經(jīng)度過了13個(gè)年頭,經(jīng)歷了互聯(lián)網(wǎng)信息的爆發(fā),也經(jīng)歷了PC向移動(dòng)互聯(lián)網(wǎng)的轉(zhuǎn)型。而在同類產(chǎn)品近乎銷聲匿跡的時(shí)候,網(wǎng)易跟帖已然成為一種互聯(lián)網(wǎng)文化,甚至可以說最成功的評論類產(chǎn)品。

移動(dòng)互聯(lián)網(wǎng)發(fā)展到今天,UGC早已是諸多流行APP中不可或缺的品類,這些產(chǎn)品和網(wǎng)易跟帖的一個(gè)共同特點(diǎn)就是,由用戶原創(chuàng)內(nèi)容。但用戶可以制造優(yōu)質(zhì)內(nèi)容,也會帶來大量的負(fù)面和垃圾信息,這不僅讓很多內(nèi)容運(yùn)營難堪其重,一些產(chǎn)品的衰落也與此不無關(guān)系。那么,網(wǎng)易跟帖在反垃圾方面的成就對其他UGC產(chǎn)品來說又有何借鑒之處呢?

19年經(jīng)驗(yàn),以及網(wǎng)易的三次技術(shù)迭代

互聯(lián)網(wǎng)反垃圾的歷史似乎可以追溯到1978年的第一封垃圾郵件,而在今天全球每天都有數(shù)十億的垃圾郵件在傳播,再加上垃圾評論、詐騙短信、色情廣告等等,幾乎所有互聯(lián)網(wǎng)產(chǎn)品都面臨著反垃圾的壓力,網(wǎng)易也不例外。

自1997年推出郵箱類產(chǎn)品開始,網(wǎng)易就開始了自己的反垃圾之路,產(chǎn)品線也從郵箱、新聞擴(kuò)展到了影音娛樂、游戲、社交、電商等領(lǐng)域。網(wǎng)易跟帖可以看作是網(wǎng)易發(fā)垃圾技術(shù)的直接呈現(xiàn),其實(shí)在“蓋樓”文化背后,網(wǎng)易的反垃圾技術(shù)也完成了三次技術(shù)迭代。

第一階段主要是依賴關(guān)鍵詞、黑白名單和各種過濾器技術(shù),來做一些內(nèi)容的偵測和攔截。這是最基礎(chǔ)的階段,也是網(wǎng)易郵箱在垃圾郵件過濾方面的初次嘗試,后來這一技術(shù)也被應(yīng)用于網(wǎng)易新聞的評論區(qū)。不過受限于當(dāng)時(shí)計(jì)算能力瓶頸以及算法理論的發(fā)展,第一階段的技術(shù)只能說勉強(qiáng)滿足使用。

第二個(gè)階段主要基于計(jì)算機(jī)行業(yè)一些算法的更新,比如說貝葉斯過濾,一些膚色的識別,紋理的識別等等。網(wǎng)易在實(shí)際應(yīng)用中對這些算法進(jìn)行了更好的特征匹配和技術(shù)改造,達(dá)到更優(yōu)的反垃圾效果,這也是網(wǎng)易跟帖能夠持續(xù)13年之久并且越來越好的關(guān)鍵。

第三個(gè)階段加入了當(dāng)下流行的大數(shù)據(jù)和人工智能等技術(shù)。網(wǎng)易在反垃圾技術(shù)上利用海量大數(shù)據(jù)做用戶的行為分析,進(jìn)行用戶畫像,評估用戶是一個(gè)垃圾用戶還是一個(gè)正常用戶。此外,網(wǎng)易還能基于人工智能的圖像識別技術(shù)等,更準(zhǔn)確識別是否是垃圾詞匯、色情圖片、廣告圖片以及一些違禁品圖片等等。

個(gè)體的智慧是有限的,但個(gè)體乘以一百萬之后就會產(chǎn)生神奇的化學(xué)反應(yīng)。網(wǎng)易反垃圾技術(shù)就像是一個(gè)神奇的濾網(wǎng),將網(wǎng)易新聞評論區(qū)的內(nèi)容汰劣留良,使得跟帖這一體現(xiàn)網(wǎng)民智慧的生產(chǎn)力一直延續(xù)下去。

網(wǎng)易易盾上線,跟帖神話或許可以復(fù)制

反垃圾技術(shù)進(jìn)入到人工智能階段時(shí),網(wǎng)易的反垃圾團(tuán)隊(duì)發(fā)現(xiàn)國內(nèi)第三方反垃圾市場近乎空白,盡管國外已經(jīng)出現(xiàn)了mollom、WebPurify、Sightengine等產(chǎn)品。而此時(shí)網(wǎng)易內(nèi)部95%的互聯(lián)網(wǎng)產(chǎn)品已經(jīng)遷入了云,正基于此,網(wǎng)易在2016年年初正式推出了易盾反垃圾云服務(wù),將網(wǎng)易服務(wù)多年的成熟解決方案以云服務(wù)的形式推向市場,幫助更多產(chǎn)品。

縱觀市場上的各類UGC產(chǎn)品,在內(nèi)容過濾方面的做法普遍有三類,一是人工干涉,諸如人工刪除、屏蔽、禁言等等;二是進(jìn)行用戶分級,比如根據(jù)用戶的注冊時(shí)長和在線時(shí)間分為核心用戶、普通用戶、游客等等;三是優(yōu)質(zhì)內(nèi)容的人工篩選,即人工置頂推薦一些優(yōu)質(zhì)內(nèi)容。不難發(fā)現(xiàn),這一機(jī)制和網(wǎng)易跟帖有著本質(zhì)的差別,前者要投入龐大的人力資源和巨額的資金,而網(wǎng)易跟帖是網(wǎng)民的自發(fā)行為,網(wǎng)易很少進(jìn)行人工干涉。此外,用戶分級的做法在一定程度上有利于內(nèi)容的凈化,卻也極大地?fù)p害了用戶體驗(yàn),網(wǎng)易跟帖則恰如其分的給了每個(gè)用戶發(fā)言的權(quán)利。

不難發(fā)現(xiàn),傳統(tǒng)的反垃圾技術(shù)業(yè)已成為UGC類產(chǎn)品的一大瓶頸,網(wǎng)易跟帖則從另一方面說明了反垃圾云服務(wù)的必要性。同時(shí),作為專業(yè)的第三方反垃圾產(chǎn)品,網(wǎng)易易盾在網(wǎng)易新聞、網(wǎng)易云音樂、網(wǎng)易云課堂、網(wǎng)易郵箱身上表現(xiàn)出的可靠性和高效性,一方面是基于網(wǎng)易擁有19年的反垃圾特征數(shù)據(jù)沉淀,而這些正是能否快速有效過濾各種有害信息的關(guān)鍵;另一方面網(wǎng)易云在云計(jì)算大軍中漸露頭角,海量的云計(jì)算資源和彈性伸縮的特點(diǎn),能夠滿足客戶單日億級請求。誠然,在打造了網(wǎng)易新聞、網(wǎng)易云音樂等標(biāo)簽式產(chǎn)品后,網(wǎng)易開始憑借網(wǎng)易易盾反垃圾來深耕這個(gè)市場。

網(wǎng)易跟帖之所以成功,或許有人認(rèn)為是基于網(wǎng)易的產(chǎn)品情懷和工匠精神,也或許有人說是網(wǎng)民的智慧結(jié)晶,但不可否認(rèn)的是,反垃圾技術(shù)卻是決定網(wǎng)易跟帖能否良性循環(huán)的重要因素之一??梢灶A(yù)見,UGC創(chuàng)業(yè)大潮在未來會越來越?jīng)坝?,而網(wǎng)易易盾反垃圾云服務(wù)等成熟的反垃圾解決方案,也將加速UGC產(chǎn)品的落地,網(wǎng)易跟帖的神話并非不可復(fù)制。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2016-08-10
網(wǎng)易跟帖養(yǎng)成記,這款反垃圾云服務(wù)功不可沒
從2003年至今,網(wǎng)易跟帖在不知不覺中已經(jīng)度過了13個(gè)年頭,經(jīng)歷了互聯(lián)網(wǎng)信息的爆發(fā),也經(jīng)歷了PC向移動(dòng)互聯(lián)網(wǎng)的轉(zhuǎn)型。

長按掃碼 閱讀全文