社交媒體要怎么做UGC內(nèi)容風控?

早年,F(xiàn)acebook曾聯(lián)合部分知名高校的學者做過一項研究:以689003名用戶的好友動態(tài)信息流作為研究樣本,通過修改信息分發(fā)的算法,人為區(qū)分出消極情緒偏向或積極情緒偏向的內(nèi)容,強方向性地給研究樣本中的用戶進行曝光。

研究結果表明,獲取更多消極傾訴偏向的用戶,在發(fā)布動態(tài)等行為上也更偏向消極情緒,反之亦然。有的研究者把這種現(xiàn)象稱之為“情緒蔓延”,簡而言之,在社交媒體上你給人們曝光什么,人們的心智也會隨之發(fā)生改變。

由此可見,社交媒體的影響力早已超出普羅大眾的普遍認識,這些基于社會化網(wǎng)絡的內(nèi)容生產(chǎn)與交換平臺早已在經(jīng)意或不經(jīng)意間給我們帶來了深遠的影響。

著名的《連線》雜志創(chuàng)始主編凱文·凱利在其成名作《失控》中曾表明一個犀利的觀點,他認為人類歷史曾經(jīng)發(fā)生四次認知顛覆,其中就包含了來自弗洛伊德的研究理論:我們的意志不是一個獨立的個體,它其實是多股意見和不同意識的綜合體,實際上我們連自己的意識都不能完全主宰。

所以也不難理解,為什么全球范圍內(nèi)的社交媒體在內(nèi)容管控上都在走向強干預。在信息爆炸的今天,如果社交媒體的內(nèi)容走向過度傾向負面,那么集體意識走向失控的風險就會無比放大。

不同媒介的機器輔助審核

隨著市場與行業(yè)的升級,社交媒體中信息傳播的媒介與形式呈現(xiàn)了多樣化、創(chuàng)新性的發(fā)展趨勢。視頻、音頻媒介的廣泛流行給內(nèi)容審核工作帶來了新的挑戰(zhàn),直播、去中心化的UGC內(nèi)容相對以熱門推薦算法主導的資訊流又有更高的即時性要求。

不過,得益于人工智能及算法技術近年來的迅猛發(fā)展,利用機器,互聯(lián)網(wǎng)行業(yè)已經(jīng)發(fā)展出基于不同媒介維度的輔助解決方案。

文本內(nèi)容:最基礎的處理工作是匹配詞庫進行分類處理,現(xiàn)有的詞庫按風險嚴重程度可以劃分為涉政詞與敏感詞兩大分類。尤其可能涉及政治違規(guī)的關鍵詞需要嚴格進行處理,而敏感詞中除了明確公眾普遍不可接受的詞匯外還有大量在不同場景下有不同語義的敏感詞,如果完全統(tǒng)一處理就很容易給用戶帶來體驗損害。

舉個例子,“約”一詞就需要根據(jù)其實際的詞匯組合以及語境來進行判斷,“明天去看電影,約嗎?”就不是需要處罰的語句。在此基礎上就衍生出利于上下文內(nèi)容判定語義的語義分析,以及根據(jù)聚類分析判斷與垃圾文本的相似性的結果判定。

圖片內(nèi)容:機器對圖片類型的內(nèi)容審核,其底層是圖片識別的技術應用。所有的物品圖像都有它的圖形特征,圖片識別則可以以其基礎特征為基礎進行判斷。以足球為例,其球狀圓形球形以及遍布五邊形的圖案就構成了其基礎特征,圖片識別通過算法提取圖像的特征值,計算特征值的相似度匹配物品圖像原型。

以此為基礎邏輯,圖片內(nèi)容的各個場景得以被辨識并應用到內(nèi)容審核中,比如下圖以網(wǎng)易易盾的圖片檢測的產(chǎn)品介紹為例示意其應用場景。

(網(wǎng)易易盾的圖片識別應用場景)

音頻內(nèi)容:音頻內(nèi)容審查包括音頻與視頻兩個類型媒介的內(nèi)容提取。音頻識別的技術基礎建立在以聲學模型建立的發(fā)音模版,通過匹配發(fā)音模版判斷出語種和對應表義,輸出可被計算機理解的語言結果。

在內(nèi)容審核應用上,一種通用方法是將語音識別為文本信息后復用文本內(nèi)容的判斷模型。在語音識別中,面臨音頻背景音嘈雜的場景還需要進行降噪,而多音軌發(fā)音場景下要實現(xiàn)準確識別也是一大難題。

視頻內(nèi)容:視頻動畫的實現(xiàn)終究是基于畫面幀的連續(xù)播放,故對于視頻畫面內(nèi)容的處理,目前通用的解決方案是截取畫面幀進行識別,最終復用的是圖片識別模型判斷涉黃、暴力、血腥等違禁內(nèi)容。一個僅僅幾分鐘視頻所擁有的圖片幀數(shù)量極多,其中截幀的頻次越高,數(shù)量越多,該視頻出現(xiàn)違禁內(nèi)容的風險越小。

可見,以上幾種不同媒介的機器審核目前于業(yè)界已經(jīng)有基礎方案。但實際應用可是復雜多樣,機器審核無法完全解決諸如多音軌語音、完整圖案干擾、文本植入變異敏感詞、視頻“閃現(xiàn)”違禁內(nèi)容等場景的問題,其終究起到的是輔助審核的作用。根本邏輯即是通過機器審核剔除明確違規(guī)的內(nèi)容,剩下的內(nèi)容最終交由人工審核判定分發(fā)。

UGC內(nèi)容風控設計

與熱門推薦算法導向的“資訊”、“內(nèi)容”向產(chǎn)品不同,微信、QQ及一眾新興社交軟件的UGC動態(tài)內(nèi)容生產(chǎn)高并發(fā),用戶體驗有更高的時效性需求,如何把握用戶體驗和內(nèi)容審查就成為其風控的一大要點。以下選取QQ、陌陌、Soul、Uki四款社交軟件,以色情維度的信息為例,測評其在內(nèi)容風控上的產(chǎn)品設計。

發(fā)布動態(tài)

在動態(tài)社區(qū)中,“聊騷”這樣一個敏感詞的判定標準上,4款軟件有不同的定義。除了Soul已然將其判定為不可發(fā)布與傳播的內(nèi)容外,其他三者均能進行發(fā)布分發(fā)。而在非文本媒介上,行業(yè)標桿QQ與Soul已實現(xiàn)較為完善的內(nèi)容風控,尤其Soul在發(fā)布明顯可判定為“色情”的圖片、音頻、視頻內(nèi)容后,其發(fā)布賬號會在內(nèi)容審核后直接被采取封號處罰。

而Uki與陌陌在動態(tài)社區(qū)的內(nèi)容風控上顯然有所不足,兩者的圖片內(nèi)容發(fā)布也會先經(jīng)過機器審核,在圖片識別為違規(guī)內(nèi)容會阻斷發(fā)布直接刪除內(nèi)容。但實測中在Uki發(fā)布一段嬌喘音頻會先分發(fā)到社區(qū),在獲得8分鐘時間的分發(fā)經(jīng)人工審核后方被通知內(nèi)容違規(guī)進行刪除,其審查邏輯是審查即時性的“先發(fā)后審”。

而實測中的陌陌對音頻、視頻的審查最為寬松,自期違規(guī)音頻、視頻內(nèi)容發(fā)布后的數(shù)個小時后,其違規(guī)音頻、視頻內(nèi)容都未進行刪除處理,甚至可通過其小程序進行分享。

(陌陌通過其K歌功能發(fā)布音頻內(nèi)容)

(陌陌的違規(guī)視頻動態(tài)自發(fā)布后數(shù)小時內(nèi)無任何處理)

經(jīng)以上實測,目前正進行整改的Soul在內(nèi)容審查上的判定標準與懲處力度最為嚴厲,4款社交軟件中在動態(tài)社區(qū)中達到了4種媒介的完善審查機制的僅為QQ與Soul。UGC內(nèi)容行業(yè)要升級審查機制,繞不過真正“先審后發(fā)”的實現(xiàn)途徑,尤其陌陌與Uki因為審查不嚴所帶來的內(nèi)容審查風險就極易失控。

價值觀仍然是一根金線

上文之所以一直強調(diào)機器審核的輔助定位和“先審后發(fā)”的重要性,究其根本是因為如果在缺乏強有力的人工審核主導作用下,就無法實現(xiàn)內(nèi)容全面風控,陌陌與Uki的實測案例就應該印證了這一點。

不同的敏感內(nèi)容基于表達主旨有不同的表義,以“聊騷”這一敏感詞內(nèi)容為例,所涉及內(nèi)容在社區(qū)網(wǎng)站是否視為違禁,取決于網(wǎng)站運營者基于自身價值觀導向所制定網(wǎng)站規(guī)準。又例如當用戶在社區(qū)中發(fā)表對美麗向往又不裸露的“性感”內(nèi)容時,如果單憑機器思維統(tǒng)一以違禁方式進行處理,那么對用戶體驗而已無異為一場災難。

在這種場景下,唯有運營者依據(jù)制定出合理且大眾公認的性暗示程度標尺進行判定,才能達到用戶體驗和內(nèi)容安全的和諧平衡。

人工強干預除了保障內(nèi)容全面風控,其另一重要工作就是引導內(nèi)容社區(qū)的價值觀走向。在新時代環(huán)境下,網(wǎng)站開發(fā)者思考如何遵循政策倡導迭代產(chǎn)品尤為關鍵。以部分網(wǎng)站中推行的青少年模式為例,就是近年來創(chuàng)新地將產(chǎn)品功能設計與內(nèi)容運營相結合的成功案例。

經(jīng)過近年來網(wǎng)信辦領導下的一系列整頓后,尤其短視頻領域內(nèi)眾多社交媒體內(nèi)部已建立堅實的內(nèi)容審核編輯責任制,組織架構上突出“人”在內(nèi)容風控上的主導地位,如“快手”、“抖音”等社區(qū)的內(nèi)容調(diào)性和審核標尺的進步最為直觀。

但仍有部分已建立內(nèi)容審核編輯責任制卻落地不到位,擁有較多資源卻又在新媒介內(nèi)容審核上技術投入不足,以致內(nèi)容審查機制松懈的網(wǎng)站就需要繼續(xù)努力,肩負起更多的社會責任。仁以為己任,不亦重乎?

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。

2019-08-15
社交媒體要怎么做UGC內(nèi)容風控?
早年,F(xiàn)acebook曾聯(lián)合部分知名高校的學者做過一項研究:以689003名用戶的好友動態(tài)信息流作為研究樣本。

長按掃碼 閱讀全文