2016年,歐盟委員會牽頭與Facebook、Twitter、YouTube和微軟等互聯(lián)網巨頭們集體簽署了一項行為準則,承諾“接到舉報后24小時內屏蔽和刪除相關仇恨言論”。
“仇恨言論”在歐美已經是刻不容緩的互聯(lián)網內容安全問題。
2019年發(fā)生在美國、新西蘭等地的公共傷害事件,事后都被查明兇手為種族歧視的捍衛(wèi)者,動手之前曾在網絡上分享過自己的行程與仇恨理念。
而這只是互聯(lián)網內容安全問題的冰山一角。
互聯(lián)網上與日俱增的內容不僅代表著更多的流量,也預示著巨大的內容風險藏身其中。色情、毒品、旗幟、暴恐、血腥、武器等等不良、有害信息不僅危害互聯(lián)網平臺的內容生態(tài),更可能導致安全問題,使業(yè)務發(fā)展遭受損失。
不夸張的說,內容安全就是互聯(lián)網平臺的風控命門。
過去,互聯(lián)網公司通過增加內容審核人員規(guī)模來解決問題,比如2018年今日頭條就曾將原有6000人的運營審核隊伍擴大到10000人,社交巨頭Facebook在全球范圍內也擁有1.5萬內容審核員。
但這也引出一個實際問題,大廠有能力和資金可以雇傭內容審核專員,或者自己開發(fā)機器審核,而小廠呢?如何應對這顆隨時可能引爆的安全“炸彈”?
人工+機器輔助,AI內容風控了解一下
隨著互聯(lián)網內容愈發(fā)繁雜且海量,以及市場與行業(yè)升級之后,信息傳播的媒介與形態(tài)越來越多樣化,傳統(tǒng)的人工審核方式已經不能從容應對內容安全危機了。
人工審核本身有著天然缺陷,比如成本高、效率低、主觀成分高、評判標準不統(tǒng)一等等。僅成本一項就很難,有企業(yè)曾透露,一人一天審核4萬條信息,日均100萬數據,光審核人力成本就要200萬以上。
對企業(yè)而言,概括起來說就是成本高、技術難、效果差。甚至,因為長期與極度負面的信息打交道,對審核員工的身心都會造成損傷。
今年3月,3000多名內容審核員就對Facebook發(fā)起了訴訟,這些內容審核員要求對這份工作引發(fā)的精神損害進行經濟補償。5月,Facebook不得不同意向這些內容審核員支付5200萬美元的和解費。
并且,視頻、音頻等媒介形式的爆發(fā),又給人工審核帶來了新的挑戰(zhàn)。
于是近幾年,基于算法技術和人工智能,互聯(lián)網平臺開始開發(fā)機器輔助人工審核的方式應對內容安全問題。機器審核的一大優(yōu)勢就在于,可以應對不同媒介維度的內容審核工作。
文本內容:最基礎的處理工作是匹配詞庫進行分類處理。區(qū)別于人工,AI可以通過預設違禁詞庫來完成文本內容篩選。
比如,百度內容審核平臺就是預置違禁詞庫+用戶自定義黑/白詞庫的配置,并根據色情、暴恐違禁、政治敏感、惡意推廣等七大場景建立了黑詞庫和語義審核模型,不僅能夠對敏感詞和違禁詞進行處理,也能根據上下文、語境、語義識別出違規(guī)信息。
圖像內容:機器對圖片類型的內容審核,其底層是圖片識別的技術應用。以此為基礎邏輯,圖片內容的各個場景得以被辨識并應用到內容審核中,比如下圖就介紹了百度內容審核平臺的圖像檢測產品的主要功能。
視頻內容:視頻內容由音頻內容、視頻畫面兩個對象組成,視頻畫面的機器審核,業(yè)界目前常采用截取畫面幀上傳識別,最終復用的是圖片識別通道對場景、人物、物品進行判斷是否違規(guī)。
音頻內容:音頻識別的技術基礎建立在以聲學模型建立的發(fā)音模版,通過匹配發(fā)音模版判斷出語種和對應表義,輸出可被計算機理解的語言結果。
音頻內容的審核要略微復雜一些,一方面是音頻背景音需要降噪才能準確識別語音內容,另一方面是聲音內容的顆粒度要更細,比如摻雜在聲音內容里的嬌喘聲。百度內容審核平臺為此增加了一個聲學模型審核,對諸如嬌喘聲等違規(guī)信息可有效識別。
以上幾種不同媒介的機器審核是目前業(yè)界最普遍的基礎方案,相較于人工審核,人工+機器的復合審核方式相當于將一些重復性高、需要大量計算的工作交給機器精篩,再由人工復審,以此達到海量內容的高效審核。
這也存在一些問題,比如一張人像圖片可以劃分為“色情”、“性感”、“正常”三個維度,機器可以根據肉體裸露程度來判斷,但在特定情況下又要有所區(qū)分,比如在電商平臺銷售內衣的模特照片就是合規(guī)的,而在母嬰論壇可能就不一樣。
所以,在流程設計上,機器審核可以做到的就是幫助運維者先行剔除大量確切違規(guī)的內容,剩下的人工審核流程依舊不能省。
需要怎樣的內容風控解決方案?
那么,既然機器審核既有優(yōu)勢又有劣勢,互聯(lián)網平臺究竟要怎樣才能做到高效且節(jié)省成本的內容審核呢?
答案是從兩個方面入手。
其一,部署性能優(yōu)越的機器審核平臺。目前,基本上互聯(lián)網大廠都是自己開發(fā),比如Facebook。疫情期間,由于大部分人工審核員居家隔離,Facebook依賴于AI檢測系統(tǒng),據說該系統(tǒng)可以自行檢測到平臺上90%的有害信息。
國內的百度、騰訊、阿里、頭條、快手等也都是自己開發(fā)的機器審核。也有一些提供內容審核的大數據風控創(chuàng)業(yè)公司,比如同盾科技、數美科技等等。
其中,百度是為數不多開放這一產品的大廠。2018年,百度推出了基于AI開放平臺的內容審核產品,支持圖像、文本、音頻、視頻等多形式的審核。
經過兩年多的發(fā)展,目前百度內容審核平臺已經升級到14+項圖像、 8+項文本、9+項語音審核能力,并可以基于多年的風險處置經驗實時更新系統(tǒng)策略。
百度內容審核平臺設定了全面的分類標簽體系,包括色情20標簽、暴恐17標簽等等,這一體系可以讓企業(yè)根據業(yè)務需求自由組合標簽,也就是自定義模型。
舉個例子,在視頻直播場景下親密行為屬于正常,而在母嬰論壇就不能通過。不同場景對違禁規(guī)則的需求不同,平臺可以根據自身業(yè)務特性自定義模型,無疑這既增加內容審核準確度也不會對用戶體驗造成損傷。
而且百度內容審核平臺背后還有頂尖的技術支撐,百度是唯一連續(xù)三年入選MIT科技評論的年度十大突破技術公司。在人臉檢測Wider Face&person Chllenge 2019、機器閱讀理解 MS MARCO數據集榜單等國際技術比賽中穩(wěn)居第一。
其二,人工依舊是內容安全審核無法略去的重要環(huán)節(jié),而提高人工審核效率也是關鍵之一。
據百度AI技術生態(tài)部高級產品經理Nathan透露,百度內容審核平臺的客戶存在一個非常明確的訴求,即AI 審核能力提高的同時,還需要一套功能更加完備的審核系統(tǒng)來提升審核的管理效率。
近日,百度大腦就在內容審核平臺的基礎上又推出了人機協(xié)同審核管理平臺。
該平臺的邏輯是輔助內容審核平臺,相當于在整個審核流程中加入了一個新的AI機審。以短視頻為例,AI機審可以調用內容審核平臺接口,通過截幀、抽取音頻的方式進行審核,對比內容審核平臺,AI機審在這其中增加了圖像指紋、聲紋黑庫功能,進一步強化審核準確度。
同時,人機協(xié)同審核管理平臺還推出了三層人審機制,具體流程可參考下圖。
百度方面表示,通過優(yōu)化人機協(xié)同機制,能夠幫助客戶降低30%人力消耗并大幅提升單人審核效率。而且在服務形態(tài)上提供公有云、私有化靈活的部署方案,幫助客戶極大節(jié)省平臺開發(fā)和運維成本。
國信聚安是一家聚焦于內容安全生態(tài)的專業(yè)服務商,其基于百度大腦的算法、模型、數據和研發(fā)打造了一套新媒體內容風險管理方案。
國信聚安的業(yè)務能力主要在前端數據,包括用戶信息、圖片信息、視頻、互動等,借助人機協(xié)同審核管理平臺建立自定義模型,對色情、涉政等違規(guī)信息進行關鍵詞匹配、語義分析等檢測操作,再通過人工復審實現結果輸出。
通過借力百度大腦,國信聚安實現了四大提升:
1 借助標準化、易接入的人機審核平臺,提升了業(yè)務拓展和線上效果;
2 提高專項內容審查的應對能力;
3 高危內容研判耗時縮短,準確率提升;
4 人力成本下降。
“借助模型快速的研判和準確率,使得研判耗時縮短了95%,準確率提升了70%,也大大降低了一線審核員的壓力?!眹啪郯睠EO陳太鋒表示。
工欲善其事,必先利其器
從全球內容產業(yè)的發(fā)展來看,內容安全審核是整個互聯(lián)網平臺進化的重要一步。一方面,機器審核方式的加入提升了內容審核效率,另一方面也直接強化了內容分發(fā)的商業(yè)效率。
也就是說,除了內容安全問題,AI也在讓內容產業(yè)變的更“輕”——輕人力、輕成本、輕流程,讓AI來解決更多問題。
而近年來內容安全事件的高發(fā),也證明了行業(yè)中內容安全風控仍存在缺口。主要表現在建立內容審核編輯責任制落地不到位、在新媒介內容審核上技術投入不足等等,這其中有技術問題也有人力、資金問題。
考慮到這些現實問題,而內容風控又是必須要做的事情,類似百度大腦這樣的高效、低成本審核手段就有了用武之地。
在這樣的前提下,利用AI進行內容風控的重要性只會不斷提高,我們未來需要應對的不僅僅是不當內容和低質量內容,很可能還會有人類都難以分辨的虛假內容。這樣看來,AI內容風控不僅僅是一項增益技術,而是駛向內容產業(yè)金銀島保駕護航的必由之路。
免責聲明:此文內容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網無關。文章僅供讀者參考,并請自行核實相關內容。投訴郵箱:editor@fromgeek.com。
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。