體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

一、背景

近期體驗(yàn)了百度大腦內(nèi)容審核平臺,可以通過界面化的操作,定制審核模型,完美契合業(yè)務(wù)審核需求,提升審核效率,降低人工成本,個(gè)人感覺對一些產(chǎn)生豐富UGC內(nèi)容的企業(yè)非常有用,本文提供一些使用的攻略和建議。

二、應(yīng)用場景

官方給出的應(yīng)用場景如下,但是個(gè)人認(rèn)為可以發(fā)揮想象力,應(yīng)用在各個(gè)領(lǐng)域。

1、視頻內(nèi)容審核配合關(guān)鍵幀抽取技術(shù)對視頻幀中的圖像、字幕進(jìn)行審核,搭配語音識別和敏感聲音檢測技術(shù),對視頻內(nèi)容進(jìn)行全面審核。2、電商平臺內(nèi)容審核針對商家的廣告宣傳文本,通過圖文審核判斷是否符合新廣告法,在雙11、618、黑色星期五等購物節(jié),通過百度內(nèi)容審核,極大的彌補(bǔ)人力審核資源不足的問題,實(shí)時(shí)快速的對商品信息進(jìn)行審核,保障平臺內(nèi)容安全。3、UGC內(nèi)容反垃圾對論壇、貼吧等UGC內(nèi)容中的圖片、文章、評論進(jìn)行合規(guī)性檢查,并針對惡意推廣、政治敏感、低俗辱罵、低質(zhì)灌水內(nèi)容進(jìn)行審核,降低平臺違規(guī)風(fēng)險(xiǎn)、有效提升平臺內(nèi)容質(zhì)量、吸引更多用戶與優(yōu)質(zhì)資源。4、實(shí)名制社交頭像審核配合人臉識別針對用戶頭像進(jìn)行多維度的圖像、文本審核,確保圖像中包含清晰人物正臉、非明星/卡通人臉,并且無色情、暴恐、政治敏感、微商廣告、各類聯(lián)系方式內(nèi)容,保障平臺使用體驗(yàn)。

三、使用攻略

說明:本文采用C# 語言,開發(fā)環(huán)境為.Net Core2.1,采用在線API接口方式實(shí)現(xiàn)。

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

點(diǎn)擊策略創(chuàng)建地址,選擇“創(chuàng)建策略”。

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

填寫策略名稱,選擇相應(yīng)的APPID,并填寫聯(lián)系人信息,如果有時(shí)間限制,可以取消“長期有效”按鈕,輸入具體的策略生效時(shí)間段。

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

根據(jù)自己的需求,勾選需要的“圖像審核規(guī)則”和“文本審核規(guī)則”,并可以點(diǎn)擊”展開“,通過審核標(biāo)簽后面的滑動(dòng)條調(diào)整審核的松緊度,松緊度的調(diào)整策略為:每個(gè)審核標(biāo)簽都有一個(gè)滑動(dòng)條和兩個(gè)調(diào)整審核松緊度的滑塊,兩個(gè)滑塊將整個(gè)區(qū)域分為白色合規(guī)區(qū)、淡紅色疑似區(qū)、紅色違規(guī)區(qū),紅色區(qū)域越大越多的圖片會落在這個(gè)區(qū)域,審核約嚴(yán)格,反之亦然。

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

配置完后,點(diǎn)擊“生成策略”,策略創(chuàng)建成功。

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

可以點(diǎn)擊“驗(yàn)證策略”,進(jìn)行策略驗(yàn)證,或者在“策略列表”中,選擇相應(yīng)的策略,點(diǎn)擊“驗(yàn)證”來驗(yàn)證策略:

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

驗(yàn)證結(jié)果:

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

同樣,也可以創(chuàng)建和驗(yàn)證文本的策略。

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

在“策略列表”中,可以選擇修改狀態(tài)來“啟用/停用”相應(yīng)的策略,也可以通過“編輯“按鈕來調(diào)整策略,更改生效時(shí)間等操作:

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

(1-2)自定義審核模型-EasyDL

內(nèi)容審核平臺與EasyDL平臺打通,支持用戶快速定制審核模型并添加到審核策略中,下面簡單介紹一下如何讓內(nèi)容審核平支持EasyDL定制化物體檢測模型。個(gè)人覺得這個(gè)功能是審核平臺的一大亮點(diǎn)。

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

創(chuàng)建標(biāo)簽、上傳圖片數(shù)據(jù)并對其中的圖片進(jìn)行標(biāo)注分類,如果需要標(biāo)注的圖片數(shù)據(jù)很多,可以使用”智能標(biāo)注“,降低標(biāo)注成本,一般只用標(biāo)注數(shù)據(jù)集30%左右的數(shù)據(jù)就可以訓(xùn)練模型,并且效果與標(biāo)注所有數(shù)據(jù)后訓(xùn)練的模型效果幾乎等同。(我原本也想試試的,只不過我每個(gè)標(biāo)簽的圖片只有20來張(如果想得到較好的模型效果,一般一個(gè)標(biāo)簽的在所有圖片中出現(xiàn)的數(shù)量要大于50,最好更多,并且相似性要小),啟用“智能標(biāo)注”,每次啟用,要花費(fèi)比較長的時(shí)間讓系統(tǒng)篩選“優(yōu)先標(biāo)注”的圖片,具體時(shí)間忘記了,10多分中應(yīng)該要的,有這時(shí)間,我自己都標(biāo)注完了,所以試了兩三遍,就自己去標(biāo)注了,如果每個(gè)標(biāo)簽有成千上萬張的圖片的化,啟用“智能標(biāo)注”就很有必要了)。

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

數(shù)據(jù)上傳、標(biāo)注好后,就可以選擇模型,并進(jìn)行模型訓(xùn)練了,由于本程序是采取在線API的方式調(diào)用,所以“應(yīng)用類型”需要選擇“云服務(wù)”,算法根據(jù)自己的需要選擇“高精度”或者“高性能”。

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

模型訓(xùn)練好后,就可以查看評估報(bào)告(如果單個(gè)標(biāo)簽的圖片量在100張以內(nèi),這個(gè)數(shù)據(jù)基本參考意義不大 ),也可以選擇圖片看看訓(xùn)練效果如何,最后,可以“申請上線”,在線調(diào)用。

如果對模型效果不滿意,可以通過擴(kuò)充數(shù)據(jù)、調(diào)整標(biāo)注等方法進(jìn)行模型迭代。

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

測試效果:

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

申請發(fā)布后,通常的審核周期為T+1,即當(dāng)天申請第二天可以審核完成。如果需要加急、或者遇到莫名被拒的情況,可以加入官方QQ群(群號:679517246)聯(lián)系群管解決。

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

等模型發(fā)布審核通過后,就可以在內(nèi)容審核平臺編輯相應(yīng)的策略名稱,選擇啟用“自定義圖片審核-EasyDL”,并添加已發(fā)布的EasyDL模型,勾選需要過濾的詳細(xì)類別,選擇生成策略,就完成了內(nèi)容審核平臺對EasyDL定制化物體檢測模型的支持了。

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

3、定制化物體檢測模型 審核測試

未啟用“自定義圖片審核-Easy DL”時(shí),檢測的圖片為“合規(guī)”:

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

啟用“自定義圖片審核-Easy DL”后,同樣的圖片檢測為“不合規(guī)”:

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

同理,對于“圖像分類模型”也可以采取上述的步驟來進(jìn)行添加進(jìn)行審核過濾。

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

(3)源碼共享

(3-1)根據(jù) API Key 和 Secret Key 獲取 AccessToken

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

(3-2)調(diào)用API接口獲取識別結(jié)果

(3-2-1)在Startup.cs文件的 Configure(IApplicationBuilder app, IHostingEnvironment env) 方法中開啟虛擬目錄映射功能:

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

(3-2-2) 建立Index.cshtml文件

(3-2-2-1)前臺代碼:

由于html代碼無法原生顯示,只能簡單說明一下:

主要是一個(gè)form表單,需要設(shè)置屬性enctype="multipart/form-data",否則無法上傳圖片;

form表單里面有五個(gè)控件:

一個(gè)textarea:asp-for="Text" ,輸入需要審核的內(nèi)容;

一個(gè)Input:type="text",asp-for="ImageUrl" ,輸入網(wǎng)絡(luò)圖片地址;

一個(gè)Input:type="file",asp-for="FileUpload" ,上傳圖片用;

一個(gè)Input:type="submit",asp-page-handler="CensorForImg" ,圖像審核。

一個(gè)Input:type="submit",asp-page-handler="CensorForText" ,文本審核。

一個(gè)img:src="@Model.curPath",顯示需要審核的圖片。

最后顯示后臺 msg 字符串列表信息,如果需要輸出原始Html代碼,則需要使用@Html.Raw()函數(shù)。

(3-2-2-2) 后臺代碼:

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

四、效果測試

1、頁面:

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

2、識別結(jié)果:

自定義圖片審核-EasyDL

正常情況下,審核通過:

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

啟用后,審核不通過:

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!

五、測試結(jié)果及建議

經(jīng)過測試可知,百度的內(nèi)容審核功能相當(dāng)完善,不僅可以進(jìn)行圖片審核,還能夠進(jìn)行文字審核,并且審核的內(nèi)容、嚴(yán)謹(jǐn)度、時(shí)間段等都可以自己進(jìn)行相應(yīng)的調(diào)整,自定義程度高,配置也不算復(fù)雜,只要設(shè)定好相應(yīng)的策略,基本上就可以直接拿來使用了。

現(xiàn)在國家對互聯(lián)網(wǎng)規(guī)范化使用的要求已經(jīng)越來越嚴(yán)格了,相關(guān)的法律法規(guī)也越來越完善細(xì)致。對于一般的小網(wǎng)站,要保證自己平臺的內(nèi)容合法、不違規(guī),需要花費(fèi)相當(dāng)大的人力、財(cái)力去維護(hù)。而一旦使用百度的內(nèi)容審核功能,只要做好相關(guān)的策略設(shè)置,就能保證用戶上傳的圖片、發(fā)表的言論、文章符合國家的規(guī)定,可以節(jié)省很大的維護(hù)成本。

不過,目前圖片審核還缺少版權(quán)審核,如果百度以后能加上圖片版權(quán)識別功能的話,那就更加完善了,特別是對于一些正規(guī)、大型的有圖片功能相關(guān)的網(wǎng)站,如果再加上圖片版權(quán)審核功能,也就不用擔(dān)心圖片版權(quán)問題了。

同理,文本審核也還缺少文章的版權(quán)審核功能,后期如果能夠加上文章版權(quán)審核功能,那就更完善了,也能更好的保護(hù)作者的勞動(dòng)成功。甚至可以將文章版權(quán)審核功能獨(dú)立出來,做成一個(gè)文章版權(quán)查詢的工具,更方便作者進(jìn)行維權(quán),降低盜版行為,提高大家的版權(quán)保護(hù)意識。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2019-10-29
體驗(yàn)百度大腦一站式內(nèi)容審核平臺,提升審核效率、降低人工審核成本!
一、背景近期體驗(yàn)了百度大腦內(nèi)容審核平臺,可以通過界面化的操作,定制審核模型,完美契合業(yè)務(wù)審核需求,提升審核效率,降低人工成本,個(gè)人感覺對一些產(chǎn)生豐富UGC內(nèi)容的

長按掃碼 閱讀全文