色情主播的天敵:AI大牛解密人工智能鑒黃的那些事

目前多家人工智能公司已開始布局鑒黃業(yè)務(wù),阿里巴巴和騰訊分別擁有阿里綠網(wǎng)、萬象優(yōu)圖兩大鑒黃系統(tǒng)。而在創(chuàng)業(yè)公司方面,較為知名的有圖普科技、飛搜科技、深圖智服等公司。

近期在線直播火爆,因此有些公司開始切入直播鑒黃這個(gè)細(xì)分領(lǐng)域。為此,雷鋒網(wǎng)(公眾號(hào):雷鋒網(wǎng))就以下問題請(qǐng)教了來自專攻色情識(shí)別的圖普科技和在計(jì)算機(jī)視覺公司云從科技的技術(shù)專家進(jìn)行解讀。

直播(如花椒、映客)、在線視頻(如優(yōu)酷、愛奇藝)、圖片鑒黃的區(qū)別在哪兒?直播的鑒黃難度是否最大?要解決哪些技術(shù)問題?

云從科技高級(jí)算法工程師周翔:

其實(shí)這三項(xiàng)(直播,在線視頻,圖片鑒黃)差異不大,三者都可歸類為實(shí)時(shí)視頻處理和海量圖片處理。

視頻/直播是動(dòng)態(tài)的,圖片是靜態(tài)的。鑒別視頻和直播時(shí),可以把動(dòng)態(tài)內(nèi)容解碼變成圖片幀來判斷,這樣就與靜態(tài)圖片鑒別沒差了。

至于技術(shù)問題,其實(shí)鑒黃在算法層面難度并不高,利用深度學(xué)習(xí)算法訓(xùn)練后,就能達(dá)到不錯(cuò)的鑒黃效果。

圖普科技工程師則在計(jì)算能力和算法要求上做了一些小補(bǔ)充:

目前主要是通過間隔截圖、關(guān)鍵幀截圖之類的對(duì)直播和在線視頻進(jìn)行識(shí)別處理,所以最終也是對(duì)單張圖片的處理。

但是,由于直播的實(shí)時(shí)性,所以直播相對(duì)于另外在線視頻和圖片,對(duì)于機(jī)器的圖片識(shí)別的處理速度要求較高,這主要是對(duì)于計(jì)算能力和算法的要求加大。

至于是屏蔽、刪除或者禁播等方面的處理,主要是看業(yè)務(wù)方,可以選擇由機(jī)器自動(dòng)處理或者人工介入。

既然算法門檻不是很高,為什么一些 CV 公司不增一項(xiàng)視頻/直播鑒黃業(yè)務(wù)撈點(diǎn)油水?

云從科技高級(jí)算法工程師周翔:

一方面是他們不太愿意做。

另一方面雖然 CV 公司可能有現(xiàn)成的鑒黃算法訓(xùn)練系統(tǒng)平臺(tái),但是他們?nèi)睌?shù)據(jù)。鑒黃需要大量的數(shù)據(jù)來進(jìn)行訓(xùn)練。黃色圖片和視頻幀最好達(dá)到十萬的量級(jí)深度學(xué)習(xí)才能跑起來。至于如何收集這些數(shù)據(jù),一般情況下很多視頻直播都已經(jīng)有現(xiàn)成的,包括鑒黃中心等都有非常大量的此類圖片。

剛提到大批量數(shù)據(jù)用深度學(xué)習(xí)來訓(xùn)練,而訓(xùn)練小批量數(shù)據(jù)一般采用傳統(tǒng)的特征分析加分類器算法來做,但效果和精度沒有目前的深度學(xué)習(xí)高。

直播鑒黃是不是要識(shí)別里面的每一幀圖像,這樣計(jì)算量豈不是很大?

圖普科技工程師:

這與算法能力關(guān)系不大,在算法和工程能力都已經(jīng)達(dá)到最優(yōu)的情況下,這個(gè)是屬于企業(yè)的成本預(yù)算問題。

直播是視頻流,企業(yè)如果對(duì)直播的每一幀的圖片都進(jìn)行識(shí)別,這是非常巨大的數(shù)據(jù)量,企業(yè)的運(yùn)營(yíng)成本自然較高。所以我們一般建議企業(yè)按自己的需求,對(duì)于視頻先進(jìn)行抽幀處理,例如一分鐘視頻的視頻可以按照時(shí)間段抽 6-15 幀左右的圖片進(jìn)行識(shí)別處理之類的來控制成本。

鑒黃存在哪些難點(diǎn)?

云從科技高級(jí)算法工程師周翔:

實(shí)時(shí)視頻影像分析大致通過三大方面進(jìn)行鑒定:

是否有人物(有:色情概率增加)

人形輪廓的膚色比例(大:色情概率增加)

姿態(tài)分析(性行為姿勢(shì):色情概率增加)

人類對(duì)于色情的定義較為廣泛,多種情況下對(duì)于色情的鑒定標(biāo)準(zhǔn)也會(huì)有不同。在這基礎(chǔ)上其實(shí)對(duì)于黃色和非黃色圖片的區(qū)分,有時(shí)候不是特別明顯,很難判斷。舉個(gè)通俗的例子,赤裸上身的男子照片(屬于膚色比例大),這種圖片本質(zhì)上屬于非黃色圖片,但很多時(shí)候,因?yàn)橛?xùn)練數(shù)據(jù)里有類似圖片被判定為黃色圖像,存在判錯(cuò)的問題。因此需要利用大量樣本去不斷地訓(xùn)練它,讓機(jī)器不斷糾正,學(xué)習(xí)更多特征避免這種“低級(jí)錯(cuò)誤”。

這也正是上面提到部分 CV 公司不涉入鑒黃業(yè)務(wù)的原因,因?yàn)橐恢毙枰罅繕颖救ゲ粩嘤?xùn)練、糾正,工程量挺大。

鑒黃的數(shù)據(jù)訓(xùn)練過程是什么樣的?

圖普科技工程師:

通俗講,可以把深度學(xué)習(xí)理解為一個(gè)空白的大腦,海量數(shù)據(jù)就是灌輸進(jìn)來的經(jīng)驗(yàn)。當(dāng)我們把大量的色情、性感、正常的樣本的屬性告訴深度學(xué)習(xí)的引擎, 讓引擎不斷學(xué)習(xí),然后把他們做對(duì)的進(jìn)行獎(jiǎng)勵(lì),做錯(cuò)的就懲罰,當(dāng)然這些獎(jiǎng)勵(lì)和懲罰都是數(shù)學(xué)上的,最后空白的腦袋就會(huì)學(xué)成了一種連接的模型,這種模型就是為了鑒別色情與非色情而生的。

綜合上述內(nèi)容,AI 科技評(píng)論把人工智能鑒黃總結(jié)為以下幾點(diǎn):

實(shí)時(shí)視頻影像分析大致要從三個(gè)方向鑒定:是否有人物、人形輪廓的膚色比例、姿態(tài)分析。

直播/視頻和圖片鑒黃區(qū)別不大,把動(dòng)態(tài)視頻解碼為圖片幀就與圖片沒差了。視頻鑒黃不會(huì)對(duì)每一幀進(jìn)行識(shí)別,一般是從固定時(shí)間段里抽取幾幀進(jìn)行識(shí)別。

黃色的圖片和視頻幀最好達(dá)到十萬的量級(jí),深度學(xué)習(xí)才能跑起來。而訓(xùn)練小批量數(shù)據(jù)一般采用傳統(tǒng)的特征分析加分類器算法來做,但效果和精度不如深度學(xué)習(xí)。

屏蔽、刪除或者禁播等方面的處理,主要是看業(yè)務(wù)方,可以選擇由機(jī)器自動(dòng)處理或者人工介入。

最后,鑒黃的棘手之處主要是難以掌握色情和非色情的臨界點(diǎn),機(jī)器容易把正常圖片(如男生上身半裸圖片)誤判為色情圖片,因此需要大量的數(shù)據(jù)不斷去訓(xùn)練和糾正,是個(gè)慢熬的苦差事,這也是部分 CV 公司不涉入鑒黃業(yè)務(wù)的一大原因。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2016-11-10
色情主播的天敵:AI大牛解密人工智能鑒黃的那些事
目前多家人工智能公司已開始布局鑒黃業(yè)務(wù),阿里巴巴和騰訊分別擁有阿里綠網(wǎng)、萬象優(yōu)圖兩大鑒黃系統(tǒng)。而在創(chuàng)業(yè)公司方面,較為知名的有圖普科技、飛搜科技、深圖智服等公司。

長(zhǎng)按掃碼 閱讀全文