牛臉識別準(zhǔn)不準(zhǔn)

我國人臉識別的準(zhǔn)確率非常之高,已經(jīng)達(dá)到了百分之九十五以上,牛臉識別的準(zhǔn)確率是多少呢?能不能進(jìn)行商業(yè)化推廣?筆者從事多年面部識別,經(jīng)常有朋友問到這個問題,這里就做個科普性介紹。


十年前,隨著人臉識別的興起,國內(nèi)互聯(lián)網(wǎng)大廠蜂擁介入牛臉豬臉等畜臉識別,因為準(zhǔn)確率難以提高導(dǎo)致的難以商業(yè)推廣,現(xiàn)在已經(jīng)基本停止。


牛臉識別的準(zhǔn)確率,與學(xué)習(xí)樣本數(shù)、基準(zhǔn)身份證的精確采集、特征點(diǎn)的選擇及數(shù)量、動物的成長時間差、比對動物的數(shù)量等各種因素密切相關(guān)。一般類似實驗室條件下,以上因素做到極致,并且比對動物的數(shù)量在百頭以下,可能達(dá)到百分之九十左右。如果是實際場景,一般就在百分之七八十甚至更低。下面就各種影響因素與人臉識別進(jìn)行逐一對比討論:


首先,動物基準(zhǔn)身份證的難以建立。臉部識別要有一個基準(zhǔn)身份證。人有身份證,動物也要建立這個基準(zhǔn)身份證以選擇特征點(diǎn)。


人的身份證照片拍攝,相信大家都有體會:具備資質(zhì)的照相館、布置后的白色背景、有經(jīng)驗的攝影師,燈光的調(diào)整,身體及頭部的調(diào)整,拍攝好上傳公安系統(tǒng)審核是否合格。


這一切基于人是理性聽話的,動物怎么辦?而且動物臉部識別要左中右三面,只能是圍繞動物臉部拍攝一小段視頻,后臺盡可能抓取合適的照片來作為基準(zhǔn)。但動物對人的恐懼,怎么能聽話的任你拍攝?何況背景及光線怎么處理?拍攝者是否專業(yè)?拍攝的設(shè)備是否一致?所以動物基準(zhǔn)身份證的準(zhǔn)確建立是個無比繁瑣的問題。基準(zhǔn)身份證不準(zhǔn),下一步的比對怎么能準(zhǔn)?


其次,動物的成長性困擾。成長就會發(fā)生變化,人一般也要根據(jù)成長,從青少年開始,十年或二十年更換身份證。而動物的成長更快,幾年甚至幾個月就要長大出欄或淘汰,幾個月或半年就做一次基準(zhǔn)身份證嗎?


第三,種群的區(qū)別以及大規(guī)模樣本數(shù)的模型學(xué)習(xí)帶來的問題。人類也分黃白黑等人種,每個人種都要建立學(xué)習(xí)模型,要大規(guī)模的樣本數(shù)提供給模型學(xué)習(xí)。我國對白種人及黑種人的識別率就遠(yuǎn)遠(yuǎn)低于黃種人的識別率。而同一種動物,比如牛的種群類要遠(yuǎn)遠(yuǎn)多于人類,肉牛、奶牛、肉奶兩用牛、牦牛等等,這些牛按產(chǎn)地不同又有很大不同,比如肉牛中的黃牛,相鄰省份就可能不同。再加上引進(jìn)的國外各種牛,比如西門塔爾牛、安格斯牛等等,還有國內(nèi)各地對這些?;ハ嘀g的雜交牛及二次三次雜交牛,種類如此繁雜,就要分別建立模型,進(jìn)行大規(guī)模的樣本數(shù)進(jìn)行學(xué)習(xí)。


我國對黃種人的人臉識別經(jīng)過了千萬級別樣本數(shù)的學(xué)習(xí)。牛臉識別,某一種牛,樣本數(shù)幾千幾萬的采集都不容易。種類如此之多,每一類都要建立模型收集樣本數(shù)來學(xué)習(xí),這如何能做到?


第四,動物比對的近親屬相似性帶來的不準(zhǔn)。動物一般是近親繁殖,比如豬的養(yǎng)殖,一個養(yǎng)殖場的某一代豬,基本就那幾個父親,一個欄里的一二十頭基本是同一個母親。而人類雙胞胎的人臉識別還沒有解決,豬雖然不是同卵,但也是極其相似,更何況其快速的成長性。


所以,現(xiàn)在誰來談豬臉識別,誰就是騙子無疑了。 牛比豬的情況要好一些,一般是單胎。但種公牛也是那么幾頭,而種母牛又是高度近親。這高度的相似性,必然導(dǎo)致識別準(zhǔn)確率的極大降低。


第五,死活比對帶來的嚴(yán)重偏差。 以上四點(diǎn)是活活比對之難,而死活比對更是難上加難。比如牛臉識別在個別保險公司的試用:承保時對動物建立基準(zhǔn)身份證,動物死了進(jìn)行理賠。這就要進(jìn)行死活比對了。


動物死了,面部每時每刻都在發(fā)生變化,一個小時的變化已經(jīng)非常大了,何況保險理賠到達(dá)現(xiàn)場的時間很難按小時計,這識別率怎么能高?


最要命的是每頭死牛由于環(huán)境季節(jié),每時每刻的變化不同,怎么抓取樣本來學(xué)習(xí)?這已經(jīng)是無解問題了。


綜上,我們已經(jīng)明白了牛臉識別的準(zhǔn)確率非常低。


而如此低的識別率,有些使用者,比如對準(zhǔn)確率要求近乎百分之百的保險行業(yè),理賠時面對的還是死活比對,但試用的個別公司卻感覺很準(zhǔn)。為什么?


技術(shù)提供方調(diào)整了相似度閾值! 為了看似高的準(zhǔn)確率,將相似度閾值從100調(diào)整到了50。這樣能不準(zhǔn)嗎?


但是,承保時候的牛叫張三,現(xiàn)在死的牛,可能是張三也可能是李四、王五、趙六等等。如果李四王五趙六等牛之前并不在承保范圍內(nèi)呢?保險公司一樣要賠付。


目前,除了個別的商業(yè)性試用,規(guī)模的商業(yè)性推廣基本沒有。除了準(zhǔn)確率低,還有一個重大問題即法律合規(guī)性問題。人臉識別尚且不能作為法律依據(jù),牛臉識別遠(yuǎn)遠(yuǎn)低于人臉識別的準(zhǔn)確率,如何能作為依據(jù)?比如保險公司承保的牛死了,養(yǎng)殖戶不認(rèn)可牛臉識別的結(jié)果,發(fā)生了法律糾紛,保險公司必定敗訴,所以很少有公司敢進(jìn)行商業(yè)化推廣。


(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )