人臉識(shí)別最全知識(shí)圖譜,教你開(kāi)發(fā)時(shí)如何避開(kāi)認(rèn)知誤區(qū)

作為人工智能領(lǐng)域少有的算法研究和商業(yè)應(yīng)用都相當(dāng)成熟的技術(shù),人臉識(shí)別近幾年火熱異常。但由于其技術(shù)門(mén)檻較高,一些新入門(mén)的開(kāi)發(fā)者往往對(duì)人臉識(shí)別存在很多認(rèn)知誤區(qū),如簡(jiǎn)單地認(rèn)為識(shí)別率越高,算法越好;可檢測(cè)的關(guān)鍵點(diǎn)越多,識(shí)別比對(duì)效果越出色……接下來(lái)筆者就以自身使用虹軟視覺(jué)開(kāi)放平臺(tái)免費(fèi)離線(xiàn)SDK ArcFace3.0做開(kāi)發(fā)的經(jīng)歷來(lái)為大家講講,要如何避開(kāi)這些誤區(qū)。

這里先簡(jiǎn)單介紹一下ArcFace3.0,該SDK對(duì)人臉識(shí)別、活體檢測(cè)、年齡檢測(cè)、性別檢測(cè)等核心算法模型進(jìn)行了全面升級(jí),其算法魯棒性大幅提升,接入門(mén)檻顯著降低,可同時(shí)支持Windows、iOS、Android(包含Android10)、Linux,性能與開(kāi)發(fā)效率也有了整體提升,同樣秉承了開(kāi)放平臺(tái)免費(fèi)、離線(xiàn)的核心,進(jìn)而成為了廣大開(kāi)發(fā)者落地AI應(yīng)用的利器。

人臉識(shí)別最全知識(shí)圖譜,教你開(kāi)發(fā)時(shí)如何避開(kāi)認(rèn)知誤區(qū)

常見(jiàn)誤區(qū)一:“人臉檢測(cè)”就是“人臉識(shí)別”?

事實(shí)上,“人臉檢測(cè)”只是人臉識(shí)別完整流程中的一個(gè)環(huán)節(jié)。在用攝像頭采集含有人臉的圖像或視頻流后,首先就需要用人臉檢測(cè)技術(shù)自動(dòng)檢測(cè)、提取當(dāng)中的人臉,隨后才能進(jìn)入人臉圖像預(yù)處理及最核心的人臉特征提取環(huán)節(jié)。

但在實(shí)際商業(yè)化落地中,人臉檢測(cè)也可獨(dú)立于人臉識(shí)別進(jìn)行使用。譬如瀘州云龍機(jī)場(chǎng)就布置了智能零售服務(wù)機(jī)器人,可以通過(guò)人臉檢測(cè)功能自動(dòng)尋找顧客并提供服務(wù)。其智能零售服務(wù)機(jī)器人就是采用了虹軟視覺(jué)開(kāi)放平臺(tái)的人臉識(shí)別算法。

虹軟推出的ArcFace3.0 SDK囊括了人臉檢測(cè)、性別檢測(cè)、年齡檢測(cè)等技術(shù),結(jié)合使用可應(yīng)用于商業(yè)迎賓機(jī)器人、自動(dòng)廣告機(jī)等產(chǎn)品。

常見(jiàn)誤區(qū)二:人臉識(shí)別的準(zhǔn)確率越高越好嗎?

理想狀態(tài)下,“人臉識(shí)別準(zhǔn)確率”當(dāng)然越高越好,但算法在產(chǎn)品化使用時(shí)會(huì)受到逆光、暗光、強(qiáng)光、識(shí)別角度等諸多因素的影響。相同算法,在實(shí)驗(yàn)室環(huán)境中與不同的實(shí)際應(yīng)用環(huán)境中,所表現(xiàn)出的識(shí)別準(zhǔn)確率都存在一定差異。因此,脫離使用場(chǎng)景單純考量算法的識(shí)別準(zhǔn)確率參考價(jià)值不大。

業(yè)界更多會(huì)采用“認(rèn)假率(FAR,又稱(chēng)誤識(shí)率,把某人誤識(shí)為其他人)”和“拒真率(FRR拒真率,本人注冊(cè)在底庫(kù)中,但比對(duì)相似度達(dá)到不預(yù)定的值)”,來(lái)作為評(píng)判算法的依據(jù)。另外還有識(shí)別速度、活體攻擊成功率、人臉檢測(cè)成功率等維度,也可作為評(píng)判算法優(yōu)劣的參考依據(jù)。

盡管FAR和FRR都越低越好,但兩個(gè)指標(biāo)是一個(gè)蹺蹺板,一個(gè)指標(biāo)的降低會(huì)意味著另一個(gè)指標(biāo)會(huì)升高,所以需要實(shí)現(xiàn)兩者間的平衡。

人臉識(shí)別算法一般會(huì)設(shè)定一個(gè)閾值作為評(píng)判通過(guò)與否的標(biāo)準(zhǔn),該閾值一般是用分?jǐn)?shù)或者百分比來(lái)衡量。當(dāng)人臉比對(duì)的相似度值大于此閾值時(shí),則比對(duì)通過(guò),否則比對(duì)失敗。每個(gè)閾值都可以統(tǒng)計(jì)對(duì)應(yīng)的FAR/FRR,不同閾值的FAR/FRR值可繪成ROC曲線(xiàn)(Receiver Operating Curve),我們可以通過(guò)ROC曲線(xiàn)選定一個(gè)合理的閾值點(diǎn)。

人臉識(shí)別最全知識(shí)圖譜,教你開(kāi)發(fā)時(shí)如何避開(kāi)認(rèn)知誤區(qū)

常見(jiàn)誤區(qū)三:人臉關(guān)鍵點(diǎn)越多,人臉比對(duì)效果越好?

人臉關(guān)鍵點(diǎn)技術(shù)在人臉識(shí)別的一系列環(huán)節(jié)中,確實(shí)有所應(yīng)用。但它并不是使用在最核心的人臉比對(duì)中,而是在前置的人臉圖像預(yù)處理環(huán)節(jié)中。因此,確保人臉五官基礎(chǔ)關(guān)鍵點(diǎn)數(shù)量及準(zhǔn)確性即可,無(wú)需一味追求過(guò)多關(guān)鍵點(diǎn)的數(shù)量。

當(dāng)前主流的人臉識(shí)別算法,在進(jìn)行最核心的人臉比對(duì)時(shí),主要依靠人臉特征值的比對(duì)。所謂特征值,即面部特征所組成的信息集。我們辨別一個(gè)人的特征,可能會(huì)記住他是雙眼皮、黑眼睛、藍(lán)色頭發(fā)、塌鼻梁……但人工智能算法可以辨別和記住的面部特征會(huì)比肉眼所能觀(guān)察到的多很多。

人臉識(shí)別算法通過(guò)深度學(xué)習(xí),利用卷積神經(jīng)網(wǎng)絡(luò)對(duì)海量人臉圖片進(jìn)行學(xué)習(xí),借助輸入圖像,提取出對(duì)區(qū)分不同人臉的特征向量,以替代人工設(shè)計(jì)的特征。每張人臉在算法中都有一組對(duì)應(yīng)的特征值,這也是進(jìn)行人臉比對(duì)的依據(jù)。同一人的不同照片提取出的特征值,在特征空間里距離很近,不同人的臉在特征空間里相距較遠(yuǎn)。

雖然人臉關(guān)鍵點(diǎn)不會(huì)直接作用于人臉比對(duì),但在人臉圖像預(yù)處理環(huán)節(jié),依舊有重要作用。事實(shí)上,通過(guò)人臉檢測(cè)提取到人臉圖像質(zhì)量參差不齊,角度各異。而在虹軟ArcFace3.0算法中,利用人臉關(guān)鍵點(diǎn)技術(shù)可準(zhǔn)確定位出人臉五官位置,使用仿射變換將人臉統(tǒng)一“擺正”,盡量消除姿勢(shì)不同帶來(lái)的誤差,為算法準(zhǔn)確提取人臉特征值提供保障。

常見(jiàn)誤區(qū)四:用照片或者視頻能否通過(guò)人臉識(shí)別?

在成熟的人臉識(shí)別應(yīng)用中,都會(huì)加入活體檢測(cè)技術(shù)。所謂活體檢測(cè),即驗(yàn)證用戶(hù)是否為真實(shí)活體本人在操作,可有效抵御照片、視頻等常見(jiàn)的攻擊手段,是金融、政務(wù)等無(wú)人值守應(yīng)用中幾乎是標(biāo)配。

在交互方式上,活體檢測(cè)可分為靜默式和配合式,配合式需要結(jié)合搖頭、眨眼、唇語(yǔ)等方式配合,靜默式則不需要用戶(hù)配合動(dòng)作,相比配合式算法層面要求更高,體驗(yàn)更好。

目前市場(chǎng)上主流的而在靜默式活體檢測(cè)中,同樣以上文提及的虹軟視覺(jué)開(kāi)放平臺(tái)為例,該平臺(tái)已經(jīng)免費(fèi)開(kāi)放了RGB單目活體檢測(cè)、IR活體檢測(cè)兩種算法,并在最新推出的ArcFace3.0中進(jìn)行了模型更新,全面提升了算法魯棒性。其中的RGB單目活體采用普通RGB攝像頭即可,通過(guò)分析采集摩爾紋、成像畸形、反射率等人像破綻,從而獲得活體檢測(cè)所需要的識(shí)別信息,多維度的識(shí)別依據(jù)保證了識(shí)別的準(zhǔn)確性。而IR活體檢測(cè),則是在此基礎(chǔ)上,充分利用了紅外成像中屏幕類(lèi)無(wú)法成像的原理,進(jìn)一步加強(qiáng)了電子屏的攻擊防范。

常見(jiàn)誤區(qū)五:大面積遮擋下還能進(jìn)行人臉識(shí)別嗎?

在人臉識(shí)別領(lǐng)域中,大面積人臉遮擋一直是公認(rèn)的識(shí)別難題,難點(diǎn)主要體現(xiàn)在:

第一,人臉識(shí)別算法主要依據(jù)人臉面部特征進(jìn)行身份判定,臉部大量遮擋時(shí),算法無(wú)法準(zhǔn)確檢測(cè)人臉位置、定位五官關(guān)鍵點(diǎn),大大降低了識(shí)別效果。

第二,人臉識(shí)別算法使用的深度學(xué)習(xí)技術(shù)依賴(lài)海量的訓(xùn)練數(shù)據(jù),短期內(nèi)難以收集到大量面部遮擋的照片,并進(jìn)行人工標(biāo)注;

第三,人臉識(shí)別算法包含多重模塊,面部遮擋影響的不僅僅是人臉比對(duì)模塊,還會(huì)影響到人臉檢測(cè)、跟蹤等多個(gè)模塊,對(duì)整個(gè)系統(tǒng)帶來(lái)很大的干擾影響。

能否在大面積遮擋的條件下進(jìn)行人臉識(shí)別,對(duì)算法要求比較高。近段時(shí)間,虹軟視覺(jué)開(kāi)放平臺(tái)針對(duì)個(gè)人防護(hù)中所造成的人臉大面積遮擋問(wèn)題,進(jìn)行了算法模型針對(duì)性升級(jí),提升人臉可見(jiàn)區(qū)域權(quán)重,在局部特征增強(qiáng)方面設(shè)計(jì)了相應(yīng)策略,如加強(qiáng)了對(duì)眼睛、眉毛等重點(diǎn)區(qū)域的識(shí)別,大面積遮擋下的人臉識(shí)別準(zhǔn)確率達(dá)99.5%以上。

對(duì)于很多剛進(jìn)入人臉識(shí)別領(lǐng)域的開(kāi)發(fā)者而言,很多算法細(xì)節(jié)都需要親自上手感受過(guò),才能明白個(gè)中精微之處。建議新手開(kāi)發(fā)者可以嘗試虹軟視覺(jué)開(kāi)放平臺(tái)免費(fèi)開(kāi)放的ArcFace3.0 SDK,下載即可使用,新版本對(duì)人臉識(shí)別、活體檢測(cè)、年齡檢測(cè)、性別檢測(cè)等核心算法模型進(jìn)行全面升級(jí),大幅提升算法魯棒性,顯著降低接入門(mén)檻,同時(shí)支持Windows、iOS、Android(包含Android10)、Linux,在性能和開(kāi)發(fā)效率上進(jìn)行了整體提升,還可以離線(xiàn)使用,對(duì)開(kāi)發(fā)者來(lái)說(shuō)非常實(shí)用。

實(shí)際使用中,開(kāi)發(fā)者往往會(huì)提出一系列細(xì)節(jié)問(wèn)題。為幫助開(kāi)發(fā)者快速上手,前段時(shí)間虹軟工程師團(tuán)隊(duì)推出了一系列課程,以技術(shù)解析和專(zhuān)項(xiàng)答疑等形式幫助開(kāi)發(fā)者解決難題。前后幾期課程分別講解了安卓端AI應(yīng)用開(kāi)發(fā)技巧,如何快速接入Windows版本的ArcFace 3.0 SDK,還有Java服務(wù)端開(kāi)發(fā)技巧,以及對(duì)常見(jiàn)問(wèn)題的答疑,建議感興趣的開(kāi)發(fā)者朋友可以登陸虹軟開(kāi)放平臺(tái)官網(wǎng)觀(guān)看學(xué)習(xí)。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )