由于眾所周知的原因,中國成為了人臉識別技術(shù)成長的最佳沃土。據(jù)統(tǒng)計,2016年中國平安城市的相關招標額總計達到660億元,而整個中國安防行業(yè)的規(guī)模更是千億級市場。據(jù)中安網(wǎng)數(shù)據(jù)顯示,中國安防行業(yè)市場規(guī)模從2012年的3240億元增長到2016年的5400億元,年復合增長率達到驚人的15%,而其中2016年視頻監(jiān)控產(chǎn)品產(chǎn)值約達到962億元。
而在技術(shù)方面,中國視頻監(jiān)控行業(yè)在經(jīng)歷了過去十年的高清化、網(wǎng)格化的升級迭代后,已經(jīng)形成了累計投入近萬億的硬件基礎設施。在視頻監(jiān)控領域完成“看得見、看得清”兩步以后,人臉識別技術(shù)就猶如“看得懂”這臨門一腳,成為實現(xiàn)“AI+安防”最重要的一步,若是人臉識別技術(shù)確實能為安防這個正在不斷被做大的千億級蛋糕增加畫龍點睛的一筆,其市場規(guī)模足以令人驚嘆。
云從科技有限公司CFO陳琳在接受本刊采訪時表示:“2017年,基于人臉識別技術(shù)的安防市場將會迎來一次大爆發(fā)。主要有兩大原因,首先,安防是絕對的市場剛需,與金融等其他應用領域‘求穩(wěn)’的特點不同,安防的特點是‘爆發(fā)性',只要效用明顯,便會迅速且大范圍的推廣使用;其次,安防領域過去之所以沒有大范圍采用人臉識別技術(shù),主要是由于當時的技術(shù)水平不過關而造成的,而今天的人臉識別技術(shù)已經(jīng)足夠成熟,能夠真正提升整體的安防技術(shù)水平。而從實際應用案例的角度來看,比如2016年3月在廣州的人臉識別技術(shù)應用測試中,當時日本NEC以及德國科力達公司的人臉識別技術(shù),在千萬級的人口庫中只能做到5%的TOP1命中率,這完全達不到實際應用的要求,而我們的測試結(jié)果則達到了50%以上的命中率,可以在實際的安防應用項目中發(fā)揮很好的效果。而且,我們相信未來隨著摩爾定律的不斷發(fā)展,AI賦能下的人臉識別技術(shù)將會在安防領域創(chuàng)造更多更為豐富的應用。”
之所以能夠做到如此高水平的應用能力,云從科技仰賴的是“攝像頭模組+核心AI算法”軟硬件一體化的解決方案。陳琳告訴記者:“在硬件方面,目前的存量攝像頭采集的照片,無論是從分辨率還是拍攝角度來看,都不足以用來做人臉識別,雖然用于場景分析的問題不大,但不能進一步分析具體的面部細節(jié),這也就造成人臉識別技術(shù)無法充分發(fā)揮效能。因此,我們認為軟硬件的良好結(jié)合就顯得尤為必要,在人臉識別技術(shù)切入安防領域時,一定要重新安裝更為匹配的攝像頭,針對一些新的角度來增加部署,這就是我們做軟硬件一體化方案的重要原因。”
而在軟件層面上,云從則構(gòu)建了“雙層異構(gòu)深度神經(jīng)網(wǎng)絡+結(jié)構(gòu)化生成模型+多維度決策系統(tǒng)+GPU訓練集群”的AI算法架構(gòu),來實現(xiàn)可靠而穩(wěn)定的人臉識別能力。對此,陳琳解釋到:“首先,雙層異構(gòu)深度神經(jīng)網(wǎng)絡模型有助于解決跨場景人臉識別的問題,通過多任務學習目標函數(shù),能夠在數(shù)十億的數(shù)據(jù)集中選取有效的樣本進行訓練,克服了樣本選擇難的問題;其次,結(jié)構(gòu)化生成模型可以利用已有的陣列數(shù)據(jù)生成角度、光照以及表情模型,并通過這些模型來模擬真實場景的光照、角度以及表情信息,從而生成大量不同光照、角度以及表情的數(shù)據(jù),最后利用生成對抗網(wǎng)絡(GAN)的思想,能夠保證生成的數(shù)據(jù)沒有失真,同時又模擬了復雜的場景,從而保證訓練的有效性;此外,多維度決策系統(tǒng)能夠搜集全局深度學習特征,比如人臉屬性、表情、角度、光照、發(fā)型以及嘴巴、眉眼、鼻子等局部特征,進而利用遷移學習技術(shù)來訓練不同角度的模型,從而融合所有的特征進行相似度的綜合計算;最后,通過超過500塊顯卡的GPU管理平臺進行資源的智能調(diào)度,實現(xiàn)高效的深度學習訓練,能夠在1天的時間內(nèi)完成10億人臉數(shù)據(jù)的訓練,從而每天處理超過100個的任務。除此,針對安防領域的實際應用,還需要針對模糊圖像來進行算法層面上的提升,并增強對光線、角度等不利因素的魯棒性,以及提高人臉特征檢索速度,使得能在很短的時間內(nèi)在億級人臉圖像庫中檢索。目前公司的產(chǎn)品方案已經(jīng)在全國22個省進行了上線實戰(zhàn)(比如省級靜態(tài)大庫刑總的應用、千路門禁小區(qū)和平安城市融合應用等),并獲得了公安部的高度認可,引領了公安行業(yè)戰(zhàn)法的變革?!?/p>
北京飛搜科技有限公司首席專家董遠表示:“針對安防這塊龐大的應用市場,我們主要從軟件層面出發(fā),核心技術(shù)是基于深度學習(卷積神經(jīng)網(wǎng)絡)的人臉識別算法。截止目前,我們開發(fā)出了To B的多個在線API以及離線SDK產(chǎn)品線,其中包括人臉檢測、特征點定位(包含5點、27點、68點以及194點)、人臉識別(人臉校驗1:1,人臉檢索1:N)、人臉屬性識別(性別、年齡、種族以及顏值等)以及目標/場景識別等。通過與業(yè)內(nèi)其他應用型廠商之間的合作,我們的人臉識別監(jiān)控方案已經(jīng)成功在新疆、內(nèi)蒙、陜西以及甘肅等西北區(qū)域的智能安防項目當中實現(xiàn)了落地應用,目前已經(jīng)成為監(jiān)控平臺的技術(shù)集成商?!?/p>
而針對具體的安防應用,董遠也十分贊同“軟硬結(jié)合”的方式,他表示:“如果對人臉識別的準確率有較高的期待,則在實際項目當中會對攝像機的分辨率、焦距、光線以及角度等方面都有比較嚴格的技術(shù)要求。在我們實際的安防項目當中,我們會盡力的使用高分辨率的攝像頭,同時結(jié)合人臉追蹤、超分辨率、圖像質(zhì)量以及人臉角度判別技術(shù),在攝像頭的視頻流當中,選取質(zhì)量最好的人臉來進行識別,從而提高人臉識別的整體精度。此外,表情事實上對于人臉識別的精度沒有影響,而戴眼鏡的人臉會對精度產(chǎn)生較大影響。”
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )