雷鋒網(wǎng)按:卡內基梅隆大學剛剛發(fā)布了其關于人臉識別的最新研究,由其改進的算法能夠從圖片中提取并編碼關鍵信息,也就是說能從人海中迅速提取面部信息。目前是人臉識別最熱門的創(chuàng)業(yè)方向之一,卡內基梅隆大學的這項技術研究對于產業(yè)界的應用將起到很大的推動作用。
無論是在茫茫人海中提取面部信息,還是在大圖中識別出遠處/細小的物體,都對計算機視覺圖形提出了非常大的挑戰(zhàn)。憑借著多年的技術積淀,來自卡內基梅隆大學的科研團隊終于找到了其中的訣竅——成功識別細小對象的關鍵就是尋找與之匹配的更大物體。
這種能夠從圖片中提取并編碼關鍵信息的改進算法,是由副教授 Deva Ramanan 和博士生 Peiyun Hu 共同推進的,可謂是識別微型人臉里程上的重大進步。
在面部的基準測試集中,此前的方法只能識別出 29% 到 64% 之間的正確人類面孔,而她們所提出的改進版算法減少了兩個導致誤差的隱私,從而將正確率提高到了 81%。
Ramanan 說道:「這就像是尋找在某個人手中的一根牙簽。當你提示對象可能會使用牙簽的時候你就會非常容易看到它。手指的方位,手部的動作和位置都為我們最終找到這根牙簽提供了非常重要的線索?!?/p>
同樣,為了尋找那些只有極少像素點的的面部,更大照片中的身體或者人群照片都能提供諸多線索。
對于微型面部的提取擁有廣闊的應用前景,例如統(tǒng)計人群數(shù)量等等。而延伸至微型物體的需求日益突顯,就拿自動駕駛汽車來說當車速越來越快,必然需要時刻監(jiān)視和評估交通狀況,必然需要對遠處的物體進行充分且正確的識別,才能做出正確的反應。
Ramanan 表示通過輔助關聯(lián)信息來幫助識別對象并不是什么新鮮的概念。然而,在實際系統(tǒng)中很難去闡述和表達這種直覺。這是因為對關聯(lián)信息的編碼通常涉及到「高緯度描述」(High-Dimensional Descriptors),其中包含大量信息但是使用起來卻是非常的麻煩。
他和 Hu 所研發(fā)的方法是使用了「中央凹描述」(Foveal Descriptors),模擬人類視覺結構對關聯(lián)信息進行編碼。中央凹是視網(wǎng)膜中視覺(辨色力、分辨力)最敏銳的區(qū)域,這種方法為圖片的小塊區(qū)域提供了清晰的細節(jié),而周圍區(qū)域則比較的模糊。
通過模糊外部圖像,中心凹描述提供了充足的關聯(lián)信息,在高度聚焦下幫助理解這個區(qū)域所展示的內容,而且極大的降低了計算負擔?;谶@種方式,Hu 和 Ramanan 的系統(tǒng)能夠在更少像素點的圖形塊中尋找并確認是否存在人臉。
簡單的增加一張圖片的分辨率可能并不是尋找微型物體的最佳解決方案。伴隨著高分辨率會帶來「Where『s Waldo」的問題,目標對象包含大量的像素點,極有可能在像素點中迷失。在這種情況下,充分利用關聯(lián)信息就能夠幫助系統(tǒng)關注到包含面部的圖像區(qū)塊。除了上文提及的關聯(lián)信息之外,Ramanan和Hu表示如果在同一個圖像區(qū)域中數(shù)次檢測到鼻子,那么利用檢測器在擁有少數(shù)像素點的圖像區(qū)域中找出面部是非常困難的。因此他們針對不同尺寸的對象培訓了多個獨立檢測器,從而大大提高了檢測微型物體的能力。
今年 7 月 21 日至 26 日在美國夏威夷州的首府火奴魯魯將會舉辦計算機視覺與模式識別國際會議(CVPR 2017),科研團隊屆時將會發(fā)表詳細的報告。目前網(wǎng)絡版報告已經(jīng)發(fā)布,雷鋒網(wǎng)(公眾號:雷鋒網(wǎng))將持續(xù)關注后續(xù)動態(tài)。
- 蜜度索驥:以跨模態(tài)檢索技術助力“企宣”向上生長
- 美國ITC裁定聯(lián)想智能手機侵犯愛立信專利
- 英特爾高通隔空叫陣:兩大巨頭在較什么勁?
- IDC最新預測:2024年PC和平板電腦市場將增長3.8%至4.035億臺
- 蘋果Vision Pro頭顯即將登陸中國臺灣,12月17日正式發(fā)售
- 全球折疊屏手機出貨量首次遭遇季度下滑,三星旗艦機型表現(xiàn)不佳是主因
- HUAWEI Mate X6 震撼登場,折疊引領者,巔峰再跨越
- 五年持續(xù)領跑,華為折疊屏一步領先,一路領先
- 全新HUAWEI MatePad Pro 13.2 英寸首發(fā)亮相,鴻蒙專業(yè)生產力體驗再升級
- 華為凌霄子母路由 Q7 網(wǎng)線版推出,讓每個房間都有滿格信號
- 華為發(fā)布HUAWEI WATCH D2,開啟腕上血壓管理新篇章
免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。