紀榮嶸教授:論視覺搜索與識別系統(tǒng)緊湊性

近日,一段9秒的監(jiān)控視頻刷爆了朋友圈。與以往監(jiān)控不同的是,這段監(jiān)控視頻的畫面準確識別出機動車和非機動車的種類,以及行人的年齡、性別、穿著等,視頻中畫面信息了然于目。據(jù)了解,該視頻是我國最新研制的實時行人監(jiān)測識別系統(tǒng),是“中國天網(wǎng)”工程的重要組成部分。利用計算機視覺技術(shù),判斷圖像或者視頻序列中是否存在行人,并給予精確定位。將視覺定位、視覺識別等技術(shù)與人工智能技術(shù)相結(jié)合,在智能設(shè)備監(jiān)控、人體行為分析、智能交通等多個方面得到了廣泛應(yīng)用。

紀榮嶸教授:論視覺搜索與識別系統(tǒng)緊湊性

紀榮嶸(廈門大學(xué)教授/媒體分析與計算實驗室主任)

11月13至14日,由OFweek中國高科技行業(yè)門戶主辦,OFweek人工智能網(wǎng)承辦的“OFweek2017中國人工智能大會”在深圳舉辦。來自廈門大學(xué)的紀榮嶸教授在《視覺搜索與識別系統(tǒng)緊湊性》主題演講上,結(jié)合實際案例,分享了廈門大學(xué)媒體分析與計算研究組近兩年來,在面向視覺應(yīng)用的視覺特征緊湊表示以及深度網(wǎng)絡(luò)壓縮中所做的一些工作與成果。

在大會上,紀榮嶸教授首先介紹了其2015至2017年在ICCV、AAAI、IJCAI和CVPR上發(fā)表的一系列排序敏感特征哈希算法。這些算法旨在通過引入大規(guī)模無監(jiān)督排序信息,學(xué)習(xí)排序敏感的哈希碼,以保持原始高維特征空間中的檢索信息。可以將一個50~60M大小的文件直接壓縮至10M左右,這也是目前市面上最高效的壓縮算法。

隨后,紀榮嶸教授主要圍繞以下兩個方面話題進行了具體講解,一是面向大規(guī)模視覺搜索的特征哈希,主要從視覺數(shù)據(jù)近年來的爆炸性增長,大規(guī)模視覺搜索技術(shù)的緊迫需求以及面向大規(guī)模視覺搜索的特征哈希原理等方面進行了概念介紹;二是提出了深度神經(jīng)網(wǎng)絡(luò)壓縮,介紹了深度神經(jīng)網(wǎng)絡(luò)在視覺中的應(yīng)用,以及如何壓縮網(wǎng)絡(luò)模型等問題。

紀榮嶸教授還以QQ音樂上了哼唱搜索為例,通過哈希算法,讓哼唱搜索更加靈敏,能夠直接根據(jù)用戶簡單的音節(jié)準確的搜索到相關(guān)的音樂。并且可以通過深度神經(jīng)網(wǎng)絡(luò)壓縮,讓這個系統(tǒng)依然維持在小體積之上,使得整個軟件不會過于龐大。

最后,紀榮嶸教授為現(xiàn)場觀眾展示了他們團隊在該領(lǐng)域的相關(guān)工作進展以及對未來工作的展望。

更多詳細內(nèi)容,敬請關(guān)注OFweek人工智能網(wǎng)后續(xù)專題報道!

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2017-11-17
紀榮嶸教授:論視覺搜索與識別系統(tǒng)緊湊性
近日,一段9秒的監(jiān)控視頻刷爆了朋友圈。與以往監(jiān)控不同的是,這段監(jiān)控視頻的畫面準確識別出機動車和非機動車的種類,以及行人的年齡、性別、穿著等,視頻中畫面信息了然于目。

長按掃碼 閱讀全文