近日,科大訊飛憑借在道路目標(biāo)檢測領(lǐng)域多年的技術(shù)探索,刷新了Cityscapes 3D目標(biāo)檢測任務(wù)的全球最好成績,得到檢測分?jǐn)?shù)(DS)42.9,取得了該項評測的第一名。這也是,科大訊飛繼2017年、2018年參與測評之后,再一次刷新Cityscapes的世界紀(jì)錄。
此次評測,科大訊飛借鑒了已在城市交通出行場景下應(yīng)用的Anchor-Free車輛檢測技術(shù),將2D目標(biāo)檢測技術(shù)升級至3D,并結(jié)合3D到2D重投影的特殊先驗信息進(jìn)行算法遷移,通過結(jié)合語義、上下文信息、位置先驗信息以及目標(biāo)形狀先驗信息等,提取精確的3D目標(biāo)檢測框,構(gòu)建形成一套具有豐富上下文信息的多層次單目3D目標(biāo)檢測方案
什么是Cityscapes和3D目標(biāo)檢測任務(wù)?
我們知道,在深度學(xué)習(xí)圖像語意分割的訓(xùn)練過程中,需要有數(shù)據(jù)集及分好類的標(biāo)簽,這樣才可以讓你的神經(jīng)網(wǎng)絡(luò)進(jìn)行學(xué)習(xí),進(jìn)而訓(xùn)練出模型。Cityscapes便是包含城市大量街道圖片、視頻用來訓(xùn)練識別的數(shù)據(jù)集,由戴姆勒(DAIMLER)等在內(nèi)的三家德國單位聯(lián)合提供,吸引了華為、阿里、微軟、北大、中科院、MIT等上百個國內(nèi)外著名AI實驗室和頂尖學(xué)術(shù)研究機(jī)構(gòu)積極參與,是CVPR、ECCV等國際頂級會議中實例分割任務(wù)常用的權(quán)威測試數(shù)據(jù)集。
2020年,在CVPR workshop上,Cityscapes公開了新的單目圖像3D目標(biāo)檢測評測集,包含car, truck, bus, train, bicycle, motorcycle共6種類別目標(biāo)。每種目標(biāo)需要檢測出其在空間中的三維坐標(biāo)位置,目標(biāo)的長、寬、高以及目標(biāo)在空間中的旋轉(zhuǎn)姿態(tài)?;谝曈X的3D目標(biāo)檢測,是圖像處理和計算機(jī)視覺領(lǐng)域的重要研究方向之一。
基于視覺的3D目標(biāo)檢測有什么重要意義?
基于科大訊飛在AI+3D視覺技術(shù)的結(jié)合探索之下,未來3D目標(biāo)檢測將能在城市治理、工業(yè)智能、機(jī)器智能、智能駕駛等多方面發(fā)揮廣泛的作用。
【提供參考】
通過三維目標(biāo)檢測技術(shù),可以感知目標(biāo)的三維尺寸信息、空間位置。
【精準(zhǔn)判斷】
通過空間位置感知,可以更精準(zhǔn)地判斷目標(biāo)和參照物之間的位置關(guān)系。
比如在城市交通管理場景中,當(dāng)前交通違法判定主要還是依靠固定攝像頭抓拍、二維圖像判定的方式,往往存在視覺盲區(qū)。若將3D目標(biāo)檢測技術(shù)接入公安交警現(xiàn)有的交通視頻智能分析平臺,與AI巡檢相結(jié)合,可以進(jìn)一步精確判定車輛車型,基于空間位置感知和連續(xù)軌跡跟蹤,計算出車輛的行駛速度、空間軌跡等,為越斑馬線停車、超速抓拍、擁堵感知等違法異常事件判斷提供更實時、更精準(zhǔn)的決策依據(jù)。這不僅能夠達(dá)到對已有設(shè)備資源的最大化利用,實現(xiàn)降本提效,還能夠提升城市數(shù)字化治理能力,助力文明出行、平安出行。
如下圖所示,右側(cè)黑色車輛2D檢測外邊框和右側(cè)交通線相交,此時通過二維平面相交關(guān)系判斷,會認(rèn)定車輛壓線行駛。但從三維的檢測結(jié)果分析,能夠判斷出車體并沒有越過交通線。
AI賦能,建設(shè)美好世界
如何讓機(jī)器變得更加“聰明”,具備足夠的學(xué)習(xí)能力,并更精準(zhǔn)地貼合現(xiàn)實使用需求,是所有人工智能研發(fā)團(tuán)隊所需解決的最大難題??拼笥嶏w直面檢測精細(xì)度更高、場景更為復(fù)雜、挑戰(zhàn)難度更大的3D目標(biāo)檢測任務(wù),并一舉刷新了世界紀(jì)錄,意味著科大訊飛已經(jīng)具備了強(qiáng)大的AI技術(shù)硬核實力。
多年來,科大訊飛在人工智能領(lǐng)域百花齊放,在基于深度學(xué)習(xí)的通用核心技術(shù)上厚積薄發(fā)。不僅在智能語音、機(jī)器翻譯等大眾熟悉的領(lǐng)域上在多項國際權(quán)威賽事上取得第一,實際上,科大訊飛在教育圖文、人臉識別等計算機(jī)視覺領(lǐng)域也深耕多年,擁有豐富的經(jīng)驗和國際領(lǐng)先的技術(shù),并已運用在教育、醫(yī)療、金融等多個行業(yè),取得耀眼成績,獲得良好口碑。
未來,科大訊飛將繼續(xù)堅持源頭技術(shù)創(chuàng)新路線,秉持“頂天立地”的理念,加快開放應(yīng)用場景,促進(jìn)AI技術(shù)和各種應(yīng)用場景相結(jié)合,加速人工智能技術(shù)落地,建設(shè)美好世界。(通訊員:科大訊飛集團(tuán) 李倩)
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )