商湯科技與多方聯(lián)合舉辦計(jì)算機(jī)視覺(jué)頂級(jí)挑戰(zhàn)賽 以全新行業(yè)標(biāo)準(zhǔn)引領(lǐng)學(xué)術(shù)發(fā)展

今日,由商湯科技SenseTime攜手香港中文大學(xué)、亞馬遜、南洋理工大學(xué)、悉尼大學(xué)聯(lián)合舉辦的首屆WIDER Face and Pedestrian Challenge 2018挑戰(zhàn)賽圓滿落幕。作為一項(xiàng)全新的全球頂級(jí)計(jì)算機(jī)視覺(jué)競(jìng)賽,挑戰(zhàn)賽共吸引來(lái)自世界各國(guó)超過(guò)400支隊(duì)伍報(bào)名。在競(jìng)賽組織、設(shè)計(jì)、數(shù)據(jù)選取等全過(guò)程中,商湯科技充分發(fā)揮產(chǎn)學(xué)研協(xié)同的優(yōu)勢(shì),提出了諸多切合實(shí)際場(chǎng)景及產(chǎn)業(yè)應(yīng)用需求的競(jìng)賽課題及規(guī)則,以全新的行業(yè)規(guī)范和標(biāo)準(zhǔn),促進(jìn)產(chǎn)業(yè)與學(xué)術(shù)界的交流,開(kāi)拓計(jì)算機(jī)視覺(jué)研究的新發(fā)展方向。

制定全新標(biāo)準(zhǔn)數(shù)據(jù)集 促進(jìn)高性能算法涌現(xiàn)

隨著應(yīng)用需求與場(chǎng)景的增多,人臉檢測(cè)、行人檢測(cè)及人物檢測(cè)已成為計(jì)算機(jī)視覺(jué)研究中的熱門項(xiàng)目。挑戰(zhàn)賽聚焦這三大熱點(diǎn),設(shè)計(jì)了WIDER Face,WIDER Pedestrian及WIDER Person Search三項(xiàng)子任務(wù),同時(shí)基于不斷增加的復(fù)雜場(chǎng)景需求,啟用了更加貼近真實(shí)場(chǎng)景的數(shù)據(jù)集,以提升競(jìng)賽的實(shí)用、創(chuàng)新及挑戰(zhàn)性,進(jìn)而促進(jìn)計(jì)算機(jī)視覺(jué)領(lǐng)域人臉及行人檢測(cè)高性能算法的涌現(xiàn)。

商湯科技與多方聯(lián)合舉辦計(jì)算機(jī)視覺(jué)頂級(jí)挑戰(zhàn)賽 以全新行業(yè)標(biāo)準(zhǔn)引領(lǐng)學(xué)術(shù)發(fā)展

WIDER Face人臉檢測(cè)數(shù)據(jù)集是人臉檢測(cè)領(lǐng)域中的標(biāo)準(zhǔn)數(shù)據(jù)集。WIDER Face數(shù)據(jù)集于2016年由商湯-香港中文大學(xué)聯(lián)合實(shí)驗(yàn)室搜集、標(biāo)注并作為口頭報(bào)告發(fā)布在當(dāng)年的計(jì)算機(jī)視覺(jué)頂級(jí)會(huì)議CVPR大會(huì)上。在一年多時(shí)間里,WIDER Face已成為人臉檢測(cè)領(lǐng)域廣泛使用的標(biāo)準(zhǔn)數(shù)據(jù)集。相比較于之前的人臉檢測(cè)數(shù)據(jù)集,WIDER Face數(shù)據(jù)集在數(shù)據(jù)難度,圖片和標(biāo)注數(shù)量上都有一個(gè)數(shù)量級(jí)的提升。

商湯科技與多方聯(lián)合舉辦計(jì)算機(jī)視覺(jué)頂級(jí)挑戰(zhàn)賽 以全新行業(yè)標(biāo)準(zhǔn)引領(lǐng)學(xué)術(shù)發(fā)展

WIDER Pedestrian提供了專門用于行人檢測(cè)的大規(guī)模數(shù)據(jù)集。考慮當(dāng)前行人檢測(cè)兩大熱門應(yīng)用(監(jiān)控和自動(dòng)駕駛),選用監(jiān)控?cái)z像頭和車載攝像機(jī)采集的圖片,拍攝角度、行人尺度、光照等方面都具有很大不同,參賽者必須提出更加魯棒和普適性的方法來(lái)應(yīng)對(duì)不同場(chǎng)景。并且部分?jǐn)?shù)據(jù)來(lái)自夜景拍攝,給檢測(cè)帶來(lái)更大難度。同時(shí),相比其他的行人檢測(cè)數(shù)據(jù)集,WIDER Pedestrian提供了行人和騎車人兩種不同行人的標(biāo)注具有更多的檢測(cè)目標(biāo)數(shù)和不同尺度的行人。檢測(cè)目標(biāo)的密集,更小尺度的行人和行人之間的遮擋等都給參賽者帶來(lái)了更多挑戰(zhàn)。

商湯科技與多方聯(lián)合舉辦計(jì)算機(jī)視覺(jué)頂級(jí)挑戰(zhàn)賽 以全新行業(yè)標(biāo)準(zhǔn)引領(lǐng)學(xué)術(shù)發(fā)展

WIDER Person Search是一個(gè)新穎的從192部電影中檢索人物的任務(wù),需要根據(jù)演員的標(biāo)準(zhǔn)照,從一個(gè)大的數(shù)據(jù)庫(kù)中將對(duì)應(yīng)角色的實(shí)例全部檢索出來(lái)。人物檢索不但具有實(shí)用性,還非常具有挑戰(zhàn)性。演員的標(biāo)準(zhǔn)照和他們?cè)陔娪袄锏难b扮往往是完全不同的。即使在同一部電影里演員的衣著和環(huán)境也會(huì)發(fā)生極大變化。此外電影里的還存在光線過(guò)暗、遮擋、動(dòng)作模糊等各種增加識(shí)別難度的障礙。這個(gè)更具有挑戰(zhàn)性的任務(wù)為人物搜索算法的未來(lái)發(fā)展提供了新的舞臺(tái)。

全球400余隊(duì)伍參賽各項(xiàng)目前三脫穎而出

WIDER Face and Pedestrian Challenge挑戰(zhàn)賽共吸引來(lái)自全球?qū)W術(shù)、產(chǎn)業(yè)界的432人/隊(duì)報(bào)名參賽,收到73支隊(duì)伍提交結(jié)果。參賽者來(lái)自中國(guó)、俄羅斯、日本、美國(guó)、澳大利亞等多個(gè)國(guó)家。參賽者隸屬的機(jī)構(gòu)既包括中科院計(jì)算所、微軟亞洲研究院、北京大學(xué)、上海交通大學(xué)、中國(guó)科學(xué)院大學(xué)、中國(guó)科學(xué)技術(shù)大學(xué)、NtechLab、卡耐基梅隆大學(xué)、香港大學(xué)、香港理工大學(xué)、悉尼科技大學(xué)、日本中部大學(xué)、美國(guó)圣塔克拉拉大學(xué)、美國(guó)喬治城大學(xué)、伊利諾伊大學(xué)、慕尼黑理工大學(xué)等大學(xué)和研究機(jī)構(gòu),也有京東、雅虎、曠視、科大訊飛、滴滴等商業(yè)公司。

商湯科技與多方聯(lián)合舉辦計(jì)算機(jī)視覺(jué)頂級(jí)挑戰(zhàn)賽 以全新行業(yè)標(biāo)準(zhǔn)引領(lǐng)學(xué)術(shù)發(fā)展

面對(duì)三個(gè)挑戰(zhàn)性極高,同時(shí)頗具實(shí)用價(jià)值的子任務(wù),參賽隊(duì)伍們各展神通。WIDER Face人臉檢測(cè)任務(wù)比賽的三支獲獎(jiǎng)隊(duì)伍,均使用了深度學(xué)習(xí)技術(shù)來(lái)設(shè)計(jì)實(shí)現(xiàn)人臉檢測(cè)算法,并且均使用或借鑒了特征金字塔的思想對(duì)主干網(wǎng)絡(luò)的特征進(jìn)行增強(qiáng),并對(duì)初始匹配模板(anchor box)進(jìn)行了分組和重設(shè)計(jì)。冠軍隊(duì)伍還使用了模型融合來(lái)取得更好的結(jié)果。

在WIDER Pedestrian監(jiān)控和自動(dòng)駕駛下的行人檢測(cè)任務(wù)中,獲勝者使用傳統(tǒng)Faster RCNN方法,利用ResNet網(wǎng)絡(luò)加金字塔結(jié)構(gòu)(FPN)抽取并融合多層次語(yǔ)義特征。并通過(guò)在檢測(cè)模塊中添加級(jí)聯(lián)網(wǎng)絡(luò)(Cascade R-CNN),訓(xùn)練得到更好的檢測(cè)框回歸器(bounding box regression),采用RoI-Align代替Faster RCNN中的RoI-Pooling,幫助檢測(cè)小尺度行人,使用注意力機(jī)制(channel-wise attention)處理遮擋問(wèn)題。

在第三項(xiàng)子任務(wù)WIDER Person Search中,獲獎(jiǎng)隊(duì)伍則都把任務(wù)拆分為兩個(gè)階段,第一個(gè)階段做人臉識(shí)別,把人臉相似度非常高的加入到查詢集(query expand)。第二階段做行人重識(shí)別,利用身體特征處理人臉特征無(wú)法準(zhǔn)確判斷的待查詢圖片。最終綜合人臉和人體的特征相似度得到排序結(jié)果。冠軍和亞軍都使用了杰卡德距離和歐式距離來(lái)進(jìn)行排序。

作為挑戰(zhàn)賽的聯(lián)合主辦方,商湯科技并未派隊(duì)伍參與此次競(jìng)賽。挑戰(zhàn)賽頒獎(jiǎng)儀式將于今年9月ECCV 2018會(huì)議期間在德國(guó)慕尼黑舉行,同時(shí)還將舉辦相關(guān)研討會(huì)。此外,全體獲獎(jiǎng)?wù)邔⒈谎?qǐng)共同撰寫(xiě)競(jìng)賽論文,并在ECCV2018研討會(huì)上做報(bào)告。競(jìng)賽結(jié)束后,組織者仍會(huì)開(kāi)放驗(yàn)證集的測(cè)試服務(wù)器供參賽者進(jìn)行科學(xué)研究。

商湯科技秉承“堅(jiān)持原創(chuàng),讓AI引領(lǐng)人類進(jìn)步”的使命,一直以來(lái)專注于推動(dòng)計(jì)算機(jī)視覺(jué)與深度學(xué)習(xí)技術(shù)的發(fā)展,不但擁有自主研發(fā)的原創(chuàng)深度學(xué)習(xí)平臺(tái)Parrots和全球頂級(jí)超算中心,是亞洲最大的AI研發(fā)基地,同時(shí)以產(chǎn)學(xué)研協(xié)同創(chuàng)新的模式,借助在人臉識(shí)別、圖像識(shí)別等技術(shù)領(lǐng)域豐富的應(yīng)用落地經(jīng)驗(yàn),不斷推動(dòng)學(xué)術(shù)和工業(yè)界的緊密連接。通過(guò)舉辦WIDER Face and Pedestrian Challenge 2018挑戰(zhàn)賽,商湯科技以多年研究積累與落地經(jīng)驗(yàn)反哺學(xué)術(shù),制定全新行業(yè)標(biāo)準(zhǔn),引領(lǐng)產(chǎn)業(yè)與學(xué)術(shù)發(fā)展潮流,推動(dòng)計(jì)算機(jī)視覺(jué)領(lǐng)域技術(shù)進(jìn)步。

關(guān)于商湯科技:

商湯科技SenseTime是全球領(lǐng)先的人工智能平臺(tái)公司,同時(shí)也是“全球最具價(jià)值的AI創(chuàng)新企業(yè)”。以20年人工智能科研技術(shù)為積淀,并以“堅(jiān)持原創(chuàng),讓AI引領(lǐng)人類進(jìn)步”為使命,商湯科技建立了全球頂級(jí)、自主研發(fā)的深度學(xué)習(xí)超算中心,是亞洲最大的AI研發(fā)基地;在人臉識(shí)別、圖像識(shí)別、文本識(shí)別、醫(yī)療影像識(shí)別、視頻分析、無(wú)人駕駛等技術(shù)領(lǐng)域的創(chuàng)新成果,支撐了十多個(gè)垂直行業(yè)的AI變革。

除了技術(shù)實(shí)力領(lǐng)跑行業(yè),商業(yè)營(yíng)收方面,商湯科技的市場(chǎng)占有率亦居多個(gè)垂直領(lǐng)域首位。目前,商湯科技已與國(guó)內(nèi)外700多家知名高校、企業(yè)及機(jī)構(gòu)建立合作,包括美國(guó)麻省理工學(xué)院、香港中文大學(xué)、Qualcomm、英偉達(dá)、本田、阿里巴巴、蘇寧、中國(guó)移動(dòng)、銀聯(lián)、萬(wàn)達(dá)、海航、華為、小米、OPPO、vivo、微博、科大訊飛、中央網(wǎng)信辦等,涵蓋智慧城市、智能手機(jī)、互娛廣告、汽車、金融、零售等諸多行業(yè),共同推動(dòng)AI對(duì)各行業(yè)的技術(shù)升級(jí),引領(lǐng)AI時(shí)代發(fā)展大潮。

2018年5月,商湯科技宣布完成6.2億美元C+輪融資,總?cè)谫Y額超過(guò)16億美元,估值超過(guò)45億美金,繼續(xù)保持全球總?cè)谫Y額最大、估值最高的人工智能獨(dú)角獸地位。商湯科技現(xiàn)已在香港、北京、深圳、上海、成都、杭州、日本京都、東京和新加坡成立分部,匯集世界各地頂尖人才,合力打造一家世界一流的原創(chuàng)人工智能技術(shù)公司。中國(guó)“智”造,“慧”及全球。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2018-08-03
商湯科技與多方聯(lián)合舉辦計(jì)算機(jī)視覺(jué)頂級(jí)挑戰(zhàn)賽 以全新行業(yè)標(biāo)準(zhǔn)引領(lǐng)學(xué)術(shù)發(fā)展
今日,由商湯科技SenseTime攜手香港中文大學(xué)、亞馬遜、南洋理工大學(xué)、悉尼大學(xué)聯(lián)合舉辦的首屆WIDER Face and Pedestrian Challe

長(zhǎng)按掃碼 閱讀全文