這家AI公司的圖像識(shí)別技術(shù)讓谷歌和微軟甘拜下風(fēng)

2018年7月,在國(guó)際權(quán)威計(jì)算機(jī)視覺競(jìng)賽PASCAL VOC comp4目標(biāo)檢測(cè)競(jìng)賽中,Yi+ AI團(tuán)隊(duì)獲得了目標(biāo)檢測(cè)單模型第一名,超越了現(xiàn)有排行榜中的微軟研究院、谷歌 、阿里達(dá)摩院、Face++等國(guó)內(nèi)外眾多知名公司,以精度90.7%的成績(jī)打破了世界記錄,成為世界第一家總成績(jī)突破90%計(jì)算機(jī)視覺企業(yè)。同時(shí)在Pascal VOC“comp3”中,首次突破80%,刷新世界紀(jì)錄。

這家AI公司的圖像識(shí)別技術(shù)讓谷歌和微軟甘拜下風(fēng)

Pascal VOC comp4是眾多國(guó)內(nèi)外企業(yè)物體檢測(cè)團(tuán)隊(duì)證明自己實(shí)力的地方,此次Yi+力壓群雄,取得了90.7%的成績(jī),比第二名的阿里達(dá)摩院高了1.5個(gè)百分點(diǎn),在物體檢測(cè)領(lǐng)域,1.5個(gè)百分點(diǎn)意味著需要比對(duì)方“多”檢測(cè)正確6000多個(gè)框,同時(shí)值得注意的是,此次Yi+AI團(tuán)隊(duì)使用的是難度更高的單模型,而第二名的方法是多模型融合。

這家AI公司的圖像識(shí)別技術(shù)讓谷歌和微軟甘拜下風(fēng)

這家AI公司的圖像識(shí)別技術(shù)讓谷歌和微軟甘拜下風(fēng)

PASCAL VOC可謂視覺識(shí)別類競(jìng)賽的鼻祖,包含了物體分類、目標(biāo)檢測(cè)、圖像分割等任務(wù)。PASCAL VOC對(duì)計(jì)算機(jī)視覺的發(fā)展具有深遠(yuǎn)而巨大的影響,后續(xù)的ImageNet競(jìng)賽的任務(wù)設(shè)置就基本沿用了它的設(shè)定。此前,微軟、英特爾、CMU、Facebook、UC Berkeley等國(guó)際頂尖研發(fā)團(tuán)隊(duì)先后在這個(gè)排行榜上刷新紀(jì)錄。

Yi+AI的負(fù)責(zé)人表示,在此次Pascal VOC comp4競(jìng)賽中,Yi+AI團(tuán)隊(duì)使用的方法叫做FXRCNN,其中“X”,代表“多元”的意思,意味著Yi+AI使用的結(jié)構(gòu)不僅僅是高準(zhǔn)確率的模型,同時(shí)也適用多元場(chǎng)景,包括移植到移動(dòng)端(通過更改Backbone和Head),實(shí)現(xiàn)圖像分割(增加Mask分支),實(shí)現(xiàn)人體關(guān)鍵點(diǎn)(增加Key point分支),實(shí)現(xiàn)人臉檢測(cè)(增加Face分支)。

Yi+提交的深度學(xué)習(xí)模型,雖然采用了Faster RCNN的基本結(jié)構(gòu),但有很多不同之處:1)采用ResNeXt作為基礎(chǔ)網(wǎng)絡(luò),結(jié)合FPN實(shí)現(xiàn)多尺度特征融合,2)在后處理階段,采用SoftNMS和多框投票融合;3)通過Yi+海量數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練;4)多尺度訓(xùn)練,進(jìn)一步加強(qiáng)數(shù)據(jù)增強(qiáng)。

近年來Yi+不斷加大對(duì)人工智能、大數(shù)據(jù)等新技術(shù)的研發(fā)和應(yīng)用,本次提交的模型,是Yi+多年來技術(shù)積累的結(jié)果,是通過不斷的攻克實(shí)際問題的結(jié)果,是Yi+內(nèi)部模型不斷優(yōu)化的結(jié)果,Yi+ AI的FXRCNN在速度,內(nèi)存,精度,應(yīng)用范圍等多維度進(jìn)行了全面的優(yōu)化。

這家AI公司的圖像識(shí)別技術(shù)讓谷歌和微軟甘拜下風(fēng)

人工智能領(lǐng)域,目標(biāo)檢測(cè)技術(shù)應(yīng)用廣泛,是Yi+AI場(chǎng)景落地的關(guān)鍵性技術(shù)之一。Yi+將目標(biāo)檢測(cè)技術(shù)應(yīng)用在圖像搜索引擎和圖片視頻結(jié)構(gòu)化引擎中,Yi+圖像搜索引擎可檢測(cè)類目超100類,覆蓋服飾、3C商超、家居、日用品、交通工具等;Yi+圖片視頻結(jié)構(gòu)化引擎則采用目前業(yè)界最領(lǐng)先的基于深度學(xué)習(xí)的通用目標(biāo)檢測(cè)算法,支持超過300類常用物體的目標(biāo)檢測(cè)、識(shí)別,可實(shí)現(xiàn)對(duì)視頻和圖像中的場(chǎng)景、人、車輛、物體(輪廓)檢測(cè)、識(shí)別、分割、跟蹤;可識(shí)別近10,000種物品,400種場(chǎng)景。

這家AI公司的圖像識(shí)別技術(shù)讓谷歌和微軟甘拜下風(fēng)

目前Yi+AI已將目標(biāo)檢測(cè)技術(shù)應(yīng)用在多個(gè)使用場(chǎng)景中,包括“智能硬件”、“營(yíng)銷”、“新零售”、“智慧城市”等解決方案,具體則應(yīng)用在場(chǎng)景廣告平臺(tái)、新零售平臺(tái)、大屏AI助手、智慧安防、智慧交通、智慧社區(qū)等多項(xiàng)領(lǐng)域之中。

下一步,Yi+將結(jié)合現(xiàn)有技術(shù)優(yōu)勢(shì)繼續(xù)深耕智慧城市、新零售、智能營(yíng)銷、智能硬件等多個(gè)領(lǐng)域,讓計(jì)算機(jī)看懂世界,用科技提供人工智能服務(wù),幫助人們看見非凡,see different。

Yi+獲得阿里巴巴等B輪融資。服務(wù)了眾多500強(qiáng)客戶。團(tuán)隊(duì)成員大多來自頂尖企業(yè)與高校,如哥倫比亞大學(xué)、帝國(guó)理工、耶魯、普林斯頓、普渡大學(xué)、新加坡國(guó)大、南洋理工、清華、北大等及微軟、IBM、英特爾、阿里巴巴、騰訊、百度、華為等企業(yè)。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2018-07-30
這家AI公司的圖像識(shí)別技術(shù)讓谷歌和微軟甘拜下風(fēng)
2018年7月,在國(guó)際權(quán)威計(jì)算機(jī)視覺競(jìng)賽PASCAL VOC comp4目標(biāo)檢測(cè)競(jìng)賽中,Yi+ AI團(tuán)隊(duì)獲得了目標(biāo)檢測(cè)單模型第一名,超越了現(xiàn)有排行榜中的微軟研究

長(zhǎng)按掃碼 閱讀全文