AI進(jìn)入深蘭的冠軍時(shí)間:CVPR對(duì)于木薯疾病分類的關(guān)注意味著什么?

原標(biāo)題:AI進(jìn)入深蘭的冠軍時(shí)間:CVPR對(duì)于木薯疾病分類的關(guān)注意味著什么?

幾天前,世界頂級(jí)的計(jì)算機(jī)視覺(jué)會(huì)議CVPR2019舉辦了FGVC(細(xì)粒度圖像分類)系列挑戰(zhàn)賽。和每一場(chǎng)學(xué)術(shù)會(huì)議的競(jìng)賽一樣,F(xiàn)GVC也成為了中國(guó)與世界的競(jìng)技場(chǎng)。這次FGVC系列挑戰(zhàn)中,深蘭科技所取得的一項(xiàng)成績(jī)引起了我們的注意。

一片木薯葉和圖像識(shí)別的落地故事

在Cassava Disease Classification這一挑戰(zhàn)賽中,來(lái)自中國(guó)的深蘭科技DeepBlueAI獲得了第一名。Cassava Disease Classification即是“木薯疾病分類”,挑戰(zhàn)者需要通過(guò)不同狀態(tài)木薯葉子的照片,來(lái)判斷木薯的健康狀態(tài)以及患了哪種疾病。

而這一競(jìng)賽所應(yīng)用的數(shù)據(jù)集,來(lái)自烏干達(dá)農(nóng)民自己在田地里拍攝的木薯照片,數(shù)據(jù)集中的照片來(lái)自于不同光線、不同設(shè)備以及不同的非專業(yè)拍攝者。同時(shí)木薯疾病分類挑戰(zhàn)并不像很多挑戰(zhàn)賽那樣給參與者提供了海量數(shù)據(jù),其數(shù)據(jù)集中只有不到一萬(wàn)張已標(biāo)注照片和一萬(wàn)余張未標(biāo)注照片。也就是說(shuō),木薯疾病分類挑戰(zhàn)是無(wú)盡接近于現(xiàn)實(shí)需求的。

DeepBlueAI通過(guò)圖像增強(qiáng)方法降低過(guò)擬合的風(fēng)險(xiǎn)并提高模型的魯棒性,同時(shí)利用多個(gè)在ImageNet表現(xiàn)優(yōu)異的模型,以集成方法提升精度,最終獲得了這一分類項(xiàng)目的冠軍。

之所以關(guān)注深蘭科技在細(xì)粒度圖像分類上的表現(xiàn),是因?yàn)檫@一問(wèn)題關(guān)系著圖像識(shí)別技術(shù)的落地發(fā)展?fàn)顩r。

提到圖像識(shí)別技術(shù),我們經(jīng)常能聯(lián)想到AI辨識(shí)動(dòng)物、辨識(shí)物體等等能力??蓪?shí)際上這些識(shí)別技術(shù)大多還都流于大致輪廓而非細(xì)節(jié),例如AI可以分辨出貓和狗,卻不一定能夠分別出貓與狗具體的品種。而只有當(dāng)識(shí)別能力不斷細(xì)化和深入時(shí),AI才能真正發(fā)揮出價(jià)值來(lái)。這其中最典型的案例就是人臉識(shí)別,正因人臉識(shí)別在精準(zhǔn)度上不斷突破,從一比一到一比N,甚至進(jìn)化到金融級(jí)別,才能應(yīng)用到更多場(chǎng)景之中。

可相比公開(kāi)數(shù)據(jù)集豐富的人臉數(shù)據(jù)來(lái)說(shuō),其他領(lǐng)域想要不斷深入細(xì)節(jié)提升模型精度,會(huì)遇到一系列的問(wèn)題。

最首要的,就是數(shù)據(jù)集本身不夠豐富。就拿這次木薯疾病分類挑戰(zhàn)來(lái)說(shuō),木薯這種植物主要被種植于熱帶地區(qū)而非農(nóng)業(yè)現(xiàn)代化水平較高的北美、澳洲,也就是說(shuō)此前很少有相關(guān)的數(shù)據(jù)累積,自然也就很難通過(guò)海量數(shù)據(jù)+暴力計(jì)算來(lái)建立高精度模型。

伴隨數(shù)據(jù)匱乏的,是標(biāo)注成本的高昂。相比人臉標(biāo)注僅僅需要找到眼睛鼻子嘴巴,細(xì)節(jié)場(chǎng)景中的標(biāo)注往往還需要一些專家知識(shí)。例如對(duì)植物的病變、品種進(jìn)行分類,很多時(shí)候就需要在專家的指導(dǎo)下進(jìn)行。

最后還有整體產(chǎn)業(yè)生態(tài)的惡性循環(huán)。越是數(shù)據(jù)匱乏,科技企業(yè)參與起來(lái)就愈發(fā)困難。讓產(chǎn)業(yè)的數(shù)字化和智能化累積不斷落后,在未來(lái)的技術(shù)進(jìn)化進(jìn)程中不斷的落后。

但好在,CVPR這樣的學(xué)術(shù)組織正在參與其中改變現(xiàn)狀。就拿FGVC系列挑戰(zhàn)賽來(lái)說(shuō),所解決的都是貼近現(xiàn)實(shí)領(lǐng)域的細(xì)粒度圖像分類問(wèn)題。除了識(shí)別木薯疾病以外,還有開(kāi)花植物科野牡丹科的物種識(shí)別、藝術(shù)品文化/時(shí)期推理、蝴蝶和蛾物種識(shí)別等等。

圖像識(shí)別之于現(xiàn)實(shí)場(chǎng)景的應(yīng)用性正在不斷擴(kuò)張和深入,讓人臉識(shí)別不再成為唯一的效率工具。底層技術(shù)之于現(xiàn)實(shí)世界的張力,會(huì)越來(lái)越大。

從枝頭到根系:深蘭科技的創(chuàng)新循環(huán)

要說(shuō)細(xì)粒度的圖像分類如何解決現(xiàn)實(shí)場(chǎng)景問(wèn)題,我們同樣也能從深蘭科技的案例中找到答案。

在深蘭科技的商品識(shí)別模型中,不僅需要像一般識(shí)別問(wèn)題那樣檢測(cè)出例如蘋(píng)果,菠蘿的大分類,同時(shí)還需要檢測(cè)出具體屬于哪一類蘋(píng)果,如富士,煙臺(tái)等。對(duì)農(nóng)產(chǎn)品有所了解的人會(huì)知道,很多水果的細(xì)分品種之間的差異非常小。例如蘋(píng)果中的秦冠和富寒,乍一看都是通紅混圓的,可卻一個(gè)口感綿軟一個(gè)口感甜脆。想要實(shí)現(xiàn)這兩者之間的區(qū)分,除了運(yùn)用整體信息進(jìn)行大類識(shí)別以外,還需要運(yùn)用上蘋(píng)果顏色、斑點(diǎn)甚至果蒂形狀等等局部信息來(lái)進(jìn)行確認(rèn)。

有了這種識(shí)別模型,任何一個(gè)不具備農(nóng)產(chǎn)品知識(shí)的人,都可以在不破壞水果的前提下對(duì)其品種進(jìn)行確認(rèn),大大提升了人們?cè)谶x購(gòu)水果時(shí)的效率。

相信看到這里,大家也能發(fā)現(xiàn),為什么深蘭科技的DeepBlueAI能夠在木薯疾病分類挑戰(zhàn)中獲得冠軍——“基礎(chǔ)研究+應(yīng)用開(kāi)發(fā)”一直是深蘭科技的重要標(biāo)簽。目前深蘭科技的AI技術(shù)已經(jīng)紛紛在智能駕駛、智能機(jī)器人、AI city等等九大應(yīng)用領(lǐng)域之中落地。

深蘭科技的技術(shù)工作人員也在采訪中告訴我們,通過(guò)AI底層應(yīng)用的創(chuàng)新,去帶動(dòng)產(chǎn)品落地、服務(wù)民生,滲透到各種日常應(yīng)用場(chǎng)景,然后在場(chǎng)景中獲得實(shí)際數(shù)據(jù)來(lái)反哺AI技術(shù)進(jìn)步,由此形成正向循環(huán)。

就像在FGVC系列挑戰(zhàn)賽中,一旦遇到木薯疾病分類這樣極度貼近現(xiàn)實(shí)場(chǎng)景問(wèn)題。擁有大量落地經(jīng)驗(yàn)的DeepBlueAI就立刻能找到適應(yīng)于少樣本、低質(zhì)量樣本的解決方案。在學(xué)術(shù)問(wèn)題的解決過(guò)程中,深蘭科技也可以提煉出更多關(guān)于AI底層創(chuàng)新的方法論,繼續(xù)投入到AI的落地應(yīng)用之中。于是我們可以看到,圖像識(shí)別算法正在高速公路上識(shí)別不同車輛的型號(hào)、在野外識(shí)別不同物種、在零售場(chǎng)景識(shí)別商品……這些都與深蘭科技的基礎(chǔ)創(chuàng)新不無(wú)關(guān)系。

技術(shù)領(lǐng)先背后的模式勝利

這一次深蘭科技在FGVC系列挑戰(zhàn)中的勝利,看似是技術(shù)能力的勝利,實(shí)際上卻是一種AI商業(yè)模式的勝利。

深蘭科技CEO曾經(jīng)強(qiáng)調(diào)過(guò),深蘭科技的商業(yè)模式是:做強(qiáng)兩端,打通鏈路。所謂做強(qiáng)兩端,既是在自動(dòng)駕駛、計(jì)算機(jī)視覺(jué)、語(yǔ)音技術(shù)等等基礎(chǔ)AI能力上進(jìn)行創(chuàng)新,同時(shí)也在行業(yè)應(yīng)用上不斷深入,將技術(shù)與具體場(chǎng)景深入融合去增強(qiáng)服務(wù)能力。在這個(gè)過(guò)程中,硬件、數(shù)據(jù)、技術(shù)能力等等的壁壘被不斷打破,整體產(chǎn)業(yè)中資源被打包重組,最終可以交付給用戶即拿即用的一體化技術(shù)方案。

其實(shí)相比之下,深蘭科技的AI商業(yè)模式是更為“長(zhǎng)鏈化”的。有很多AI創(chuàng)業(yè)企業(yè)愿意去選擇不斷展示技術(shù)能力,然后直接出售算法。也有很多AI創(chuàng)業(yè)企業(yè),因?yàn)檎莆樟耸袌?chǎng)資源,直接變身中間商把他人的技術(shù)包裝起來(lái)售賣給用戶。這些商業(yè)模式雖然更容易在一時(shí)展現(xiàn)出變現(xiàn)能力,卻阻斷了技術(shù)不斷創(chuàng)新的道路——技術(shù)的創(chuàng)造者向第三方出售算法,就很難見(jiàn)到自己的技術(shù)成果在現(xiàn)實(shí)應(yīng)用場(chǎng)景中的表現(xiàn),也很難進(jìn)一步對(duì)技術(shù)做出改進(jìn)。技術(shù)的發(fā)展在不斷被分叉、被階段,也就一步步的遠(yuǎn)離目的地。

而今天我們所講述的“深蘭模式”,雖然要在算法投入到現(xiàn)實(shí)場(chǎng)景中才能獲得商業(yè)收益,卻給了技術(shù)能力不斷趨向應(yīng)用生長(zhǎng)更新的可能。

相信在CVPR這類學(xué)術(shù)組織和AI企業(yè)的共同努力下,AI的基礎(chǔ)創(chuàng)新會(huì)越來(lái)越貼近現(xiàn)實(shí)應(yīng)用場(chǎng)景。不分叉、不截?cái)?,在一條筆直的通路中走下去。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2019-06-22
AI進(jìn)入深蘭的冠軍時(shí)間:CVPR對(duì)于木薯疾病分類的關(guān)注意味著什么?
相信看到這里,大家也能發(fā)現(xiàn),為什么深蘭科技的DeepBlueAI能夠在木薯疾病分類挑戰(zhàn)中獲得冠軍——“基礎(chǔ)研究+應(yīng)用開(kāi)發(fā)”一直是深蘭科技的重要標(biāo)簽。

長(zhǎng)按掃碼 閱讀全文