從人工智能“世界杯”奪冠,詳解360式AI進化路線

摘要:360人工智能在ILSVRC-2017上的奪冠,使360智能團隊浮出水面,那么與其他互聯(lián)網(wǎng)巨頭相比,360的AI進化路線圖到底是怎樣的?“能落地的人工智能才是真正的人工智能”因為去年周鴻t曾經(jīng)公開“噴

360人工智能在ILSVRC-2017上的奪冠,使360智能團隊浮出水面,那么與其他互聯(lián)網(wǎng)巨頭相比,360的AI進化路線圖到底是怎樣的?

“能落地的人工智能才是真正的人工智能”

因為去年周鴻t曾經(jīng)公開“噴”過行業(yè)內(nèi)存在人工智能泡沫,所以在很多人印象中360在對待人工智能方面比較低調(diào)甚至保守。然而,這其實是一種誤解,老周不是不重視人工智能,而是非常重視,只不過在他對互聯(lián)網(wǎng)公司深入人工智能路徑的認知不同,與很多互聯(lián)網(wǎng)公司全面推進人工智能的大躍進之路不同,周鴻t在人工智能方面更強調(diào)的是垂直細分和應(yīng)用場景,追求的是產(chǎn)品落地,360未來在人工智能領(lǐng)域要走的是一條專注、聚焦的務(wù)實之路。

那到底何謂“務(wù)實之路”?這次360人工智能團隊在ImageNet大規(guī)模視覺識別挑戰(zhàn)賽(ILSVRC-2017)上的奪冠或許可以作為周鴻t式人工智能路線的一個最新注腳。

7月17日剛剛落幕的ImageNet大規(guī)模視覺識別挑戰(zhàn)賽被譽為計算機視覺乃至整個人工智能發(fā)展史上的里程碑式的賽事,之前的世界記錄分別由谷歌、微軟、牛津大學(xué)等機構(gòu)保持了數(shù)年,今年作為現(xiàn)有賽制下的最后一屆比賽一共吸引了來自中美英等7個國家的25支頂尖人工智能團隊參賽。賽事共包括物體定位(識別)、物體檢測、視頻物體檢測三大類任務(wù)。最終,由360人工智能研究院與新加坡國立大學(xué)(NUS)組成的團隊在“物體定位”任務(wù)的兩個場景競賽中均獲得第一,同時在所有任務(wù)和場景中均取得了全球前三的戰(zhàn)績。

這個冠軍與周鴻t提出的360人工智能路線有著什么樣的關(guān)系?它實際反映了360人工智能研發(fā)在垂直領(lǐng)域的深度與高度。簡單說,計算機視覺識別是人工智能領(lǐng)域的經(jīng)典命題,而物體定位(識別)、物體檢測、視頻物體檢測又都是計算機視覺的核心領(lǐng)域,對于人工智能的發(fā)展意義重大,有廣闊的應(yīng)用前景,比如人臉識別、無人駕駛、智能機器人等。在這屆比賽中,360與NUS團隊改寫谷歌、微軟、牛津大學(xué)等一直在此項任務(wù)中保持世界紀錄,實際上反映了360人工智能技術(shù),特別是在視覺識別方面的實力,而這一實力可以直接被應(yīng)用到周鴻t更重視的垂直領(lǐng)域下的各類產(chǎn)品中去,所以,360人工智能研究院院長顏水成會說,“當下人工智能的發(fā)展不能脫離具體業(yè)務(wù),需要在垂直領(lǐng)域去解決具體的問題,能落地的人工智能才是真正的人工智能?!?/p>

沒有高下之分,只有打法不同

可以拿來做比較的是谷歌的AlphaGo,走的就是另外一條路線,即通用型人工智能,AlphaGo大勝圍棋世界冠軍也代表了人工智能的一個新的高度,但按老周的說法,“下圍棋的人工智能程序不會下象棋;會識別貓的人工智能程序,不會識別狗?!焙茈y產(chǎn)生實際的商業(yè)價值,而當下更多的機會,則存在于人工智與垂直領(lǐng)域的結(jié)合,解決具體問題。

這兩種路線沒有什么高下之分,只有取舍不同,或者用顏水成的話說叫“打法”不同,一些公司可以不必太拘泥于當前人工智能的落地為目標,比如可以瞄準三年以后,或者五年以后。但“這樣的話一個公司體量真的超級大了,它是可以這樣做的,為一個未來的概念,五年以后、十年以后。有可能這個東西在中間就會改變方向,也是有可能的?!?/p>

然而360人工智能的打法則和其他公司不一樣,“我們不是為人工智能而人工智能,我們更看重能馬上落地的場景。比如我們看到的監(jiān)控攝像頭人工智能的能力,比如我們故事機的人工智能的能力,后視鏡的人工智能的能力,我們更強調(diào)要以產(chǎn)品落地為導(dǎo)向。” 也就是360采取的是步步為營的打法,在當前的特定時間點,360更看重人工智能怎樣可以為當前的業(yè)務(wù)場景和當前的產(chǎn)品發(fā)揮它的效能。所以,外界可能更多看到的是360的產(chǎn)品應(yīng)用了什么樣的人工智能技術(shù),而不是把人工智能單獨抽出來講,描繪360人工智能要為三年以后或者五年以后做什么樣的事情。

這種比較務(wù)實的打法,倒是跟王健林“先設(shè)定一個小目標”的發(fā)展路數(shù)很像。

所以,這次能夠在ImageNet大規(guī)模視覺識別挑戰(zhàn)賽中奪冠,實際上也是360人工智能團隊在人工智能垂直領(lǐng)域的一個定點突破。但這種定點突破也是來自于垂直領(lǐng)域的長期積累。一直以來 ,360人工智能研究院在計算機視覺領(lǐng)域持續(xù)投入研發(fā)。在長時間的研究工作中,建立起了一支實力強大的人工智能團隊,對于計算機視覺領(lǐng)域有深刻的理解。

“我們跟其他公司宣傳的方式不一樣”

由于安全、搜索等基本業(yè)務(wù)都與人工智能深切相關(guān),所以360在人工智能方面的布局并不晚,很早就成為其發(fā)展的一個重要方向。2015年,360邀請國際知名計算機視覺與深度學(xué)習(xí)專家新加坡國立大學(xué)(Dean’s Chair)的顏水成加入并擔任首席科學(xué)家。隨后,顏水成開始著手建立并領(lǐng)導(dǎo)360人工智能研究院至今。

360這支大概70人左右的人工智能能團隊最早的時候,其業(yè)務(wù)主導(dǎo)就是以“視覺”為主,后來根據(jù)業(yè)務(wù)場景的不同需求,又向基于人工智能的人機對話技術(shù)和大數(shù)據(jù)技術(shù)擴展,逐漸把人工智能的幾個主要方向都建立起來。當然,360人工智能研究院只是其整個人工智能團隊的一部分,在360的各個業(yè)務(wù)線,比如搜索、安全、瀏覽器、手機助手等領(lǐng)域,也都有內(nèi)部的人工智能相關(guān)團隊。在更注重場景化的360式人工智能路徑中,人工智能團隊和業(yè)務(wù)團隊的緊密結(jié)合是一大特色。

顏水成并透露,“現(xiàn)在也可以說了”,作為海外人工智能布局的一部分,360在新加坡也已經(jīng)成立一家子公司,正在建立人工智能和安全的團隊,“跟在北京的這個團隊相互的合作一起去完成一些任務(wù),也便于我們更好地和新加坡的一些本地研究機構(gòu)做深入的合作?!?/p>

在整個360人工智能團隊運作中,可以分為兩個部分,因為周鴻t特別關(guān)注產(chǎn)品,所以有一部分人力是“老周指在哪里就往哪個地方打,老周在關(guān)注直播的時候,就往直播上打,老周關(guān)注相機類產(chǎn)品的時候,就往相機上打?!边@也可以理解為AI團隊的內(nèi)部賦能;而一部分團隊則從自身研究方向出發(fā),會去關(guān)注老周不是特別關(guān)注的方向。

從這次比賽奪冠看,360人工智能團隊已經(jīng)有相當實力,而之所以在業(yè)界并不顯山露水,是因為在以前的宣傳中,360更多宣傳的是其落地產(chǎn)品,而不是人工智能這一“概念”,“360智能不是為人工智能而智能,我們不會說人工智能有這個東西,再有產(chǎn)品,我們對外宣傳更多是宣傳我們的產(chǎn)品,我們有強大的AI的團隊,我們跟其他公司宣傳的方式不一樣,公司說有強大的技術(shù)在那個地方,你們可以用這個東西去做它的產(chǎn)品。我們老周是產(chǎn)品經(jīng)理,產(chǎn)品是第一要務(wù),技術(shù)是讓我們的產(chǎn)品具有更多的更強的能力,讓用戶有更好的產(chǎn)品體驗。核心點還是在產(chǎn)品?!?/p>

或許,沒有這次奪冠的契機,顏水成們依舊還隱藏在幕后。

在人工智能支撐下的360智能硬件一共分為三大塊業(yè)務(wù),也就是三大應(yīng)用場景。一塊是可穿戴式業(yè)務(wù),比如兒童手表;第二塊是家庭安全業(yè)務(wù),比如360小水滴監(jiān)控攝像頭、故事機、360機器人等;第三塊是出行安全,比如行車記錄儀和后視鏡,這些都需要圖像、語音、語義能力。

純粹的人工智能平臺最后都會死掉

現(xiàn)在人工智能平臺大熱,各大互聯(lián)網(wǎng)公司都在講平臺,講系統(tǒng),講賦能。顏水成認為,走人工智能的通用路線也沒錯,但一定也要重視場景,以前講人工智能三大要素:大數(shù)據(jù)、計算能力、算法,現(xiàn)在變成四大要素,開始講場景。因為純粹不管業(yè)務(wù)場景,只是從一般性的圖像分析能力,大數(shù)據(jù)分析的能力去做平臺,平臺后面的公司很容易會死掉?!昂墁F(xiàn)實的問題是無論你是做圖像分析還是做語音分析,還是做語義分析,場景化非常重要,你說你做人臉識別,你說你有一個通用的,對所有場景的人臉識別都能做得好的模型,不存在?!?/p>

其中關(guān)鍵就是不講應(yīng)用場景的平臺,很難在技術(shù)上做到極致,很難實現(xiàn)工匠精神?!氨热缒闶且粋€語音產(chǎn)品,一種方式你就提供通用的API,能力不錯,也挺好,但是到具體的業(yè)務(wù)場景,比如你不做對這個場景定制和優(yōu)化,肯定是不可能達到極致的狀態(tài),這是為什么說有些創(chuàng)業(yè)公司,大家知道做機器人公司,他為什么做自己的語音識別和TTS,是你用通用的API,它會碰到一個問題,它沒有對場景進行優(yōu)化,所以不可能達到一個極致的狀態(tài)?!?/p>

而老周卻是一個極度重視用戶體驗的人。

所以,一個公司需要人工智能團隊不是因為要實現(xiàn)“有無”,而是要實現(xiàn)超越。如果只是說去實現(xiàn)有和無這種能力,人工智能團隊存在的價值不是特別大,你要是做人臉就可以拉去創(chuàng)業(yè)公司API,你要做語音識別可以拉科大訊飛,甚至有時是免費的,你要做語義的話,有好多創(chuàng)業(yè)公司早期都提供平臺服務(wù),都是可以做。

但要實現(xiàn)超越就不同了,需要團隊研發(fā)不停的往前走,這都是平臺所不能提供的。

所以顏水成說,“我發(fā)現(xiàn)一個純粹的可能平臺的支持,他就沒有達到工匠精神,我希望再進一步打磨,相當于我用平臺快速啟動,當我的業(yè)務(wù)發(fā)展到一定時候,我一定要組織自己的團隊,把業(yè)務(wù)場景做到一定極致。人工智能團隊在這種公司起到業(yè)務(wù)場景的精細打造或者工匠精神的狀態(tài)?!?/p>

所以人工智能團隊存在的價值就在于幫助公司在一些特定的,有差異性的能力方面,能保持領(lǐng)先性。

事實上,關(guān)于場景和產(chǎn)品對人工智能布局的重要性,在上周聯(lián)想舉辦的Tech World2017上聯(lián)想CTO芮勇也講過一種觀點,他認為,人工智能其實是需要迭代的,需要有一個做閉環(huán)的系統(tǒng),前端的設(shè)備就代表了一個入口,有入口就有用戶,有用戶的任何信息反饋,就可以幫助人工智能有更多數(shù)據(jù)去學(xué)習(xí),學(xué)習(xí)了以后后面有基礎(chǔ)架構(gòu),運算得更快,服務(wù)質(zhì)量越來越好,服務(wù)質(zhì)量越來越高,反過去促進賣出更多的設(shè)備,這樣就看到閉環(huán)系統(tǒng)了,更多設(shè)備又有更多的用戶,更多的用戶又有更多的數(shù)據(jù),更多數(shù)據(jù)有更好的服務(wù)。

從某種角度講,此與周鴻t的看法殊途同歸。

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2017-07-28
從人工智能“世界杯”奪冠,詳解360式AI進化路線
摘要:360人工智能在ILSVRC-2017上的奪冠,使360智能團隊浮出水面,那么與其他互聯(lián)網(wǎng)巨頭相比,360的AI進化路線圖到底是怎樣的?“能落地的人工智能才是真正的人工智能”因為去年周鴻t曾經(jīng)公

長按掃碼 閱讀全文