美圖CTO張偉:5年前 不會想到會花 70%時(shí)間在AI上

視覺文化時(shí)代,「顏值」作為生活之美的展示,被覽閱和品味,不僅成為一種文化符號,更成為一種可以被消費(fèi)和增值的商品。

美圖做的就是「顏值」這門生意。

在國內(nèi),或許沒有哪家公司能比美圖更能精準(zhǔn)把握人們對于「顏值」的需求。單是圍繞這一點(diǎn),美圖就分步有序地打造了 20 多個美顏類 app,以及為自拍功能定制的手機(jī)。在初期一片唱衰和嘲諷中,手機(jī)已然成為美圖營收主要的貢獻(xiàn)者,2016 年近 75 萬臺的銷量,為美圖提供了 14.7 億的收入。

如果你走在商業(yè)街里,推開一家家私營服裝店,會發(fā)現(xiàn)這些店主們十有八九,用的都是美圖標(biāo)志性的盾牌形狀手機(jī)。

新花樣:視頻實(shí)時(shí)分割

「美」總是需要新花樣的。膚白長腿大眼遠(yuǎn)遠(yuǎn)不夠,還更需要有趣的內(nèi)容和形式。而這種「花樣」需要繁復(fù)的基礎(chǔ)技術(shù)作為支撐。

對于目前最火熱的人工智能技術(shù),美圖自然也看到了它背后蘊(yùn)含的顛覆性力量。

在美拍平臺上,明星柳巖所拍攝的美少女變身視頻,已經(jīng)擁有接近 200 萬的播放量,里面所展現(xiàn)的「百變背景」功能,可以在視頻中進(jìn)行實(shí)時(shí)圖像分割,將人物從真實(shí)場景中摳出,放置在特定的卡通背景中,并加入 AR 特效和音樂效果。

專訪美圖 CTO 張偉:5年以前,我們也不會想到會花 70% 的時(shí)間在人工智能上

這項(xiàng)技術(shù)的實(shí)現(xiàn),用了深度學(xué)習(xí)。

在 CV 圈,圖像分割技術(shù)并不新鮮。對于一張靜態(tài)的圖片進(jìn)行分割,可以花費(fèi)很長時(shí)間來處理,但是「實(shí)時(shí)」則要求達(dá)到每秒 30 幀的處理速度。在這極短的時(shí)間內(nèi)需要進(jìn)行的工作包括:人像識別和分割、邊緣處理、背景替換、實(shí)時(shí)美顏美型、AR 效果添加等多個環(huán)節(jié)。

保證視頻實(shí)時(shí)分割的響應(yīng)性、速度和可靠性,綜合考驗(yàn)了一家公司技術(shù)團(tuán)隊(duì)的研發(fā)和工程能力。

AI 領(lǐng)域的發(fā)聲

作為一家 2C 的產(chǎn)品公司,美圖一直以來營造的是一個接地氣的親和品牌形象,隨著科技感更強(qiáng)的手機(jī)品牌的推出,美圖也逐漸在人工智能領(lǐng)域?qū)ふ腋鼜?qiáng)的存在感。在「百變背景」正式推出之前,美圖就把相關(guān) Demo 搬到了學(xué)術(shù)大會 VALSE(視覺與學(xué)習(xí)青年學(xué)者研討會)上。

這場四月中旬召開的學(xué)術(shù)會議,參會者達(dá) 2500 多人,聚攏了國內(nèi)頂尖 AI 公司代表和計(jì)算機(jī)視覺青年研究人才。

在 VALSE 用于展示論文 Poster 墻的附近,就是 Demo 區(qū),排列著國內(nèi)大大小小的計(jì)算機(jī)視覺公司展臺,包括 BAT、曠視科技、格靈深瞳、云從科技、滴滴出行等。與其它 AI 公司展臺動輒「識別率」和人臉比對系統(tǒng)坐鎮(zhèn)的高冷范兒相比,美圖展臺的 Demo 產(chǎn)品更易令人產(chǎn)生參與的欲望,試玩的人自然絡(luò)繹不絕,內(nèi)行走過,也會不禁念叨一句「喲,他們家產(chǎn)品挺有意思」。

專訪美圖 CTO 張偉:5年以前,我們也不會想到會花 70% 的時(shí)間在人工智能上

(VALSE 現(xiàn)場圖)

不可否認(rèn),美圖的產(chǎn)品招人喜歡。

美圖在人工智能領(lǐng)域并不算喊得很大聲的那一個,但是動作下得很早。

2010 年,美圖成立了一個專注于前沿影像技術(shù)研發(fā)的實(shí)驗(yàn)室:MTLAB(美圖影像實(shí)驗(yàn)室)。這次推出的「百變背景」功能,就出于 MTLAB 之手。

MTLAB 地理上分布在北京、廈門和深圳,北京注重于長期、基礎(chǔ)性技術(shù)研究,廈門 MTLAB 側(cè)重 AI 應(yīng)用落地,深圳則偏重于硬件產(chǎn)品的算法支持。這個實(shí)驗(yàn)室早在 2012 年的時(shí)候就關(guān)注了深度學(xué)習(xí)技術(shù)。美圖 CTO 張偉在接受雷鋒網(wǎng)(公眾號:雷鋒網(wǎng))采訪時(shí),介紹道:

「大概在 2011、12 年就開始加入人工智能部分的研發(fā)了。原因是,這東西一開始看起來是萬能的,當(dāng)然后面發(fā)現(xiàn)有很多問題。」

專訪美圖 CTO 張偉:5年以前,我們也不會想到會花 70% 的時(shí)間在人工智能上

(美圖 CTO 張偉)

雖然不同地區(qū)實(shí)驗(yàn)室側(cè)重點(diǎn)不同,但是為了確保研發(fā)和產(chǎn)品的無縫銜接,往往會把同一個項(xiàng)目的研發(fā)人員,分在北京、廈門和深圳三地。其他部門的員工,大約每兩周都要與實(shí)驗(yàn)室的同事碰頭,產(chǎn)品經(jīng)理分享新的 app 資訊,實(shí)驗(yàn)室同事分享新的 paper 和技術(shù)趨勢。

實(shí)際上,一個新的產(chǎn)品功能,都是在研發(fā)和產(chǎn)品團(tuán)隊(duì)反復(fù)「磋商」的氛圍中誕生的。

「我們基本上是一個研發(fā)小組先做 demo,demo 不錯的話,交給一個中間架構(gòu)團(tuán)隊(duì)把它封裝成一個組件,交給前端。然后在公司里面去問,哪個產(chǎn)品團(tuán)隊(duì)對這個新技術(shù)感興趣?有團(tuán)隊(duì)感興趣的話,產(chǎn)品團(tuán)隊(duì)里的設(shè)計(jì)師們,就會拿過去做二次開發(fā),然后再對這個組件提一些性能、速度、效果方面的建議?!?/p>

談及美圖來這次 VALSE 大會的緣由,張偉經(jīng)常提到一個詞匯就是「看到」。美圖雖然是年資較長的上市公司,在人工智能領(lǐng)域投入也不菲,但 AI 這個標(biāo)簽并不是其與生俱來的。就算是在人工智能領(lǐng)域重度參與的英偉達(dá),其 CEO 黃仁勛還在最近的采訪中表示「將來某一天,我們可能會成為一家人工智能計(jì)算公司」。這是向 AI 轉(zhuǎn)型的公司都要共同面臨的課題,要反復(fù)向外界強(qiáng)調(diào)自己在 AI 領(lǐng)域的存在。所以美圖需要參加 AI 圈的活動,不論學(xué)術(shù)的還是業(yè)界活動:

「因?yàn)槲覀儺吘乖谧?AI 這個領(lǐng)域,我們希望大家看到我們,我們也看到他們。」

如果不做人工智能,美圖就會空掉

人工智能對于美圖公司來說,到底處在一個什么樣的位置?作為 CTO 的張偉一句話說明了一切:

我花 70% 的時(shí)間在上面...... 我們覺得如果再過三年,這家公司不做 AI,可能就會空掉了。

美圖從一家工具型公司,往人工智能公司轉(zhuǎn)型,不僅僅是出于產(chǎn)品需求,更是攸關(guān)性命的一項(xiàng)抉擇。在他看來,人工智能這項(xiàng)技術(shù),可以把美圖已有的東西重新刷一遍,將技術(shù)水平提升到一個前所未有的高度。

「很多人工智能創(chuàng)業(yè)公司有個問題,就是『為人工智能而人工智能』,這不是一個合理的東西。但我們就是有一個很明確的目標(biāo),比如女性變美這件事情,這件事情很垂直,深度學(xué)習(xí)能做嗎?一定能做!大數(shù)據(jù)能不能起到作用,一定能起作用!」

李開復(fù)曾經(jīng)盛贊美圖是一家「頂級人工智能公司」。對此,張偉本身的用詞會更加謹(jǐn)慎:

「開復(fù)老師這么說,是對我們一個非常高的肯定。如果你去看開復(fù)老師對于人工智能的定義,是包含兩個方面,就是機(jī)器學(xué)習(xí)+大數(shù)據(jù)。那至少另外一半我們是有的。剩下的機(jī)器學(xué)習(xí),我個人認(rèn)為,深度學(xué)習(xí)相關(guān)的東西,美圖已經(jīng)涉及的足夠深了。」

眾所周知,美圖坐擁人臉和圖像數(shù)據(jù)巨礦,剩下的,就是對挖礦工具的深度打磨。張偉認(rèn)可人工智能技術(shù)的巨大價(jià)值:

「整個世界都在等煉油的技術(shù),數(shù)據(jù)就像石油一樣,如果沒有煉油的工具,石油就是一團(tuán)黑水。但只要你有了煉油的工具,只要能挖到石油,那就跟印鈔機(jī)一樣?!?/p>

但同時(shí),他是一個堅(jiān)定的「非技術(shù)決定論者」,他認(rèn)為一項(xiàng) AI 技術(shù)的成功應(yīng)用,還涉及到產(chǎn)品、設(shè)計(jì)、商業(yè)等各種因素。

雖然美圖拿手的是人臉技術(shù),但是出于對電商和廣告抱持的野心,美圖研發(fā)團(tuán)隊(duì)的人員同樣投入大量精力在其他物體的識別技術(shù)上。

「我們內(nèi)部做人臉的人數(shù),跟做其它物體識別人數(shù),比例為 1:7?!?/p>

沒有對手,有什么意思?

美圖的產(chǎn)品,并非沒有對手。例如打頭陣的美圖秀秀 app,市面上就有很多類似的競爭對手,而且有的是來自于 BAT 級別的公司,美圖當(dāng)然有危機(jī)感,但對此張偉用了一個很性情的詞兒--「酷」。

「我們有很強(qiáng)的危機(jī)感,但這實(shí)際上是一件很酷的事情。沒有對手,有什么意思?我們也知道一些競爭對手的相關(guān)團(tuán)隊(duì)有挺多人,我們投入很大的精力和資金去追趕,但是當(dāng)證明完自己之后,我們在想一個問題,就算你比其它公司多出 0.1%、0.2% 個點(diǎn),還是遠(yuǎn)遠(yuǎn)不夠的。」

歸根結(jié)底,還是一個老觀點(diǎn),技術(shù)并不是唯一決勝的關(guān)鍵,美圖的「顏值」生態(tài)鏈,包括龐大垂直的用戶群、對用戶需求的精準(zhǔn)把控、品牌效應(yīng)和商業(yè)模式構(gòu)成了一個完整的鏈條,這是其核心競爭力。

「我們每一個產(chǎn)品都有一個競爭對手,但是合在一起,我們覺得沒有像我們一樣的綜合體。我們的看法是,如果我們再把技術(shù)往深的地方做,一定會把別人拉開一大段距離。但即便拉不開大距離,以我們目前產(chǎn)品、運(yùn)營、品牌的綜合實(shí)力,我們不會覺得有多大問題。因?yàn)椴恢皇潜燃夹g(shù)?!?/p>

所以,在 AI 技術(shù)方面,美圖并不忌諱借用外力。甚至為了更快取得先機(jī),會主動尋求與更多第三方合作機(jī)會。而美圖這次參加 VALSE 大會,其實(shí)也是為了跟 AI 業(yè)界同仁進(jìn)行一次深度的交流,談一談可能的合作。

「美圖不然自己做,不然就靠第三方的資源建立起來,構(gòu)建自己獨(dú)一無二的生態(tài)系統(tǒng)...... 我們正在跟世界上很多不同的團(tuán)隊(duì),一起來做深度學(xué)習(xí)的工作,互相學(xué)習(xí)和交流,而我們也在做學(xué)術(shù)方面的工作。」

談及如今 AI 公司幾乎標(biāo)配的「首席科學(xué)家」,張偉也是保持著開放的態(tài)度。

「每個公司邀請首席科學(xué)家的目的不同,可能是為了更好的融資,也可能是為了讓公司的技術(shù)水平進(jìn)一步提升。對于美圖而言,如果一位科學(xué)家的加入能給我們的研發(fā)水準(zhǔn)帶到一個新的高度,我們也很愿意敞開懷抱去迎接他的到來?!?/p>

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2017-05-12
美圖CTO張偉:5年前 不會想到會花 70%時(shí)間在AI上
視覺文化時(shí)代,「顏值」作為生活之美的展示,被覽閱和品味,不僅成為一種文化符號,更成為一種可以被消費(fèi)和增值的商品。

長按掃碼 閱讀全文