AI手機(jī)攝影的三個(gè)流派,其中藏了個(gè)假的

在咱們身邊,有一個(gè)鐵打的定律,那就是一個(gè)東西或者名稱(chēng)火了,馬上就會(huì)群起而模仿之。久而久之,這種“微創(chuàng)新”甚至“不用創(chuàng)新”的方式,被國(guó)人冠名為“山寨文化”。

互聯(lián)網(wǎng)領(lǐng)域則更是如此,團(tuán)購(gòu)火了能百團(tuán)大戰(zhàn),O2O火了能全面“開(kāi)O”,共享經(jīng)濟(jì)火了,愣是連男友女友都能“共享”。

山寨得多,就連技術(shù)都可以山寨。比如說(shuō),去年手機(jī)AI剛剛嶄露頭角,到了今年,全面屏等技術(shù)普及之后,AI似乎就成為了各手機(jī)廠商普遍希望蹭的熱點(diǎn)。

但問(wèn)題來(lái)了,我們知道一塊AI移動(dòng)芯片要承載非常復(fù)雜的深度架構(gòu),需要幾年來(lái)部署開(kāi)發(fā);下圍棋的AlphaGo要匯集幾十位頂尖科學(xué)家的心血,幾年迭代才能正式超越人類(lèi)。

代表了機(jī)器智慧向人類(lèi)接近的AI,難道真的有那么容易嗎?

去年音箱大戰(zhàn)的時(shí)候,有的跟風(fēng)山寨產(chǎn)品甚至隨便搭載個(gè)對(duì)話系統(tǒng),連喚醒詞都不換就披掛上陣。雖然對(duì)話交互這種形式也可以叫做“AI”,但這樣的產(chǎn)品真的一點(diǎn)價(jià)值都沒(méi)有。買(mǎi)到的用戶(hù)只能驚呼:遇到個(gè)假的人工智能

今年,似乎輪到了手機(jī)AI遭遇這種奇遇。各廠商紛紛投入AI懷抱成為流行時(shí),假的AI手機(jī)似乎也悄然來(lái)到了我們身邊。

誠(chéng)然,AI是一個(gè)泛概念,不同等級(jí)、不同完成度的技術(shù)孕育其中。但AI也不應(yīng)該是一個(gè)永遠(yuǎn)跌落,毫無(wú)底線的技術(shù)。如果沾邊就算的話,茶杯上加個(gè)計(jì)算合適水溫的算法豈不也成了AI設(shè)備——問(wèn)題是這事人類(lèi)自己就能感覺(jué)出來(lái)啊。

所以說(shuō),AI的真與假,是建立在能給使用者帶來(lái)哪些實(shí)際價(jià)值基礎(chǔ)上的。有無(wú)法被其他技術(shù)解決方案替代的價(jià)值,或許才是消費(fèi)者需要的真AI。也只有如此,AI作為一種技術(shù)才能持久。

AI手機(jī)的真與假,或許也應(yīng)該有個(gè)邊界。本尼迪克特·安德森在著名的《想象共同體》中,把極限特征作為框定族群的核心要素。AI手機(jī)帶給消費(fèi)者的價(jià)值,應(yīng)該有哪些底線或者說(shuō)邊界呢?

今天開(kāi)始,我們會(huì)用幾篇文章,跟大家聊一聊手機(jī)AI背后的真實(shí)、夸張與謊言。攝影、游戲、視頻這些我們耳熟能詳?shù)墓δ鼙澈螅粋€(gè)到底什么是真AI手機(jī)的話題正在逐步清晰起來(lái)。

而這個(gè)話題首當(dāng)其沖的,當(dāng)然是AI攝影。

我們知道,識(shí)別和感知物理世界, 是AI的主要能力。利用AI算法進(jìn)行影像理解,構(gòu)成了AI技術(shù)的核心組成部分之一——機(jī)器視覺(jué)。而移植到手機(jī)上,AI與攝像頭結(jié)合,帶來(lái)攝影體驗(yàn)改變也就變成了手機(jī)AI的核心價(jià)值。

進(jìn)入2018的春天,AI攝影近乎成為了每一款新上市手機(jī)的關(guān)鍵詞。但其實(shí)AI是一個(gè)非常寬泛的概念,包括林林種種數(shù)十個(gè)技術(shù)體系。

就像同樣是邀請(qǐng)朋友去看“水景”,去馬爾代夫和去小區(qū)健身房看游泳池是絕不一樣的。AI也是如此,耗資巨萬(wàn)的AlphaGo和成本幾十塊錢(qián)的語(yǔ)音交互音箱,可能都可以算到AI的體系,但價(jià)值之差等若霄壤。

在手機(jī)攝影這個(gè)領(lǐng)域也是如此,如何實(shí)現(xiàn)AI,如何讓AI被消費(fèi)者感受到,目前出現(xiàn)了完全不同的一些思路。今天的AI手機(jī)攝影,可以分為三個(gè)流派。

流派一:用芯片提供AI攝影通用加速

去年,華為發(fā)布了搭載NPU的麒麟970芯片開(kāi)始,之后蘋(píng)果也公開(kāi)了A11仿生神經(jīng)芯片。從后來(lái)華為、榮耀的相關(guān)搭載產(chǎn)品,以及蘋(píng)果iPhoneX來(lái)看,基于AI專(zhuān)用芯片來(lái)實(shí)現(xiàn)手機(jī)的AI攝影功能,是這類(lèi)手機(jī)的核心AI能力。

這可以看做是手機(jī)AI攝影的第一個(gè)流派:芯片派。

華為和榮耀搭載的麒麟970芯片,是世界上首款在CPU、GPU兩個(gè)通用處理單元之外,加入了AI處理單元NPU(Neural network Processing Unit,神經(jīng)網(wǎng)絡(luò)單元)的移動(dòng)芯片。由于利用了深度學(xué)習(xí)處理技術(shù),NPU可以比其他處理模式更快地處理卷積、遷移等深度學(xué)習(xí)任務(wù),也就可以達(dá)成更快的AI任務(wù)處理能力。根據(jù)數(shù)據(jù)顯示,處理相同的AI任務(wù),麒麟970的異構(gòu)計(jì)算架構(gòu)擁有約 50 倍能效和 25 倍性能的提升,圖像識(shí)別速度可達(dá)到約2000張/分鐘,這個(gè)記錄迄今沒(méi)有其他芯片打破。

在這之后,蘋(píng)果也在發(fā)布iPhone X時(shí)發(fā)布了A11芯片,兩家不約而同采取了相似的策略。A11集成了一個(gè)專(zhuān)用于處理AI任務(wù)的運(yùn)算單元“神經(jīng)網(wǎng)絡(luò)引擎(Neural Engine)”,開(kāi)啟了iPhoneX的AI之路。

從底層芯片開(kāi)始一層層疊加AI處理能力。有兩個(gè)層面的價(jià)值,一是在硬件里完成終端AI計(jì)算,可以保證攝像任務(wù)的實(shí)時(shí)性和安全性。畢竟攝影任務(wù)上傳到云端計(jì)算有卡頓可能,斷網(wǎng)后無(wú)法工作,圖片上傳服務(wù)器面臨的數(shù)據(jù)危險(xiǎn)也是顯而易見(jiàn)的。

另一方面,芯片派容易被忽略的價(jià)值在于對(duì)AI攝影任務(wù)進(jìn)行通用加速。比如有的玩法要人臉識(shí)別,有的直播要讀取動(dòng)作指令,有的濾鏡要搞空間處理,把這些全擠在CPU、GPU上手機(jī)馬上會(huì)進(jìn)入龜速狀態(tài),用云處理無(wú)法支持不說(shuō),更喪失了實(shí)時(shí)體驗(yàn)。APP的攝影需求有千千萬(wàn),目前來(lái)看只有在終端有AI處理單元才能滿足這些“未知需求”。

說(shuō)到底,基于芯片的AI攝影到底有哪些體驗(yàn)?zāi)兀?/p>

華為Mate10、榮耀V10以及iPhone X的能力數(shù)據(jù)說(shuō)明,AI攝影可以體現(xiàn)在識(shí)別、動(dòng)作捕捉、光影分析、AR等幾個(gè)方面。

比如iPhoneX利用A11仿生芯片,可以與結(jié)構(gòu)光傳感器、深度陀螺儀進(jìn)行結(jié)合,處理人臉、AR等任務(wù),并可以快速處理圖像識(shí)別。

而借助麒麟970芯片帶來(lái)的NPU專(zhuān)項(xiàng)處理能力,榮耀V10、華為mate10等產(chǎn)品可以實(shí)現(xiàn)復(fù)雜的AI任務(wù)加速,從而完成場(chǎng)景識(shí)別拍照模式、圖像增強(qiáng)與深度處理、AI肖像處理、AI動(dòng)態(tài)捕捉、AI夜拍等任務(wù)。包括當(dāng)下較為少見(jiàn)的圖像語(yǔ)義分割功能,通過(guò)強(qiáng)計(jì)算能力實(shí)現(xiàn)對(duì)取景器內(nèi)的畫(huà)面進(jìn)行分割處理,進(jìn)一步實(shí)現(xiàn)精準(zhǔn)的智慧分區(qū)圖像處理,相較圖像處理App更接近修圖師的專(zhuān)業(yè)效果。

接下來(lái),榮耀、華為的新產(chǎn)品,以及新一代iPhone必然會(huì)繼續(xù)這條路。而產(chǎn)品和技術(shù)先發(fā)優(yōu)勢(shì),似乎也在催生AI體驗(yàn)的升級(jí)。比如榮耀最早從magic時(shí)代就開(kāi)始積累AI手機(jī)的產(chǎn)品經(jīng)驗(yàn)與訓(xùn)練數(shù)據(jù),兩年的時(shí)間自然形成了對(duì)新產(chǎn)品的供養(yǎng)體系。

這個(gè)流派的優(yōu)點(diǎn)在于,用戶(hù)可以體驗(yàn)到AI的多樣化和增長(zhǎng)性,手機(jī)里不是一成不變的AI體驗(yàn),而是可以隨著生態(tài)和技術(shù)的發(fā)展不斷進(jìn)化。問(wèn)題是芯片流的門(mén)檻很高,需要研發(fā)的巨大投入和長(zhǎng)達(dá)幾年的等待周期。

流派二:基于攝像頭搞AI

第二個(gè)AI手機(jī)攝影流派,不能不提到讓人愛(ài)恨糾葛的谷歌。

眾所周知,谷歌是不大力押注硬件技術(shù)的,而是在戰(zhàn)略上選擇強(qiáng)打AI算法優(yōu)勢(shì)和云計(jì)算強(qiáng)項(xiàng)。這個(gè)被谷歌稱(chēng)為AI First的戰(zhàn)略,已經(jīng)體現(xiàn)在谷歌各種穿戴、家庭以及移動(dòng)設(shè)備上,其中pixel系列手機(jī)也不例外。

去年推出的谷歌pixel 2,給出了一個(gè)非常特別的AI攝影模式,它沒(méi)有專(zhuān)屬的AI芯片,卻利用算法和AI圖像處理單元完成了動(dòng)態(tài)模糊攝影等攝影能力的補(bǔ)償。甚至把攝像頭切割成非常復(fù)雜的成像單元,來(lái)供給算法端實(shí)現(xiàn)對(duì)景深、空間感的AI計(jì)算。

這種“吃力不討好”的方式,大概也只有谷歌會(huì)做。背后的核心原因,一方面是谷歌希望用戶(hù)適應(yīng)所有數(shù)據(jù)都上傳到谷歌云的生活方式,另一方面也是希望加強(qiáng)AI優(yōu)勢(shì)的商業(yè)化通道。

谷歌手機(jī)的AI秘訣,不在底層芯片里,而是在攝像頭區(qū)域里藏了一顆專(zhuān)用圖像處理協(xié)處理器,即ImageProcessing Unit (IPU),專(zhuān)門(mén)用來(lái)結(jié)合云計(jì)算與算法集群處理AI拍照與視頻任務(wù)。

但這樣做的問(wèn)題是圖像任務(wù)會(huì)在專(zhuān)門(mén)的部件里處理,并且極大程度依賴(lài)云計(jì)算。但確實(shí)一定程度上繞開(kāi)了開(kāi)發(fā)芯片的難度,彌補(bǔ)了谷歌硬件上的弱勢(shì)。這種劍走偏鋒,讓手機(jī)各部件自行AI的思路,有賴(lài)于谷歌強(qiáng)絕天下的算法積累,以及云計(jì)算處理能力。缺點(diǎn)是:除了谷歌大概沒(méi)有人可以嘗試。

流派三:搞個(gè)帶算法的APP算了

在手機(jī)AI概念火熱起來(lái)之后,國(guó)內(nèi)手機(jī)廠商似乎很快就按耐不住了。雨后春筍版的“AI攝影”字樣應(yīng)運(yùn)而生,于是也催生了AI攝影的第三個(gè)流派:APP派。

所謂APP派很好理解,想一想我們用的各種美顏拍照相機(jī)、動(dòng)態(tài)美顏錄制應(yīng)用等等,這些能力,在今天基本都要用到AI算法來(lái)實(shí)現(xiàn)更好的效果。比如美圖秀秀旗下的美圖相機(jī),就是在APP里集成了機(jī)器學(xué)習(xí)算法,用來(lái)識(shí)別拍攝人像和背景、光源間的關(guān)系,從而把人像分離出來(lái)。

假如把這種基于算法的“AI應(yīng)用”或者“AI濾鏡”,直接搭載到產(chǎn)品攝像頭里,說(shuō)這是AI攝影功能,行不行呢?

好像,大概,可能,也可以吧?

問(wèn)題是缺少芯片的支持,算法方面也沒(méi)有技術(shù)優(yōu)勢(shì),用戶(hù)拿到的AI體驗(yàn)可能存疑。

前不久,紅米Note5主打了所謂“千元AI雙攝”打開(kāi)了這場(chǎng)關(guān)于AI的宣傳戰(zhàn)序幕。隨后vivo X21也以AI攝影能力作為宣傳。從產(chǎn)品說(shuō)明中可見(jiàn),這兩部手機(jī)的解決方案基本就是上文所說(shuō)的“AI濾鏡”模式:開(kāi)發(fā)具有一定識(shí)別特性的攝影功能,然后在不卡的前提下部署在手機(jī)中就可以了。

剛剛發(fā)布的小米Mix2S,本質(zhì)上也是這種解決方案。小米提出的智能場(chǎng)景識(shí)別,即在利用圖像數(shù)據(jù)訓(xùn)練處手機(jī)對(duì)不同景物的識(shí)別能力,再在手機(jī)相機(jī)中初始化搭載“美圖相機(jī)”之類(lèi)APP的算法功能,針對(duì)不同拍照對(duì)象進(jìn)行針對(duì)性修圖。

比如機(jī)器學(xué)習(xí)進(jìn)行人臉和人體輪廓識(shí)別,自動(dòng)進(jìn)行背景虛化和摳圖,以及自動(dòng)疊加多張照片進(jìn)行防抖等等。

這類(lèi)手機(jī)的問(wèn)題,在于芯片和攝像頭中缺乏專(zhuān)項(xiàng)處理AI任務(wù)的單元,一旦運(yùn)行高負(fù)載的AI任務(wù)就需要呼喚云端。而云端的相應(yīng)速度不夠,又導(dǎo)致AI攝影的識(shí)別率和準(zhǔn)確率下降。

舉個(gè)例子,處理夜拍效果時(shí),手機(jī)需要運(yùn)用光源捕捉、空間捕捉等AI算法,從而實(shí)現(xiàn)夜晚中清晰拍照和光源還原。

而這類(lèi)APP派假如要加載夜拍類(lèi)的AI應(yīng)用就有點(diǎn)尷尬了。因?yàn)檫@類(lèi)深度學(xué)習(xí)的負(fù)載很大,用傳統(tǒng)移動(dòng)芯片+云計(jì)算來(lái)跑這類(lèi)AI拍攝任務(wù),會(huì)出現(xiàn)黑夜一層層褪去,半天無(wú)法對(duì)焦。拍照之后又要上傳到云端進(jìn)行很長(zhǎng)時(shí)間“處理”,精準(zhǔn)度和體驗(yàn)都很差。而一旦沒(méi)網(wǎng)就更麻煩了。所以我們能看到的是,目前大部分國(guó)產(chǎn)手機(jī)宣傳所謂的AI拍照時(shí),都絕口不提夜拍、動(dòng)作捕捉等復(fù)雜任務(wù)。

于是,這個(gè)流派中消費(fèi)者看到的宣傳材料里的“AI拍照”,也就變成了整個(gè)手機(jī)的全部AI能力。其實(shí)這些能力弄個(gè)不算太差的手機(jī)下載個(gè)相關(guān)APP就可以實(shí)現(xiàn)了,單獨(dú)作為一款產(chǎn)品的主要宣傳材料就有點(diǎn)奇怪。

最后,讓我們總結(jié)一下三個(gè)流派的手機(jī)AI攝影,到底帶給消費(fèi)者怎樣的差別。

芯片派:可以通過(guò)終端AI加速,來(lái)實(shí)現(xiàn)比較高等級(jí)的AI攝影任務(wù),比如快速美化、物體識(shí)別方案拍照等等。而且通用加速能力和平臺(tái)接口下放給開(kāi)發(fā)者,更多的拍照應(yīng)用,比如夜拍、動(dòng)作抓拍、人臉替換、體態(tài)命令等等,必然會(huì)陸續(xù)加入到用戶(hù)的手機(jī)中。用戶(hù)相當(dāng)于購(gòu)買(mǎi)了持續(xù)升級(jí)的AI拍照設(shè)備。

攝像頭派:基于攝像頭的AI芯片,應(yīng)該可以加入更多AI玩法,但是除了谷歌之外,其他開(kāi)發(fā)者是絕對(duì)碰不到的。

APP派:抱歉,除了廣告語(yǔ)上的1~2個(gè)基礎(chǔ)AI功能外,別的就不用想了。

三個(gè)流派背后手機(jī)AI的孰真孰假,也就一目了然了。接下來(lái)一篇,我們會(huì)聊聊手機(jī)游戲上的真假AI。

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無(wú)關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2018-03-27
AI手機(jī)攝影的三個(gè)流派,其中藏了個(gè)假的
原標(biāo)題:AI手機(jī)攝影的三個(gè)流派,其中藏了個(gè)假的在咱們身邊,有一個(gè)鐵打的定律,那就是一個(gè)東西或者名稱(chēng)火了,馬上就會(huì)群起而模仿之。久而久之,這種“微創(chuàng)新”甚至“不用創(chuàng)新”的方式,被國(guó)人冠名為“山寨文化”。

長(zhǎng)按掃碼 閱讀全文