謝天謝地,AI開發(fā)者的“吐槽大會”終于結(jié)束了

原標(biāo)題:謝天謝地,AI開發(fā)者的“吐槽大會”終于結(jié)束了

今天是個(gè)被AI圈刷屏的日子。

原因不是谷歌新手機(jī)和波士頓動力的機(jī)器人,而是華為發(fā)布了一款新的AI開發(fā)平臺:ModelArts。

我粗略統(tǒng)計(jì)了一下,AI從業(yè)者與開發(fā)者們之所以瞬間被撩到嗨點(diǎn),是因?yàn)閲鴥?nèi)看似熱鬧無比的AI行業(yè),其實(shí)已經(jīng)很久沒有AI開發(fā)相關(guān)的重要項(xiàng)目出來了。ModelArts一出來,有一種終于被重視了的“久旱逢甘霖”體驗(yàn)。

這事其實(shí)非常吊詭:AI再怎么宏大敘事,不也要靠開發(fā)者一磚一瓦蓋起來嗎?可偏偏AI行業(yè)是PPT邏輯圖發(fā)了不少,用來干活的家伙卻屈指可數(shù)。

而AI開發(fā),在今天并不是一個(gè)多么成熟的工作,其中問題與矛盾非常顯著。

在HC大會第三天,華為云分析了今天AI開發(fā)的困境。今天限制AI開發(fā)的兩個(gè)主要因素,一個(gè)是快,一個(gè)是慢,兩者形成了相互依賴的矛盾體,解決一個(gè)要依賴另一個(gè)的大幅改善。

可以說,這是對AI開發(fā)現(xiàn)狀的精準(zhǔn)判斷。

而ModelArts的價(jià)值也不僅是刷屏朋友圈,而是與其他AI開發(fā)工具一起,從全流程、普惠的角度針對性解決了今天AI開發(fā)中幾個(gè)最明顯的“槽點(diǎn)”。

想要明白ModelArts與AI開發(fā)生態(tài)的背后秘密,咱們要先從這些“槽點(diǎn)”說起。

寫到這,其實(shí)筆者心中的洪荒之力已經(jīng)按耐不住了。因?yàn)殚L時(shí)間采訪AI開發(fā)者,筆者電腦和大腦里都存儲了無數(shù)開發(fā)者的吐槽——要不是因?yàn)閾?dān)心收視率不高,我都能做好幾期AI吐槽大會了......

謝天謝地,好在這一切終于快結(jié)束了。

每一個(gè)都是戰(zhàn)士:夠開幾季“吐槽大會”的AI開發(fā)者們

好,大家嚴(yán)肅點(diǎn),下面開始吐槽了。

經(jīng)過長時(shí)間追蹤AI開發(fā)者,我們的記者團(tuán)隊(duì)一致認(rèn)為今天這個(gè)行業(yè)都是戰(zhàn)士。尤其是那些希望用AI開發(fā)來創(chuàng)業(yè)的,更是戰(zhàn)士中的斯巴達(dá)克斯。這里咱們可以看幾種最有槽點(diǎn),不對,是最典型的AI開發(fā)案例:

案例1:親朋好友一起上型AI開發(fā)者。我們知道,AI里有個(gè)詞叫做AI民工,或者數(shù)據(jù)民工。就是說AI訓(xùn)練之前,其實(shí)有大量時(shí)間沒干別的,就是做數(shù)據(jù)標(biāo)記。這個(gè)活其實(shí)非常簡單,但問題是極其枯燥大量重復(fù),并且一旦某些數(shù)據(jù)標(biāo)記錯(cuò),很可能帶給開發(fā)者后面訓(xùn)練時(shí)以“無限驚喜”。

而我們了解到的情況是,雖然大家都在說所謂AI民工,但這個(gè)崗位由于非常新穎且上下不靠,即使在大公司也是稀缺資源。而對小團(tuán)隊(duì)開發(fā)者來說,哪里找AI民工來標(biāo)記數(shù)據(jù)?。克院芏嗳说慕鉀Q方案,就是親戚群里發(fā)紅包幫標(biāo)點(diǎn)數(shù)據(jù)、老同學(xué)里叫一聲幫我弄點(diǎn)數(shù)據(jù),更有甚者我見過朋友圈眾籌標(biāo)數(shù)據(jù)的——做AI,愣做出了拼多多購物的既視感。

案例2:“Boss求求你了”型AI開發(fā)者。這種開發(fā)者一般存在于科研機(jī)構(gòu)和高校中,以在讀博士為主要人群。他們寫完模型,等著變成paper,于是想用學(xué)校買的架構(gòu)驗(yàn)證一下。那么好,先登記排隊(duì)。輪到號了訓(xùn)練一下一星期過去了,結(jié)果發(fā)現(xiàn)不太對?挑個(gè)參數(shù)又一星期,優(yōu)化一下數(shù)據(jù)集又一星期。由于師兄師弟不少,還就經(jīng)常輪不上你。

模型錯(cuò)誤幾次,這類開發(fā)者和他們的導(dǎo)師都很容易抓狂。于是經(jīng)常出現(xiàn)這樣一幕:某某AI博士哭訴“Boss大人求求你了再讓我算一次吧”。

案例3:創(chuàng)業(yè)焦慮型AI開發(fā)者。創(chuàng)業(yè)AI開發(fā)者,注重更多的是在部署和應(yīng)用,而巧的是坑也在這里。我們采訪過一個(gè)案例,開發(fā)者做了一個(gè)教育類的深度學(xué)習(xí)算法,但在部署時(shí)卻發(fā)現(xiàn),TensorFlow上訓(xùn)練的模型不支持大規(guī)模GPU并用,給后續(xù)帶來了無盡麻煩。

部署難,一部署就出錯(cuò),是很多AI開發(fā)者面臨的瓶頸。創(chuàng)業(yè)團(tuán)隊(duì)辛辛苦苦訓(xùn)練了個(gè)聰明的模型,一投入應(yīng)用就變傻子,這感覺豈是一個(gè)酸爽了得。

案例4:理想豐滿型AI開發(fā)者。AI大潮襲來,也催生了很多非科班出身,尤其是IT工程師轉(zhuǎn)型AI。結(jié)果一入門發(fā)現(xiàn),各種算法算力算子不計(jì)其數(shù),調(diào)參配比極其復(fù)雜。而且AI的黑箱性還帶來一種“養(yǎng)蠱”的快感,入門級選手連錯(cuò)都不知道哪錯(cuò)了。最終只能是AI前景遠(yuǎn)大,AI理想豐滿,AI讓我暫時(shí)撤退……

案例5:早知如此型AI開發(fā)者。 AI開發(fā),經(jīng)常要經(jīng)過N個(gè)版本的優(yōu)化和再訓(xùn)練,當(dāng)然這就跟做設(shè)計(jì)一樣,經(jīng)常結(jié)果是第一版最好。于是經(jīng)常出現(xiàn)老板或者導(dǎo)師沉思了一下,說:我覺得三版之前那個(gè)蠻好的,找出來數(shù)據(jù)再優(yōu)化一下吧。呵呵噠,三版之前是啥天知地知反正我不知——遇到這種情況,開發(fā)者經(jīng)常只能捶地大喊:早知如此何必……

案例6:對不起有點(diǎn)狂,因?yàn)榭赏虏鄣陌咐龑?shí)在太多了,就說最后一個(gè)吧。還有一種“社區(qū)大神”人設(shè)的AI開發(fā)者,專注混社區(qū)五百年。貌似啥都會,就是不會賺錢。我們見過盜用大神分享的工具和數(shù)據(jù)拿到融資,但大神愣不知道的。AI開發(fā)人才如何實(shí)現(xiàn)IP保護(hù)和變現(xiàn),其實(shí)也是個(gè)大問題。

AI開發(fā),是個(gè)有多重要就有多少無奈的行當(dāng)。

好在,以上這密密麻麻的槽點(diǎn),已經(jīng)被華為剛發(fā)布的ModelArts以及相關(guān)工具“一劍斬群寇了”。

讓“貝爺”們都進(jìn)星級廚房:華為做了個(gè)什么事?

假如說,開發(fā)者是一位位大廚,打算為我們端上美味的AI大餐。

那么今天AI開發(fā)的問題,就是大廚們不是穿戴整齊走進(jìn)廚房煎炒烹炸。而是上山找芯片調(diào)算力,下海找人標(biāo)數(shù)據(jù),進(jìn)林子里采工具,到亂世從中跑訓(xùn)練。好端端的一位大廚,愣被割裂的開發(fā)場景和高企的費(fèi)用給逼成了《荒野求生》的貝爺。

而假如一位廚師要從上山打獵開始做起,又怎么能期望他燉肉效率高呢?

為什么會這樣?

原因在于今天的深度學(xué)習(xí)訓(xùn)練流程,是在一個(gè)個(gè)偶然、垂直條件下產(chǎn)生的。開發(fā)框架有的是最開始僅供少部分科研,有的是僅供企業(yè)內(nèi)部調(diào)用;數(shù)據(jù)集和算子,是經(jīng)過各種偶然因素,被不同人或組織開源的;AI算力,最早都是附加在IT算力上的“增值服務(wù)”。而一些自動機(jī)器學(xué)習(xí)項(xiàng)目,則噱頭價(jià)值遠(yuǎn)大于實(shí)際部署價(jià)值——于是四面奔波,不斷解決兼容問題就成了開發(fā)者的常規(guī)操作。

而華為云剛剛在HC大會上拿出來的ModelArts,特質(zhì)就在于它把以上場景全都整合到了一套云服務(wù)體系下。開發(fā)者可以不離開系統(tǒng),完成從數(shù)據(jù)標(biāo)記與訓(xùn)練準(zhǔn)備,到訓(xùn)練、調(diào)試、推理、部署等所有工作。

這就好比打造了一整套星級廚房,里面有水電燃?xì)?,各種廚具食材,那么開發(fā)者將省去前面無比漫長的準(zhǔn)備工作,直接一展廚藝可矣。

具體來說,名為ModelArts的廚房,跟以前常規(guī)用的“野炊”模式相比,有四大直觀改變:

一、食材隨意購

AI開發(fā)者能夠快速完成數(shù)據(jù)標(biāo)記,就像廚師能夠快速買到食材一樣重要。畢竟做廚師,沒有先從養(yǎng)殖場干起的——知道的我是AI開發(fā)者,不知道還以為我是數(shù)據(jù)農(nóng)家樂呢!

針對最耗時(shí)的數(shù)據(jù)標(biāo)記環(huán)節(jié),ModelArts內(nèi)置了AI數(shù)據(jù)框架,以AI機(jī)制來治理數(shù)據(jù),用迭代訓(xùn)練來解決標(biāo)注的數(shù)據(jù)量問題。也就是讓AI來完成數(shù)據(jù)標(biāo)注本身,不斷優(yōu)化數(shù)據(jù)集,從而讓數(shù)據(jù)標(biāo)注與準(zhǔn)備效率百倍提升。

當(dāng)然,數(shù)據(jù)還是開發(fā)者來準(zhǔn)備,只是準(zhǔn)備體驗(yàn)將獲得巨大躍升。

二、開灶有火

AI模型的訓(xùn)練速度,關(guān)乎于AI算力的提供,也關(guān)乎于訓(xùn)練平臺的路徑優(yōu)化。AI訓(xùn)練過程就像點(diǎn)火做飯,火夠大當(dāng)然炒菜更快。針對訓(xùn)練效率問題,ModelArts通過各類優(yōu)化技術(shù),達(dá)成了在同樣的模型、數(shù)據(jù)集和同等硬件資源情況下,模型訓(xùn)練耗時(shí)降低一半——換句話說,這意味著同樣算力可以供給多一倍的開發(fā)者使用。

三、廚具齊全

上面說過,AI最怕部署,有些AI模型甚至有“見光死”的特點(diǎn)。尤其面對部署在不同的軟硬件架構(gòu)上,給人一種東家借口鍋,西家偷個(gè)鏟的感覺。而基于全棧AI解決能力,ModelArts實(shí)現(xiàn)了一鍵推送模型到所有邊緣、端的設(shè)備上的能力,并支持在線部署和批量推理,滿足大并發(fā)和分布式這些最困難的部署方式??芍^一應(yīng)出具俱全,做出什么菜式都不在話下。

四、還有廚房家電都能幫忙

AI開發(fā)者的最后問題,可能是機(jī)器學(xué)習(xí)訓(xùn)練中的技術(shù)門檻。針對于此,ModelArts不僅給出了明確的教學(xué)演練,還創(chuàng)造性地引入了AI自動學(xué)習(xí)功能,包括模型的自動設(shè)計(jì)與自動調(diào)參等,可以給開發(fā)者智能化幫助。

此外,ModelArts還實(shí)現(xiàn)了全流程可視化管理,不管丟在哪里的數(shù)據(jù)和模型都能準(zhǔn)確找到,這也間接有利于AI黑想象的攻克。

這些蘊(yùn)藏的“AI黑科技”,就像冰箱微波爐這些現(xiàn)代廚房神器,以AI開發(fā)AI,降低開發(fā)者技術(shù)門檻,或許是接下來新的潮流。

值得注意的是,華為云這次不光發(fā)布了“廚房”,還帶來了“餐廳”。于是我們看到了機(jī)器視覺開發(fā)平臺HiLens,以及離線開發(fā)套件Atlas 200 、量子計(jì)算模擬器與編程框架HiQ,讓開發(fā)者可以模擬重要環(huán)境的實(shí)際應(yīng)用場景。

據(jù)華為云介紹,ModelArts將在年底前上線,我們會第一時(shí)間帶來上線評測。

全棧AI的第一個(gè)紅利:為什么ModelArts敢說“全生命周期”?

在采訪中,華為云認(rèn)為,目前業(yè)界的AI開發(fā)平臺,問題是都相對場景單一,不夠全面。而ModelArts則率先做到了全生命周期開發(fā),可以支撐和管理AI開發(fā)當(dāng)中的每一個(gè)環(huán)節(jié)。上面我們也說過,將割裂場景整合到一起,構(gòu)成全生命周期AI開發(fā),是ModelArts倒逼解決慢與貴的核心優(yōu)勢。

這里有個(gè)問題值得注意,相信也是大家所關(guān)心的:顯然每個(gè)人都知道廚房更好用,不想去野地里做飯,那么為什么只有華為的ModelArts,在今天敢說自己是“全生命周期”?

我們或許可以這樣理解:在華為全棧AI體系剛剛發(fā)布48小時(shí),ModelArts與視覺AI應(yīng)用開發(fā)平臺HiLens、離線開發(fā)套件Atlas 200 、量子計(jì)算模擬器與編程框架HiQ四件套代表的AI開發(fā)平臺已經(jīng)變成了第一個(gè)紅利級產(chǎn)品。事實(shí)上,ModelArts本身就是華為全棧AI體系的組成部分。與芯片、架構(gòu)、AI使能平臺緊密相連,從而能夠一個(gè)場景跑通所有數(shù)據(jù)、訓(xùn)練、推理的需要。可以說是剛剛發(fā)布的華為全棧AI,探出的第一根觸手。

其次,全生命周期的AI開發(fā),算力是一切的基礎(chǔ)。在昇騰芯片到來后,華為獲得了能夠組織大規(guī)模AI并聯(lián)算池的機(jī)會,從而可以保證全場景AI開發(fā)運(yùn)行無阻。這里有一個(gè)環(huán)環(huán)相扣的AI推導(dǎo)邏輯。

再者,我們確實(shí)可以看到,今天無論是世界巨頭還是獨(dú)角獸公司。所推的AI開發(fā)平臺都是基于自身的業(yè)務(wù)考量。不會有公司推出一個(gè)與自己業(yè)務(wù)不想關(guān),甚至自身能力之外的AI開發(fā)平臺。所以我們看到AI開發(fā)場景,依然是東一榔頭西一棒子的狀態(tài)。

而華為云,則是圍繞用戶為中心打造了AI開發(fā)平臺,以不讓開發(fā)者奔波為第一思路。并且確實(shí)認(rèn)真看了哪些復(fù)雜可以留給自己,找到了很多關(guān)鍵矛盾的背后邏輯,并將之消解化。這歸因于華為的IT儲備優(yōu)勢,但更歸因華為云“復(fù)雜的歸自己”以及“解決實(shí)際問題”兩大核心理念。

對比之下,以往的AI開發(fā)平臺,更多是以自身產(chǎn)業(yè)利益為視角構(gòu)建產(chǎn)品,而不是以開發(fā)者為出發(fā)視角,或者說不具備以開發(fā)者為中心,清掃問題的產(chǎn)業(yè)條件。

當(dāng)全生命周期的AI開發(fā)平臺開始出現(xiàn),本質(zhì)上意味著某些AI產(chǎn)業(yè)的“黑歷史”將開始瓦解。無論是華為云還是其他品牌,很快會讓AI開發(fā)變成一個(gè)拼創(chuàng)意與想象力的游戲——而不是勞動力、資金成本與技術(shù)門檻相互競底的搞笑節(jié)目。

未來的某個(gè)時(shí)刻,我們會回想起那段AI開發(fā)能開“吐槽大會”的日子,后輩會覺得簡直不可思議,往事杯酒,幾成笑談。

但那時(shí)已經(jīng)遍布AI的世界,卻并不會笑我們。因?yàn)閺你@木取火,到探索人工智能,歷史會記住每一位開發(fā)者都是偉大的。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2018-10-13
謝天謝地,AI開發(fā)者的“吐槽大會”終于結(jié)束了
今天是個(gè)被AI圈刷屏的日子。 原因不是谷歌新手機(jī)和波士頓動力的機(jī)器人,而是華為發(fā)布了一款新的AI開發(fā)平臺:ModelArts。

長按掃碼 閱讀全文