(原標題:不止Alexa和AWS,揭秘亞馬遜人工智能發(fā)展史)
亞馬遜上周四公布了2017年第四季度財報,盈利接近20億美元,創(chuàng)下歷史紀錄。
Alexa語音助手和AWS云計算服務是亞馬遜業(yè)績的亮點。
《連線》雜志近日刊文,介紹了深度學習技術如何賦能Alexa和AWS,以及亞馬遜內(nèi)部的幾乎所有部門。
以下為騰訊科技(微信號ID:qqtech)編譯整理的文章概要:
2014年初,斯里坎斯·希魯梅拉(Srikanth Thirumalai)面見亞馬遜CEO杰夫·貝索斯(Jeff Bezos)。希魯梅拉是一名計算機科學家。他于2005年從IBM離職,成為亞馬遜商品推薦團隊的負責人。這一次,他提出了一項全面的新計劃,將人工智能的最新成果應用至自己的部門。
在會議上,希魯梅拉帶來了一份6頁紙的計劃書。很久以前,貝索斯就提出要求,即匯報給他的產(chǎn)品和服務計劃必須限制在這一長度范圍內(nèi),同時還要配上一份模擬的新聞稿,用于描述最終成果?,F(xiàn)在,貝索斯正在依靠自己的助手們,將公司轉(zhuǎn)型成人工智能發(fā)電站。在亞馬遜的發(fā)展早期,商品推薦功能就已集成人工智能技術,發(fā)貨調(diào)度和倉庫機器人也是如此。然而近年來,這個領域正在掀起一場革命:機器學習正變得越來越高效,尤其是在所謂“深度學習”技術的推動下。計算機視覺、語音識別,以及自然語言處理等技術也都因此獲得了飛速的發(fā)展。
在這個10年的起步階段,亞馬遜并沒有大力投入這些技術。然而現(xiàn)在,亞馬遜意識到,需求非常迫切。這個時代最關鍵的競爭將發(fā)生在人工智能領域:谷歌、Facebook、蘋果和微軟都在押注此類技術,而亞馬遜已經(jīng)落后。亞馬遜設備和服務副總裁大衛(wèi)·利普(David Limp)表示:“我們找到每個團隊負責人,問他們,‘你要如何利用這些技術,將這些技術嵌入自己的業(yè)務?’”
希魯梅拉牢牢記住了這點,并在年度計劃會議上找到貝索斯,向他提出了關于如何更積極地發(fā)展機器學習技術的設想。他認為,亞馬遜的核心業(yè)務已發(fā)展20多年,而機器學習技術的最佳應用場景是與亞馬遜核心業(yè)務不相關的圖像識別和語音識別,因此利用機器學習技術完全重新開發(fā)現(xiàn)有系統(tǒng)風險太大。他表示:“從來沒有人真正將深度學習應用于商品推薦,并帶來更好的結(jié)果。因此,我們自己需要有信心?!比欢?,貝索斯想要更多,而希魯梅拉實際上并沒有做好萬全的準備。因此,他分享了一個更激進的選擇,即利用深度學習技術去顛覆商品推薦的運轉(zhuǎn)方式。這需要用到他團隊尚不具備的能力,尚未開發(fā)出的工具,以及從沒有人想過的算法。貝索斯很喜歡這個選擇,所以希魯梅拉重寫了一份模擬新聞稿,并著手去做。
過去幾年,大批亞馬遜管理者都曾攜帶6頁紙的計劃書去找貝索斯,希魯梅拉只是其中之一。他們提出的想法涉及到各式各樣的產(chǎn)品和完全不同的客戶。然而,他們每個人設想的都是希魯梅拉計劃的一個變種:用先進的機器學習技術來改造亞馬遜的某個部分。其中部分涉及到對當前項目的重新思考,例如機器人方面的工作及龐大的數(shù)據(jù)中心業(yè)務AWS。另一部分則是開發(fā)全新的業(yè)務,例如基于語音的家電,這隨后發(fā)展成為Echo智能音箱。
最終結(jié)果的影響遠遠超出單個項目。希魯梅拉表示,在他面見貝索斯時,亞馬遜的人工智能人才還是相互孤立的?!拔覀儠涣?,但不會分享很多東西,因為我們彼此的經(jīng)驗不太容易直接轉(zhuǎn)移。”他認為。在龐大的工程海洋里,這些是人工智能孤島。在用機器學習去改革公司之后,這樣的局面得到了改變。
盡管所有這些6頁紙計劃書都屬于亞馬遜的“單線程”團隊,即某個特定團隊是技術的“擁有者”,但亞馬遜的團隊之間已展開跨項目的合作。內(nèi)部科學家嘗試解決難題,并與其他團隊分享各自的解決方案。在整個公司里,人工智能孤島開始相互連接起來。隨著亞馬遜人工智能項目目標的擴大,挑戰(zhàn)的復雜性也成為了吸引頂尖人才的磁石,尤其是對那些希望自己的工作立即發(fā)揮影響力的人才來說。這改變了以往亞馬遜對純學術研究的厭惡:亞馬遜的公司文化要求所有創(chuàng)新必須以服務客戶為中心。
亞馬遜喜歡使用“飛輪”一詞來描述,業(yè)務的不同部分如何運轉(zhuǎn),并形成統(tǒng)一的永動機。現(xiàn)在,亞馬遜擁有強大的人工智能飛輪,來自某個團隊的機器學習創(chuàng)新成為了賦能其他團隊的利器,反過來這些團隊開發(fā)產(chǎn)品、提供服務,從而影響其他團隊,甚至整個公司。以付費服務的形式將機器學習平臺提供給外界本身就是種能盈利的業(yè)務。在某些情況下,這還有助于收集更多數(shù)據(jù),進一步提高技術水平。
在亞馬遜從深度學習門外漢發(fā)展成為行業(yè)重要力量的過程中,有許多這樣的6頁紙計劃書出現(xiàn)。轉(zhuǎn)型的成果在亞馬遜公司內(nèi)隨處可見,例如基于機器學習基礎架構(gòu)的推薦系統(tǒng)。目前亞馬遜正變得更聰明,能建議用戶下面應該閱讀什么,應該在購物清單上添加什么,以及今晚可以看什么電影。今年,希魯梅拉開展了一項新工作,即負責亞馬遜的搜索服務。他希望將深度學習技術應用于搜索服務的方方面面。
華盛頓大學頂尖的計算機科學教授佩德羅·多明格斯(Pedro Domingos)直言:“如果在七八年前問我,亞馬遜在人工智能領域的影響力有多大,我可能會說,‘他們什么也不是’。但他們非常努力?,F(xiàn)在,他們已成為了這個領域的一股力量。”
或許,亞馬遜已經(jīng)是一股重要力量。
Alexa效應
亞馬遜進軍人工智能的旗艦產(chǎn)品是智能音箱Echo,以及基礎性的Alexa語音平臺。這些項目也來自于6頁紙計劃書。這樣的計劃于2011年通過名為“1號運營計劃”的年度規(guī)劃流程提交給貝索斯。其中的參與者之一是自2004年就開始就供職于亞馬遜的阿爾·林賽(Al Lindsay)。當時,他被要求轉(zhuǎn)而負責Prime技術團隊,從事全新的項目。他還記得當時提出的概念:“一種低成本、無所不在的電腦,大腦位于云端,你可以用語音與之互動。你對它說話,它也對你說話?!?/p>
然而當時,開發(fā)這樣的系統(tǒng)聽起來就像科幻小說,產(chǎn)品似乎就像《星際迷航》中的對話計算機。這需要強大的人工智能能力,而當時亞馬遜還沒有掌握這樣的技術。更糟糕的是,有能力開發(fā)此類系統(tǒng)的專家人才很稀缺,愿意在亞馬遜工作的就更加鳳毛麟角。谷歌和Facebook正在爭奪這個領域的頂尖人才。林賽表示:“我們是弱者?!彼F(xiàn)在已晉升為副總裁。
華盛頓大學教授多明格斯表示:“亞馬遜的形象有點不太好。在外界看來,該公司對以研究為導向的人才不夠友好?!眮嗰R遜完全專注于客戶,而企業(yè)文化也崇尚好斗精神,這與學術界和競爭對手的風格完全不同。多明格斯表示:“谷歌會對你很寬容。而在亞馬遜,你需要自己從元件開始組裝電腦。”此外,亞馬遜還有更不好的形象:該公司的創(chuàng)新工作往往被視為企業(yè)機密。
2014年,頂尖的機器學習專家延恩·勒昆(Yann LeCun)在內(nèi)部會議上為亞馬遜的科學家們做了一次講座。在他被邀請參加此次活動以及活動舉行之間,勒昆接受了Facebook的職位邀請,但他還是來到了亞馬遜的活動現(xiàn)場。勒昆回憶,在一個大約可容納600人的禮堂里,他發(fā)表了演講。隨后他被領進一間會議室,不同的小組一個接一個進來,向他提問。然而當勒昆向他們提問時,這些人的反應都很遲鈍。這讓他感覺不好。他最終選擇Facebook的職位部分也是因為,F(xiàn)acebook同意將人工智能團隊的很大一部分工作開源。
由于缺乏內(nèi)部人才,亞馬遜動用強大的財力去收購具有這方面專業(yè)性的公司。利普表示:“在Alexa的發(fā)展早期,我們收購了許多公司?!?011年9月,亞馬遜收購了語音轉(zhuǎn)文本技術公司Yap。該公司擅長于將語音轉(zhuǎn)換為文字。2012年,亞馬遜又將來自英國劍橋的Evi收入麾下。該公司的軟件可以像Siri一樣對語音命令做出響應。2013年1月,亞馬遜再次收購一家語音轉(zhuǎn)文本技術公司,即來自波蘭的Ivona。該公司的技術可以讓Echo獲得交談能力。
然而,亞馬遜的保密文化仍然不利于頂尖人才的加盟。埃里克斯·斯莫拉(Alex Smola)曾是亞馬遜的招聘候選人之一。他是行業(yè)明星,曾供職于雅虎和谷歌。AWS深度學習和人工智能總經(jīng)理馬特·伍德(Matt Wood)表示:“他實際上是深度學習的教父之一?!保ü雀鑼W術搜索上列出了9萬多篇引用斯莫拉成果的論文。)亞馬遜高管甚至不愿向候選人透露他們未來的工作內(nèi)容。斯莫拉拒絕了亞馬遜的邀請,選擇去帶領卡耐基梅隆大學的一所實驗室。
林賽說:“甚至是在我們即將啟動之前,還是有許多阻力。他們會說,‘為什么我要去亞馬遜工作?我對賣別人東西不感興趣?!?/p>
亞馬遜也有自己的辦法。由于該公司從想象中的最終產(chǎn)品去反推,所以藍圖中包括許多尚未發(fā)明出來的功能。這些棘手的問題對雄心勃勃的科學家極具吸引力。語音功能需要一定水平的會話式人工智能,包括“喚醒詞”(嘿,Alexa?。?、監(jiān)聽和解釋命令,給出合理的答案。這一切都不存在。
即使亞馬遜沒有給出任何細節(jié),這個項目也吸引了羅希特·普拉薩德(Rohit Prasad)。普拉薩德是一名受到廣泛認可的語音識別科學家,來自波士頓的技術承包商雷神BBN。(亞馬遜也因此讓他在自己老家組建一支團隊。)他認為,亞馬遜相關專業(yè)能力的缺乏是系統(tǒng)性問題,而不僅僅是小缺陷。他指出:“這里是一片空白。谷歌和微軟開發(fā)語音技術已經(jīng)有幾年時間。在亞馬遜,我們從頭開始去開發(fā),去解決困難的問題?!痹?013年加入之后,他就被分配至Alexa項目。他表示:“設備用硬件來實現(xiàn),但語音技術在很早就已經(jīng)起步?!?/p>
Echo項目中最棘手的部分在于遠距離語音識別。為了解決這個問題,亞馬遜被迫涉足新領域,并推動了機器學習整體的發(fā)展。遠距離語音識別是指在一定距離遠處識別語音,這樣的語音命令可能被淹沒在環(huán)境噪聲中。挑戰(zhàn)之一是,設備不能浪費一丁點時間去思考你究竟說的是什么。它必須把音頻內(nèi)容即時發(fā)送至云端,并迅速獲得答案,給用戶的感覺就是實時對話,而不會出現(xiàn)令人尷尬的冷場。開發(fā)機器學習系統(tǒng),在嘈雜環(huán)境中理解并響應用戶的語音命令,這需要大量數(shù)據(jù),即用戶與Echo互動的大量此類案例。當時并不清楚,亞馬遜要從何處獲得這樣的數(shù)據(jù)。
作為亞馬遜設備和服務副總裁的利普表示,遠距離技術此前已經(jīng)被實現(xiàn),但當時是用在三叉戟潛艇的鼻錐上,研發(fā)耗資達到10億美元。亞馬遜希望將這種技術集成至一個可以放在廚房臺面上的設備中,而價格必須足夠便宜,從而吸引用戶的購買。普拉薩德表示:“在我的團隊中,90%的人都認為這根本做不到。在亞馬遜以外,我們也有技術咨詢委員會。我們沒有告訴他們具體要做什么。但他們總是對我們提起,‘不管做什么,都不要碰遠距離識別技術?!?/p>
然而,普拉薩德的經(jīng)歷給他帶來了信心。他認為這是可實現(xiàn)的。然而,亞馬遜并不具備工業(yè)級系統(tǒng),將機器學習技術應用于產(chǎn)品開發(fā)?!拔覀冇猩贁?shù)科學家正在研究深度學習,但我們?nèi)狈A設施將這些技術應用于生產(chǎn)?!彼f。好消息在于,亞馬遜已經(jīng)掌握了全部模塊:無與倫比的云計算服務,可運行機器學習算法、安裝了大量GPU的數(shù)據(jù)中心,以及熟悉如何移動數(shù)據(jù)的工程師。
他的團隊利用這些模塊開發(fā)了平臺,而除了用于Echo項目之外,這個平臺本身就是寶貴的資產(chǎn)。Alexa高級科學家斯派羅斯·馬特索卡斯(Spyros Matsoukas)表示:“當我們在Echo上實現(xiàn)遠距離語音識別之后,就發(fā)現(xiàn)這里的機會原來有這么大,我們可以將Alexa發(fā)展成為語音服務?!彼饲霸诶咨馚BN與普拉薩德共事,當時的工作包括從事美國國防部高級研究計劃局(DARPA)的項目Hub4,利用廣播新聞節(jié)目和竊聽的電話通話來發(fā)展語音識別和自然語言理解技術,這對Alexa項目來說也很有用。推動Alexa發(fā)展的最直接方式是向第三方開放,讓開發(fā)者開發(fā)基于語音技術的迷你應用,即“技能”,并在Echo平臺上運行。然而,這才只是開始。
在Alexa突破Echo音箱的限制之后,亞馬遜的人工智能文化開始形成合力。公司內(nèi)的不同團隊都開始意識到,Alexa可以為他們各自項目提供有用的語音服務。普拉薩德表示:“盡管我們的單線程所有權模式已經(jīng)很成熟,但仍然可以將所有數(shù)據(jù)和技術融合在一起?!?/p>
最開始,亞馬遜的其他產(chǎn)品開始集成Alexa:通過對Alexa設備的語音命令,你可以訪問亞馬遜音樂、Prime視頻、獲得亞馬遜主站的商品推薦信息,以及使用其他服務。隨后,這項技術開始推廣至亞馬遜的其他業(yè)務。林賽表示:“一旦我們掌握了最基本的語音能力,就可以將其集成至非Alexa產(chǎn)品,例如Fire TV、語音購物、亞馬遜生鮮的Dash按鈕,以及AWS。”
在這個過程中,亞馬遜內(nèi)部的人工智能孤島開始逐漸靠近。
亞馬遜轉(zhuǎn)型的另一大關鍵在于,一旦數(shù)百萬客戶(亞馬遜拒絕透露具體數(shù)字)開始使用Echo和其他Alexa設備,亞馬遜就能掌握豐富的數(shù)據(jù)。這或許是任何會話式設備所能積累的規(guī)模最龐大的數(shù)據(jù)集。對人才招聘來說,這樣的數(shù)據(jù)集也是極具吸引力的資源。突然之間,亞馬遜就成了那些機器學習專家夢寐以求的雇主。去年加入亞馬遜的Alexa機器學習副總裁拉威·簡恩(Ravi Jain)表示:“Alexa對我的最大吸引力之一在于,一旦你在市場上推出了一款設備,那么就掌握了獲得信息反饋的來源。不僅僅是用戶反饋,這些實際數(shù)據(jù)是優(yōu)化所有一切,尤其是底層平臺的基礎?!?/p>
因此,隨著越來越多用戶使用Alexa,亞馬遜獲得的信息不僅能讓系統(tǒng)性能變得更好,也有利于自主機器學習工具和平臺的加速發(fā)展,并成為該公司吸引機器學習科學家的重要武器。
“飛輪”終于開始旋轉(zhuǎn)起來。
更聰明的云計算
亞馬遜從2014年開始面向Prime會員銷售Echo。這一年,斯瓦米·西瓦蘇布拉曼尼(Swami Sivasubramanian)也開始對機器學習發(fā)生興趣。當時,負責AWS數(shù)據(jù)庫和數(shù)據(jù)分析業(yè)務的西瓦蘇布拉曼尼正和全家人回印度旅行。由于時差的關系和小女兒的吵鬧,他不得不在半夜去工作。他嘗試了谷歌的TensorFlow,以及Facebook和學術界支持的機器學習框架Caffe,發(fā)現(xiàn)將這些工具與亞馬遜的云計算服務結(jié)合在一起可以創(chuàng)造巨大的價值。他認為,通過在云端運行機器學習算法,公司可以挖掘新的需求。他表示:“我們希望每月為數(shù)百萬開發(fā)者提供服務。他們中的大部分人并不是麻省理工學院的教授,只是毫無機器學習專業(yè)背景的開發(fā)者?!?/p>
在下一次面見貝索斯時,他帶著一份6頁紙的計劃書。從某種意義上來說,這是將機器學習服務添加至AWS的藍圖。不過西瓦蘇布拉曼尼認為,實際意義還要更加廣泛:這份計劃說明了AWS如何成為機器學習研究核心的宏大愿景。
確實,向成千上萬亞馬遜云計算客戶提供機器學習服務是不可避免的。AWS機器學習經(jīng)理伍德表示:“在首次提出AWS的商業(yè)計劃時,我們就確定了自己的使命,即充分利用只有財力雄厚的公司才能掌握的技術,并盡可能地去推廣。我們在計算、存儲、數(shù)據(jù)分析和數(shù)據(jù)庫等方面已經(jīng)取得成功,我們要用同樣的方法去對待機器學習?!痹谶@個過程中,AWS團隊可以利用亞馬遜其他團隊積累的經(jīng)驗,這使得工作變得略微容易。
伍德表示,AWS的亞馬遜機器學習服務最初于2015年推出,讓類似C-Span的客戶可以建立私有的頭像目錄。此外,Zillow使用該服務估計房價,而Pinterest則將其用于可視化搜索。多家自動駕駛創(chuàng)業(yè)公司也在利用AWS機器學習,通過數(shù)百萬公里的上路測試來優(yōu)化產(chǎn)品。
2016年,AWS又發(fā)布了新的機器學習服務,更直接地利用Alexa的創(chuàng)新。這其中包括文本轉(zhuǎn)語音組件Polly,以及自然語言處理引擎Lex。這些產(chǎn)品幫助AWS的客戶,包括Pinterest、Netflix和多家小型創(chuàng)業(yè)公司開發(fā)屬于自己的迷你Alexa。一款涉及可視化技術的第三方服務Rekognition就利用了此前Prime Photos取得的成果,嘗試在谷歌、Facebook和蘋果的照片產(chǎn)品中植入同樣的深度學習功能。Prime Photos是亞馬遜內(nèi)部一個不太知名的團隊。
這些機器學習服務既是強大的營收來源,也是亞馬遜人工智能“飛輪”的關鍵。各類機構(gòu)和公司,包括美國宇航局(NASA)和美國職業(yè)橄欖球大聯(lián)盟(NFL),都開始付費使用亞馬遜的機器學習服務。如果企業(yè)在AWS平臺內(nèi)開發(fā)關鍵的機器學習工具,那么轉(zhuǎn)移至云計算競爭對手平臺的可能性就會大幅下降。(對不起,谷歌、微軟和IBM。)
以一家規(guī)模數(shù)十億美元的公司Infor為例。該公司為企業(yè)客戶開發(fā)應用。近期,該公司發(fā)布了一款全新的應用Coleman(以NASA數(shù)學家的名字來命名),通過會話式界面幫助客戶實現(xiàn)各種流程的自動化,分析性能并與數(shù)據(jù)交互。該公司沒有從頭開發(fā)自主的會話機器人,而是使用了AWS的Lex技術。Infor副總裁馬西莫·卡珀西亞(Massimo Capoccia)表示:“亞馬遜已經(jīng)在做這些事,所以我們?yōu)槭裁催€要在這上面花時間?我們了解客戶,應該做的是將這些技術應用于客戶?!?/p>
AWS在這個領域的主導地位也使其獲得了相對于競爭對手,尤其是谷歌的優(yōu)勢。谷歌此前曾希望利用機器學習技術的領先優(yōu)勢,在云計算市場趕超AWS。是的,谷歌服務器或許向客戶提供了超快速、針對機器學習優(yōu)化的芯片。但使用AWS的企業(yè)能更方便地與其他也使用AWS的企業(yè)互動。DigitalGlobe首席技術官沃爾特·斯科特(Walter Scott)就解釋了,他的公司為什么臺使用亞馬遜的技術。“這就像是威利·薩頓(Willie Sutton)所說的,搶銀行是因為銀行里有錢。我們使用AWS的機器學習技術是因為我們的客戶也在這個平臺上。”
去年11月,在AWS的re:Invent大會上,亞馬遜發(fā)布了更全面的機器學習工具SageMaker。這是個非常強大,但也很易用的平臺。SageMaker的開發(fā)者之一正是機器學習領域的超級明星埃里克斯·斯莫拉,5年前他曾拒絕亞馬遜的邀請。當斯莫拉決定重回產(chǎn)業(yè)界時,他希望協(xié)助開發(fā)強大的工具,讓所有普通軟件開發(fā)者都可以用上機器學習技術。所以,他加入了他認為能帶來最大影響力的公司。他表示:“亞馬遜非常強,你不會放棄這樣的機會。你可以寫論文,但如果不實際開發(fā),那么沒有人會使用你漂亮的算法?!?/p>
斯莫拉曾對西瓦蘇布拉曼尼說,開發(fā)工具,將機器學習技術傳播給數(shù)百萬人比新發(fā)表一篇論文更重要。當時,他得到了意外之喜。后者表示:“這也不會耽誤你發(fā)表論文!”是的,在允許科學家發(fā)表論文方面,亞馬遜正變得更開放。協(xié)助制定這方面指導原則的斯派羅斯·馬特索卡斯表示:“這給招聘頂尖人才帶來了巨大的幫助,同時也讓外界更好地了解,亞馬遜內(nèi)部正在開展什么樣的研究?!?/p>
目前還無法判斷,AWS的數(shù)百萬用戶是否會用SageMaker,將機器學習集成至產(chǎn)品。然而這樣做的開發(fā)者往往都會投入大筆資金,將亞馬遜定位為機器學習服務提供商。此外,這個平臺非常強大,就連亞馬遜內(nèi)部的人工智能團隊,例如Alexa團隊,也表示愿意成為SageMaker的客戶,使用這些原計劃提供給外部的工具。他們相信,這可以成為項目的基礎,節(jié)約他們的時間,而他們自己可以將更多精力用于高級算法的研究。
盡管只有部分AWS客戶使用SageMaker,但亞馬遜發(fā)現(xiàn),該公司已經(jīng)掌握了關于系統(tǒng)性能的大量數(shù)據(jù)(當然,不包括客戶自己保管的機密數(shù)據(jù))。這將帶來更好的算法、更棒的平臺、更多的客戶?!帮w輪”正在加班加點地運轉(zhuǎn)。
無所不在的人工智能
隨著機器學習帶來顛覆,亞馬遜在人工智能領域的專業(yè)性已經(jīng)滲透至許多團隊,這令貝索斯和他的助手們感到高興。雖然亞馬遜并沒有中心化的人工智能辦公室,但有一個部門專門負責機器學習的推廣和技術支持,而另一些部門則嘗試應用研究成果,推動新科技進入亞馬遜的項目。曾供職于微軟必應團隊和Facebook的拉爾夫·赫布里奇(Ralf Herbrich)與2012年加入亞馬遜,目前負責“核心機器學習集團”。他表示:“重要的是在公司內(nèi)部擁有這樣的社區(qū)?!保ㄍ瑯拥模趫F隊的使命也在6頁紙計劃書中列出,并獲得了貝索斯的批準。)
他的部分職責是培育亞馬遜快速發(fā)展的機器學習文化。由于亞馬遜采取以客戶為中心的策略,即總是嘗試解決問題而不是單純地做研究,因此亞馬遜高管們承認,他們在招聘中總是傾向于那些有興趣開發(fā)產(chǎn)品,而不是追求科技突破的人才。Facebook的勒昆則換了句話去總結(jié)亞馬遜的態(tài)度:“不嘗試成為科技先驅(qū),也可以做得很好?!?/p>
不過,在培訓員工接受人工智能方面,亞馬遜也在效仿Facebook和谷歌。亞馬遜開設了關于機器學習策略的內(nèi)部課程,并組織內(nèi)部專家開展研討會。從2013年開始,亞馬遜每年春季都會在總部舉辦一場內(nèi)部的機器學習大會,這也可以被認為是只有亞馬遜參加的NIPS大會。赫布里奇表示:“在剛剛開始時,亞馬遜的機器學習大會只有幾百人參加,而現(xiàn)在已經(jīng)有數(shù)千人。我們在西雅圖最大的辦公室也沒有這么大的容納能力,因此除了主會場之外,我們還向園區(qū)中的其他6個會議室直播?!眮嗰R遜的一名高管表示,如果規(guī)模變得更大,那么就不應該叫亞馬遜機器學習活動,而直接叫亞馬遜的活動。
赫布里奇的團隊繼續(xù)推動機器學習技術滲透至公司的各類項目。例如,物流部門希望更好地預測,如何根據(jù)顧客的訂單在8種尺寸的包裝盒中做選擇。因此,他們找到赫布里奇的團隊尋求幫助。赫布里奇表示:“這個部門不需要自己的科研團隊,但需要算法,并能方面地使用這些算法?!贝笮l(wèi)·利普則提到了另一個例子,即亞馬遜如何預測有多少顧客可能會購買一款新產(chǎn)品。“我參與消費電子行業(yè)已有30年,在其中25年的時間里,預測是基于人工判斷,會用到表格,一些魔法球和飛鏢。當我們開始在預測過程中運用機器學習技術后,錯誤率大幅下降?!?/p>
不過有些時候,赫布里奇的團隊仍然會將尖端科技用于解決特定問題。亞馬遜生鮮快遞服務亞馬遜Fresh的經(jīng)營已有10年,但仍需要更好的方式來評估生鮮果蔬的質(zhì)量。人工檢測速度太慢,也無法保持標準的一致性。他的柏林團隊開發(fā)了集成大量傳感器的硬件和新算法,以彌補系統(tǒng)無法感知食品的缺陷。“經(jīng)過3年之后,我們已經(jīng)有了原型產(chǎn)品,可以更可靠地判斷食品質(zhì)量?!?/p>
當然,這樣的技術進步可以滲透到整個亞馬遜生態(tài)系統(tǒng)。以近期正式開業(yè)的亞馬遜Go無人店為例。亞馬遜Go技術副總裁迪利普·庫馬爾(Dilip Kumar)表示:“作為AWS的客戶,我們從規(guī)模效應中受益。但AWS也是受益者?!彼赋觯瑏嗰R遜Go開發(fā)了獨特的系統(tǒng),能從數(shù)百個追蹤顧客購物活動的攝像頭傳送數(shù)據(jù)。他團隊的創(chuàng)新影響了名為Kinesis的AWS服務。該服務使客戶可以從多個設備將視頻流媒體傳送至AWS云端,而AWS將對其進行處理、分析,優(yōu)化未來的機器學習算法。
即使一款亞馬遜服務尚未使用機器學習平臺,也可以主動參與到這一過程中。亞馬遜Prime Air無人機快遞服務仍處于原型階段,但也開發(fā)了獨立人工智能能力,因為無人機無法依靠云連接。然而,Prime Air也從人工智能“飛輪”中獲益良多,無論是向公司的其他部門學習經(jīng)驗,還是弄清楚應該使用什么工具。Prime Air副總裁古爾·金姆奇(Gur Kimchi)表示:“我們將這視為餐廳的菜單,所有人都在分享他們有什么樣的美味?!彼A計,他的團隊最終也將拿出自己的美味菜單?!霸赑rime Air,我們學到的經(jīng)驗和解決的問題毫無疑問能吸引亞馬遜其他部門的興趣。”
實際上,這似乎已經(jīng)在發(fā)生。亞馬遜機器人首席科學家貝斯·馬庫斯(Beth Marcus)表示:“如果有人在公司的某個部門,例如Prime Air或亞馬遜Go看到一幅畫面,學到一些東西,開發(fā)一種算法,他們就會與公司內(nèi)的其他人交流。所以,我團隊中有些人就可以借鑒,例如弄清楚商品在物流中心里究竟是怎么移動的?!?/p>
一家以商品為中心的公司能否勝過擁有大量深度學習超級明星的競爭對手?亞馬遜正在努力實現(xiàn)這個目標。艾倫人工智能研究所CEO奧林·艾奇奧尼(Oren Etzioni)表示:“盡管他們還在追趕,但他們的產(chǎn)品發(fā)布令人印象深刻。亞馬遜是世界級的公司,開發(fā)了世界級的人工智能產(chǎn)品?!?/p>
“飛輪”一直在旋轉(zhuǎn),許多6頁紙計劃書的影響尚未體現(xiàn)出來。這或許意味著更多數(shù)據(jù),更多顧客,更優(yōu)秀的平臺,更豐富的人才。
如果你去問Alexa,亞馬遜在人工智能領域做得怎么樣?那么答案或許是貝索斯的大笑。(編譯/昱燁)
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )