阿里的NASA為什么會(huì)從一款人工智能語音助手啟航

阿里的NASA為什么會(huì)從一款人工智能語音助手啟航

沒人能想到,阿里高舉高打的NASA計(jì)劃,首款落地的產(chǎn)品,卻是一款智能音箱,似乎太低調(diào)太樸實(shí)了。這個(gè)看似不夠酷炫也不夠宏偉的開端,如何支撐起阿里NASA計(jì)劃的雄心壯志?

音箱外殼,AI之心

如果把這款新發(fā)布的天貓精靈X1,僅僅看作一款智能音箱,那你小看了它,也低估了阿里的野心。

這款由阿里人工智能實(shí)驗(yàn)室(A.I. Labs)發(fā)布的智能產(chǎn)品,在音箱外殼包裹的其實(shí)是基于人工智能的語音助手,從這個(gè)角度,才能理解它為何能承擔(dān)阿里NASA計(jì)劃開局者的角色。

語言,作為智慧生物最為主要的交流方式,和圖像、行動(dòng)力一起并列為公認(rèn)的三大交互方式。

而在三種交互方式中,一切需要闡釋的復(fù)雜事物,對(duì)其記載、描述、傳播等,都離不開語言,現(xiàn)在,現(xiàn)在你們讀著的這篇文章,就是我用人類語言寫就的,語言是人類文明的產(chǎn)物,也是唯一只有人類才掌握的交互方式。

當(dāng)基于人工智能的機(jī)器走入人類生活當(dāng)中,兩大主體都在不斷加深了解。對(duì)于機(jī)器來說,通過不同的方式來理解人,難度是不一樣的。

智能手機(jī)時(shí)代可以視為人工智能1.0時(shí)代的產(chǎn)物,那時(shí)候的機(jī)器是低智能的,他和你的交流方式就是把所有的選項(xiàng)都呈現(xiàn)在屏幕上讓你去選擇,一步一步的指導(dǎo)它的行為,這是“人的智能”,手機(jī)是被動(dòng)的執(zhí)行者的角色。

阿里的NASA為什么會(huì)從一款人工智能語音助手啟航

但文字輸入顯然不是最好的方式。過去,智能手機(jī)雖然取代了功能機(jī),但是老人機(jī)仍然有極為龐大的市場,為什么呢?因?yàn)椋欣夏耆蔚谝徊粫?huì)用打字,第二操作不了復(fù)雜的app,這說明過去文字輸入為主,以app為主要形態(tài)的智能手機(jī),其實(shí)并不夠任性。而語音的使用則毫無門檻。

僅僅像個(gè)木偶一樣簡單粗暴的執(zhí)行命令還是不夠的,機(jī)器需要具有更高的智能去理解人的指令, 按照阿里人工智能實(shí)驗(yàn)人負(fù)責(zé)人、淘寶首任產(chǎn)品經(jīng)理淺雪的介紹,天貓精靈有三大AI能力,分別是理解能力,執(zhí)行能力,以及進(jìn)化能力。

其次,由于語音交流相比視覺對(duì)人的“內(nèi)存”占用更少,可以把人從4英寸的屏幕上解放出來,同時(shí)去做更多的事,語音助手可以提供更多的服務(wù),誕生更大的商業(yè)機(jī)會(huì),這也是亞馬遜的Echo成功帶來的啟示。

目前天貓精靈x1已經(jīng)具備音樂音頻內(nèi)容的播放、聽故事、講笑話、查運(yùn)勢、玩游戲、查天氣、找手機(jī)、問百科、設(shè)鬧鐘/定時(shí)器、查食物熱量、充話費(fèi)、查快遞、查價(jià)格、天貓魔盒控制、天貓超市購物、智能家電操控等功能。作為一個(gè)具備進(jìn)化能力的AI設(shè)備,隨著開發(fā)者的入駐,天貓精靈X1能夠?qū)崿F(xiàn)的功能還將快速增加。

而且,作為女性的淺雪相當(dāng)細(xì)膩貼心,考慮到這款智能音箱的主要應(yīng)用場景是家庭,有時(shí)候可能有不少其他場景的噪音,因此,開發(fā)人員在廚房,客廳,臥室,書房等環(huán)境里面,對(duì)玻璃,木材,混凝土,金屬,石材,等各種材質(zhì)和環(huán)境進(jìn)行了上千次實(shí)驗(yàn),讓天貓精靈x1能夠適應(yīng)在家庭環(huán)境噪音下進(jìn)行喚醒,并且具備一定的學(xué)習(xí)功能,可以根據(jù)環(huán)境噪音進(jìn)行學(xué)習(xí)和進(jìn)化,適應(yīng)不同家庭環(huán)境噪音,經(jīng)過7天左右優(yōu)化,會(huì)更加適應(yīng)所在家庭環(huán)境。

第三,語音助手具有高度可擴(kuò)展性,在手機(jī)時(shí)代,即使是安卓這樣的開放操作系統(tǒng)的擴(kuò)展性也只局限于手機(jī)這一種產(chǎn)品,但語音助手理論上可以應(yīng)用于所有產(chǎn)品,無論是有屏幕的還是沒有屏幕的,可移動(dòng)的還是不可移動(dòng)的設(shè)備都可以植入語音助手,并且成本遠(yuǎn)低于手機(jī)操作系統(tǒng),使平臺(tái)價(jià)值可以最大化的體現(xiàn)。

從同期發(fā)布的阿里精靈開放平臺(tái)來看,這確實(shí)也是阿里正在走的一條道路。在NASA計(jì)劃之后以這樣一款產(chǎn)品來啟航,是一個(gè)相當(dāng)巧妙的切口。

對(duì)標(biāo)亞馬遜Echo

從目前透露的信息看,天貓精靈最有可能成為中國版的Echo。 智能音箱的熱潮,開局者是誰大家忘記了,但目前做得最成功的,就是亞馬遜的Echo。

Echo面市后,不到兩周的時(shí)間內(nèi)預(yù)訂量就達(dá)到了一百萬,作為對(duì)比,iPhone用了70天才達(dá)到同樣的訂單數(shù)。

今年6月第三方機(jī)構(gòu)CIRP的統(tǒng)計(jì)顯示,上線一年,其銷量已經(jīng)超過300萬臺(tái)。銷量驚人,也被貝索斯提升到了集團(tuán)重點(diǎn)戰(zhàn)略產(chǎn)品。

說天貓精靈最有可能成為中國版Echo,這個(gè)判斷是基于基因、優(yōu)勢、資源、路徑做出的。

第一,高性價(jià)比,快速落地。

為了求增長賠錢多年的亞馬遜做Echo,不是為了撈一般就走,阿里推出天貓精靈也不是為了掙快錢。

從定價(jià)策略上,目前天貓精靈和同業(yè)相比,性價(jià)比是最高的。蘋果的HomePod是349美元,Echo是190美元,而天貓精靈xi的定位只有499元。不妨再和國內(nèi)友商對(duì)比一下,5月上市的聯(lián)想智能音箱899元。

不差錢的阿里,通過高性價(jià)比,可以后來者居上。根據(jù)市場調(diào)研機(jī)構(gòu)StrategyAnalytics的統(tǒng)計(jì),2016年智能音箱全球出貨量590萬臺(tái),并將在2022年增長10倍,市場價(jià)值達(dá)到55億美元。而Gartner 預(yù)測,到2018年30%的人機(jī)交互通過自然語言完成,可以說,在智能音箱爆發(fā)前夜,阿里通過高性價(jià)比以及高品質(zhì)產(chǎn)品,精準(zhǔn)卡位。

阿里的NASA為什么會(huì)從一款人工智能語音助手啟航

二,技術(shù)儲(chǔ)備要強(qiáng),產(chǎn)品體驗(yàn)要好。

為何過去折戟在智能手機(jī)領(lǐng)域的亞馬遜,做Echo虐殺了蘋果和谷歌?

除了高性價(jià)比外,還有產(chǎn)品細(xì)節(jié)。過去,智能音箱的反應(yīng)時(shí)間通常有兩到三秒,但貝索斯提出了苛刻的要求,“用戶等待時(shí)間不超過1秒鐘?!?/p>

反應(yīng)速度背后,其實(shí)是技術(shù)積累。阿里在語音識(shí)別領(lǐng)域也在迅速進(jìn)步,在美國國家標(biāo)準(zhǔn)署2016年舉辦的全球說話人識(shí)別競賽(NIST SRE2016),阿里巴巴以O(shè)penSesame(芝麻開門)為隊(duì)名,采用了基于深度學(xué)習(xí)網(wǎng)絡(luò)的特征提取,借助距離測度學(xué)習(xí)來提高數(shù)據(jù)的泛法能力,開創(chuàng)性提出利用對(duì)稱性支持向量機(jī)器來提高系統(tǒng)性能,在近兩百多支參賽隊(duì)伍中,阿里最后的系統(tǒng)性能在大中華區(qū)聲紋識(shí)別性能排第一,美國賽區(qū)第二,同時(shí)我們遞交了4個(gè)相關(guān)的專利。

而阿里在啟動(dòng)了NASA計(jì)劃之后,把人工智能提升到集團(tuán)戰(zhàn)略的高度,對(duì)技術(shù)的投入有增無減。

第三,離技術(shù)不遠(yuǎn),離商業(yè)場景最近。

阿里和亞馬遜,都是電商起步,目前阿里的業(yè)務(wù)對(duì)商業(yè)場景的理解最為深入,如果用戶希望智能音箱真的能夠幫助你完成一些工作,為其提供商業(yè)服務(wù),那么阿里的勝算最大。這也亞馬遜成功的秘密。

人工智能能否登頂,取決于兩大因素,第一技術(shù),第二場景。在技術(shù)上和谷歌相比,并沒有絕對(duì)優(yōu)勢的亞馬遜做Echo能成功,說明在語音助手這個(gè)領(lǐng)域,相比于技術(shù),可能場景的權(quán)重更大,對(duì)后段商業(yè)和服務(wù)生態(tài)的整合能力決定了競爭的高度,而在語音技術(shù)方面的積累只是一個(gè)下限,對(duì)大玩家來說并不成為門檻。

第四,對(duì)外開放,協(xié)同多方力量,打造高協(xié)同性的生態(tài)平臺(tái)。

亞馬遜Echo的成功,還在于其搭建了一個(gè)開放生態(tài),為產(chǎn)品贏來源源不斷的第三方服務(wù)。

而天貓精靈X1內(nèi)置了第一代中文人機(jī)交流系統(tǒng)AliGenie,當(dāng)天,阿里人工智能實(shí)驗(yàn)室還同時(shí)發(fā)布了面向開發(fā)者和硬件廠商的AliGenie開發(fā)者平臺(tái)。

AliGenie的開放包括技術(shù)開放和生態(tài)開放兩個(gè)層次。

在能力方面,對(duì)外開放了深度學(xué)習(xí) 、自然語言處理 、搜索/推薦算法 、知識(shí)表示及推理問答系統(tǒng)等核心能力,免費(fèi)開放給開發(fā)者和硬件廠商,無需從頭搭建AI語音系統(tǒng),節(jié)省在研發(fā)上的巨量投入,使開發(fā)者能夠更好的為用戶提供服務(wù)

而在業(yè)務(wù)場景上,AliGenie未來還會(huì)搭建豐富的業(yè)務(wù)形態(tài),比如兒童領(lǐng)域、酒店領(lǐng)域、家庭場景下、TO B其他商業(yè)場景、線下零售場景、與其他顯示設(shè)備結(jié)合的場景等等。

可以說,上述四點(diǎn),就是決定了天貓精靈x1有望成為中國版Echo的關(guān)鍵。

NASA的計(jì)劃宏偉壯觀,那是阿里的遠(yuǎn)景。但路總要一步步走,比起來鮮花著錦卻無法落地的空頭概念,還是一個(gè)所見所得的落地產(chǎn)品更為可信親切。

一個(gè)小小的智能音箱,卻是阿里NASA計(jì)劃的關(guān)鍵一步。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2017-07-06
阿里的NASA為什么會(huì)從一款人工智能語音助手啟航
沒人能想到,阿里高舉高打的NASA計(jì)劃,首款落地的產(chǎn)品,卻是一款智能音箱,似乎太低調(diào)太樸實(shí)了。

長按掃碼 閱讀全文