原標(biāo)題:汽車玩?zhèn)€《流浪地球》梗,打開了一串關(guān)于AI語音的腦洞
技術(shù)史中有一個(gè)有意思的現(xiàn)象,科技樹往往會(huì)進(jìn)行分支延展。甚至有時(shí)候原本期待的技術(shù)目標(biāo)還沒實(shí)現(xiàn),卻在技術(shù)分支打開了一連串實(shí)用腦洞。
最著名的案例,大概就是在大型計(jì)算機(jī)的主干道上,分叉出了PC和整個(gè)數(shù)字時(shí)代。誰也未曾想到,一片集成電路的出現(xiàn),讓原本的技術(shù)基礎(chǔ)設(shè)施變?yōu)榱藙?chuàng)造出全新紀(jì)元的大眾消費(fèi)品。在AI語音交互這條科技樹上,我們很可能也在見證這樣的轉(zhuǎn)變。比如在追求NLP巴別塔的岔路上,一些強(qiáng)應(yīng)用指向的信息卻在帶來全新的可能。
甚至是一個(gè)蹭熱點(diǎn)的玩法背后,可以看到AI語音這條科技樹點(diǎn)開了一串新的腦洞。
時(shí)間回到春節(jié),爆款電影《流浪地球》帶火了那句“道路千萬條,安全第一條”。隨后全球最大的互聯(lián)網(wǎng)汽車平臺(tái)斑馬網(wǎng)絡(luò)火速推出了配合《流浪地球》的一個(gè)玩法,從中便能管中窺豹,找到關(guān)于AI語言應(yīng)用的新腦洞。
斑馬一聲答,抖音好多6
《流浪地球》熱映后,冷淡萌的MOSS和雪地車中北京第三交通委的提示讓不少人都燃起了中二之心,也想和自己的愛車來一出模仿秀。
雖然很多地圖App也推出了類似的語音包,但仍然缺少最重要的交互體驗(yàn)。
就在2月12日,《流浪地球》上映剛剛一周,斑馬便推出了語音交互彩蛋。用戶只要說出“你好斑馬,開始點(diǎn)火”的語音指令,語音交互系統(tǒng)便會(huì)回復(fù)出那句熟悉“道路千萬條……”。
第一條視頻剛剛在抖音推出半天,就火速獲得了1.5萬個(gè)點(diǎn)贊。隨后又有大量斑馬用戶在抖音上上傳了自己與愛車的對(duì)話視頻。用戶們操著不同方言、在不同車型中重復(fù)著那句“你好斑馬,開始點(diǎn)火”,著實(shí)讓斑馬在抖音上火了一把。
這次借勢(shì)營銷的成功取決于兩點(diǎn)。
第一是斑馬快速完成了語音交互的部署,正好趕上電影熱映的發(fā)酵期,可以喚起用戶的參與興趣。
第二是在斑馬在快速部署的同時(shí)確保了語音識(shí)別的準(zhǔn)確率和用戶體驗(yàn)。讓用戶在不同環(huán)境和條件下都可以參與,沒有因技術(shù)問題而破壞體驗(yàn)。
這個(gè)一句話的交互雖然看起來簡單,但卻可以引發(fā)關(guān)于AI語音,車聯(lián)網(wǎng),甚至語音服務(wù)市場(chǎng)的一連串推理。
車中的耳朵:語音識(shí)別折射出效率紅利
而斑馬在短時(shí)間內(nèi)完成精準(zhǔn)語音指令部署這件事的重要性,遠(yuǎn)遠(yuǎn)不止一次借勢(shì)營銷這么簡單。
首先我們要知道,車載環(huán)境是一個(gè)非常特殊卻又普遍的環(huán)境。一方面車內(nèi)空間有較強(qiáng)的噪音,在收音方面相對(duì)困難;另一方面車內(nèi)空間應(yīng)用廣泛,用戶會(huì)使用各種方言、口音與斑馬進(jìn)行交互。
可以說在斑馬點(diǎn)火的命令背后,隱藏著語音交互進(jìn)入高效率與普惠性的特征。
應(yīng)對(duì)車載環(huán)境下的語音指令喚醒,斑馬要解決口音、方言、噪聲等場(chǎng)景下的精準(zhǔn)可用狀態(tài)。為達(dá)成這個(gè)目標(biāo),喚醒背后必須具備三個(gè)方面的技術(shù)準(zhǔn)備。
1、為方言和環(huán)境噪聲識(shí)別,進(jìn)行大量端到端的訓(xùn)練。想實(shí)現(xiàn)這一點(diǎn),不僅需要大量的方言語料資料,同樣需要足夠的云端算力支持。
2、麥克風(fēng)序列的有效搭建和硬件準(zhǔn)備。汽車空間內(nèi)復(fù)雜的噪音來源一直給語音交互的收音造成了巨大的困難,而斑馬選擇了前置解決方案,在汽車中提前搭建好麥克風(fēng)陣列來為整個(gè)語音交互流程提升效率。
3、語音采集、特征提取、聲學(xué)樣本的高可用模型搭建,基于標(biāo)準(zhǔn)化解碼的語音入口和端到端部署。想在短時(shí)間內(nèi)完成應(yīng)用級(jí)別的語音指令訓(xùn)練,需要熟練的模型建立流程和部署能力。
三者的聚合,讓語音交互正在抵達(dá)標(biāo)準(zhǔn)化周期,于是斑馬才能快速準(zhǔn)確地更新應(yīng)用,跟上熱點(diǎn)。
而在算法應(yīng)用性的背后,其實(shí)我們還可以看到端云耦合在高效工作著。
云上的短跑:智能語音交互駛?cè)朊艚蓍_發(fā)賽道
大家都知道,我們平時(shí)應(yīng)用的各種軟件也會(huì)保持一個(gè)周期性的更新狀態(tài)。通常是一周或者一個(gè)月更新一次版本,帶來一系列新功能。
如果在車中依舊保持這樣的軟件更新頻率,顯然是不足夠的。對(duì)于車聯(lián)網(wǎng)這種剛剛進(jìn)入市場(chǎng)產(chǎn)品來說,像這次《流浪地球》一樣,不斷快速迭代,為用戶帶來更多驚喜的細(xì)節(jié),會(huì)更有利于市場(chǎng)的覆蓋。
想要實(shí)現(xiàn)更敏捷的開發(fā)周期,需要的技術(shù)關(guān)鍵點(diǎn)在于端云的高度一體化,即云端計(jì)算性能和終端車聯(lián)網(wǎng)架構(gòu)在設(shè)計(jì)和能力上實(shí)現(xiàn)一致性。
斑馬自身的車聯(lián)網(wǎng)架構(gòu)也具有高度的統(tǒng)一性。不僅在開發(fā)上更加高效,同時(shí)也減少了技術(shù)與不同終端層層適配與測(cè)試的時(shí)間成本。于是才能實(shí)現(xiàn)用戶無需進(jìn)行版本更新,達(dá)成新玩法的零秒上線,讓不同終端的用戶都能享受同樣的技術(shù)更新效率。
端云耦合加上語音的便捷性,正在用一種新的技術(shù)邏輯將車聯(lián)網(wǎng)拖入新的敏捷開發(fā)周期。車聯(lián)網(wǎng)體驗(yàn)中完全可以達(dá)成快速準(zhǔn)確的智能服務(wù)持續(xù)觸發(fā),甚至允許用戶進(jìn)行與系統(tǒng)的內(nèi)容交互。
車聯(lián)網(wǎng)的腦洞:語音激變讓巴別塔成為無限可能
繼續(xù)向著更底層的技術(shù)推理,我們會(huì)發(fā)現(xiàn)一個(gè)來自流浪地球的問候,隱藏著AI語音技術(shù)的另一種廣義應(yīng)用可能性。
AI語音的第一種可能當(dāng)然是在巴別塔上,解讀擁有幾千年歷史的各種語言,讓人類真正實(shí)現(xiàn)無障礙的溝通,然而這并不容易。
但在斑馬的案例中,我們可以發(fā)現(xiàn)在車聯(lián)網(wǎng)的特定交互場(chǎng)景里,通過敏捷的AI應(yīng)用能力交付??梢詭Ыo用戶實(shí)時(shí)化,多功能,甚至指向娛樂綜合體驗(yàn)的語音能力。在這種能力的催生之下,未來用戶可以依托駕駛場(chǎng)景自主生產(chǎn)內(nèi)容,實(shí)現(xiàn)共創(chuàng)。
端云一體,算法標(biāo)準(zhǔn)化,以及場(chǎng)景的硬件統(tǒng)一性,正在催化輕量級(jí)的語音交互煥發(fā)廣泛的應(yīng)用可能。
或許就在不久的未來,個(gè)人用戶可以定制原創(chuàng)交互語音。不僅是喚醒、AIoT等功能,例如用戶可以將途中的所見所想上傳為一組語音問答,并與其它同系統(tǒng)車主分享,為車主與車、車主與車主打造全新的共創(chuàng)模式。車聯(lián)網(wǎng)與萬事萬物的連接,都可以因此變得更加個(gè)性化。
尤其當(dāng)公共服務(wù)也開始引入語音交互技術(shù)時(shí),這種能實(shí)時(shí)更新的車聯(lián)網(wǎng)語音交互會(huì)擁有更高的開墾價(jià)值。達(dá)摩院2019十大技術(shù)趨勢(shì)認(rèn)為“隨著端云一體語音交互模組的標(biāo)準(zhǔn)化、低成本化,會(huì)說話的公共設(shè)施會(huì)越來越多,未來每一個(gè)空間都至少會(huì)有一個(gè)可以進(jìn)行語音交互的觸點(diǎn),隨著智能語音技術(shù)的提升,移動(dòng)設(shè)備上的實(shí)時(shí)語音生成與真人語音可能將無法區(qū)分,甚至在一些特定對(duì)話中可以通過圖靈測(cè)試。針對(duì)這一領(lǐng)域的規(guī)則甚至法律會(huì)逐步建立,從而引導(dǎo)行業(yè)走向規(guī)范化?!?/p>
而公共設(shè)施同樣面對(duì)著和車聯(lián)網(wǎng)相似的情況——應(yīng)用情景復(fù)雜、應(yīng)用者廣泛、所處場(chǎng)景嘈雜。這時(shí)車聯(lián)網(wǎng)上累積的收音技術(shù)、不同方言的辨識(shí)技術(shù)以及敏捷更新能力,都能為之所用。
從AI產(chǎn)業(yè)的全局來看,或許語言不一定只有巴別塔一條路。輕應(yīng)用、快速開發(fā)、多效循環(huán)的語音能力應(yīng)用,打開更高可行性和商業(yè)化潛力應(yīng)用AI路線。從網(wǎng)聯(lián)汽車,到社會(huì)化服務(wù)硬件和新的家庭場(chǎng)景,AI的可能性正在打開。
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個(gè)大計(jì)劃瞄準(zhǔn)AI機(jī)器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費(fèi)引熱議
- 消息稱塔塔集團(tuán)將收購和碩印度iPhone代工廠60%股份 并接管日常運(yùn)營
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達(dá)新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場(chǎng)關(guān)注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號(hào)發(fā)布,意外泄露引發(fā)關(guān)注
- 無人機(jī)“黑科技”亮相航展:全球首臺(tái)低空重力測(cè)量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機(jī)器人合作
- 賽力斯觸及漲停,汽車整車股盤初強(qiáng)勢(shì)拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。