探路人與解題者:騰訊數(shù)字生態(tài)大會(huì)上AI語(yǔ)音助手+X的無(wú)限可能

日本聲優(yōu)(配音演員)花澤香菜官宣結(jié)婚的那一天,不少宅男都直呼“爺青結(jié)”(爺?shù)那啻航Y(jié)束了)?;ヂ?lián)網(wǎng)上被奉為“大眾情人”的男神/女神,哪個(gè)不是聲形并茂的存在?

“顏控”如人類的情感就是如此不講道理。所以盡管科技廠商們都努力將AI助手的聲音“打扮”得親切可人,但距離真正進(jìn)入用戶心扉還遠(yuǎn)遠(yuǎn)不夠。尤其是對(duì)于智能家居、養(yǎng)老照護(hù)等重要語(yǔ)音落地場(chǎng)景來(lái)說(shuō),情感色彩的缺位就更加顯現(xiàn)出不足了。

而近期,許多能說(shuō)會(huì)道的AI人物,也逐步進(jìn)入我們的視野。比如《時(shí)代周刊》刊發(fā)了一張馬丁·路德·金的“肖像照片”,“他”還會(huì)在沉浸式展覽《游行》中,重現(xiàn)馬丁·路德·金的經(jīng)典演講《我有一個(gè)夢(mèng)想》。

在許多崗位上,AI語(yǔ)音助手也開(kāi)始被賦予真人一樣的外貌,能夠通過(guò)眼神、表情、動(dòng)作進(jìn)行自然流暢的表達(dá)。比如疫情期間許多辦公樓里,都引入了數(shù)字人來(lái)執(zhí)行測(cè)溫任務(wù),讓這一行為更具溫情,不再是機(jī)器語(yǔ)音例行公事一般冷冰冰的提醒。

騰訊全球數(shù)字生態(tài)大會(huì)上,一位來(lái)自《鏡雙城》動(dòng)畫(huà)番劇里的女主角那笙,就跟現(xiàn)場(chǎng)觀眾打起了招呼——“原本我只能出現(xiàn)在動(dòng)漫世界里,現(xiàn)在的我能夠讀懂你、聽(tīng)懂你,還有自己的小個(gè)性、小脾氣哦~”

一副嬌俏少女的模樣,讓這樣的“女神”成為自己的導(dǎo)游、助理、客服、老師等等,聽(tīng)起來(lái)就十分令人神往,是騰訊云小微和AI lab共同打造的數(shù)字虛擬人,也成為騰訊云小微“數(shù)字助手”解決方案的“顏值擔(dān)當(dāng)”。

當(dāng)然,讓人類與數(shù)字助理自然相處,其中既受限于理性的技術(shù)發(fā)展周期因素,也會(huì)受到人類虛無(wú)縹緲的情感左右。那么作為一種另辟蹊徑的實(shí)現(xiàn)方式,騰訊云小微所打造的形象化AI助手,其想象空間到底來(lái)自哪里?又將把AI語(yǔ)音技術(shù)引向怎樣的下一站?

“顏控”企業(yè)的出現(xiàn),折射出哪些現(xiàn)實(shí)需求

智能語(yǔ)音助手早已在許多商業(yè)場(chǎng)景中落地,比如撥打客服電話時(shí)的語(yǔ)音服務(wù),亦或是會(huì)為兒童朗讀繪本的智能音箱。那為什么大家突然又開(kāi)始“看臉”了呢?

其實(shí),從智能語(yǔ)音助手中廣泛存在的手機(jī)/音箱等產(chǎn)品的交互尷尬,就可以解開(kāi)這個(gè)問(wèn)題。

首先是打開(kāi)頻率。許多主打智能語(yǔ)音功能的硬件(比如音箱),只有在剛拿到手的新鮮勁里,或者是網(wǎng)絡(luò)上又出現(xiàn)了“調(diào)戲”語(yǔ)音助手的段子,才會(huì)想起來(lái)跟它們對(duì)話。背后的關(guān)鍵原因是語(yǔ)音助理所能承載的工具性需求,大部分都已經(jīng)被智能手機(jī)等設(shè)備完成的很好了,只能作為“備胎”被偶爾提起。

二是情感聯(lián)系。語(yǔ)音交互是即忘形式的,這就決定了它無(wú)法承載更具私密性、情感性的交互活動(dòng)。我們會(huì)讓語(yǔ)音助手幫我們打開(kāi)電視、啟動(dòng)掃地機(jī)器人,但跟它進(jìn)行充滿情緒色彩、大段大段地閑聊?估計(jì)大部分用戶都會(huì)產(chǎn)生抵觸心理。就算自己不介意,被其他人撞到抱著一個(gè)音箱喃喃自語(yǔ)也很難不引起誤會(huì)不是……

三是技術(shù)瓶頸。伴隨著NLP技術(shù)的進(jìn)步,語(yǔ)音助手已經(jīng)能很不錯(cuò)地完成聲紋識(shí)別、多輪對(duì)話、語(yǔ)義理解等復(fù)雜任務(wù)了,但距離自然交流顯然還有一定的差距。動(dòng)不動(dòng)就“我聽(tīng)不懂”“難倒我了”,娛樂(lè)消費(fèi)產(chǎn)品會(huì)被棄之高閣,萬(wàn)一企業(yè)不小心聘用了這種“智障型”AI助理為消費(fèi)者提供服務(wù),難以達(dá)到普通用戶期盼的準(zhǔn)確無(wú)誤、近似真人的交互效果,帶來(lái)的就可能是訂單的損失和品牌口碑的下跌。

針對(duì)這些AI語(yǔ)音助手在產(chǎn)業(yè)端、市場(chǎng)端的落地尷尬,存不存在可能的解決之道呢?從“工具人”轉(zhuǎn)變?yōu)椤皵?shù)字人”,讓用戶從“聲控”轉(zhuǎn)變?yōu)椤邦伩亍?,就是騰訊數(shù)字生態(tài)大會(huì)上給出的一個(gè)十分吸睛的解題思路。

讓用戶跟AI多聊兩句,數(shù)字助理需要具備哪些超能力?

“如果那笙哪里做的不對(duì),主人不要嫌棄我我有在努力呢”——試問(wèn)聽(tīng)到這種對(duì)話,你還會(huì)吐槽語(yǔ)音助手偶爾出現(xiàn)的小失誤,甚至還有點(diǎn)想反思自己是不是過(guò)于吹毛求疵了呢?

沿著這個(gè)思路,我們可以看到形象化之后,騰訊云小微在數(shù)字助手領(lǐng)域都打造出了哪些超能力:

1.語(yǔ)音+視覺(jué)交互,借助騰訊系海量IP打造出各種形象、生動(dòng)、貼近現(xiàn)實(shí)需求的形象,提升交互頻率,從而真正有效地減輕人類工作負(fù)擔(dān)。比如疫情期間,就有老師表示希望有分身到每個(gè)學(xué)生身邊指導(dǎo)他們,而數(shù)字助理的擬人化交互恰好可以完成這一任務(wù);

2.豐富的知識(shí)體系,利用知識(shí)圖譜與深度學(xué)習(xí)技術(shù),數(shù)字助手可以快速調(diào)用海量信息,完成問(wèn)答、資訊等服務(wù),再通過(guò)擬人化的形象輸出給用戶,人們會(huì)在服務(wù)過(guò)程中對(duì)技術(shù)產(chǎn)生一定的包容和理解。為故宮打造的清朝內(nèi)閣大學(xué)士“福大人”,就擔(dān)任起了知識(shí)淵博的游覽助手;

3.個(gè)性化情感關(guān)系:智能語(yǔ)音助手等新鮮事物的核心受眾群以年輕人為主,而隨著國(guó)漫崛起,年輕人對(duì)標(biāo)新立異的虛擬形象更感興趣。而對(duì)于渴求增長(zhǎng)與變化的企業(yè)來(lái)說(shuō),與其按部就班地在聲音世界里打轉(zhuǎn), 尤其是在線上化業(yè)務(wù)增多,用戶的交互頻率和方式增長(zhǎng)的情況下,年輕市場(chǎng)也需要新的服務(wù)形態(tài)來(lái)被重新激活;

此外,伴隨著產(chǎn)業(yè)數(shù)字化程度的推進(jìn),企業(yè)想要在數(shù)據(jù)洪潮中傳達(dá)出具象的品牌形象,新的視覺(jué)載體是不可或缺的。消費(fèi)者的行為和決策鏈路也在數(shù)字世界中變得更加隱蔽、復(fù)雜,如何保持黏性,建立用戶與品牌的情感連接也成為應(yīng)有之義……

上述種種,或許都可以通過(guò)一個(gè)人格化、陪伴式的“數(shù)字助理”,來(lái)觸發(fā)全新的可能性。

AI語(yǔ)音的下一站,開(kāi)啟人機(jī)交互的“寧?kù)o時(shí)代”

技術(shù)領(lǐng)域有個(gè)名詞叫“寧?kù)o技術(shù)”,簡(jiǎn)單來(lái)說(shuō)就是通過(guò)對(duì)用戶的情景感知能力,最小化用戶的注意力,讓人機(jī)交互變得隱匿和不可見(jiàn)(invisible)。

就像進(jìn)入電梯間之后按下樓層鍵一樣,已經(jīng)成為現(xiàn)代人潛移默化的慣性動(dòng)作,誰(shuí)還記得曾經(jīng)按電梯也是一種職業(yè),甚至需要考證呢。

而人機(jī)之間的語(yǔ)音交互,也正在從“好像有點(diǎn)尷尬”進(jìn)入到自然而然地喚起階段。接下來(lái),就是要讓這種已經(jīng)在一些場(chǎng)景(比如客廳)成為習(xí)慣的事,隱匿到更大的社會(huì)空間之中,讓AI助手能夠在更廣闊的商業(yè)世界里與人們自然順暢地進(jìn)行交流。

這既是技術(shù)發(fā)展的必然趨勢(shì),也離不開(kāi)科技企業(yè)們的不斷努力。以騰訊云小微AI語(yǔ)音助手為例,就已經(jīng)在出行、文旅、教育等等領(lǐng)域開(kāi)始落地。

之所以能達(dá)成這一成就,首先來(lái)自于騰訊在語(yǔ)音技術(shù)上核心技術(shù)鏈的深耕。

通過(guò)ASR、NLP、TTS等技術(shù),對(duì)聲音進(jìn)行降噪、文本轉(zhuǎn)化、語(yǔ)義理解,這一才能讓AI助手能夠在復(fù)雜環(huán)境中依然能夠識(shí)別不同的方言或者口音。

想要達(dá)成和真人一樣的交流,機(jī)器還需要聽(tīng)得懂,才能避免“所答非所問(wèn)”的情況,來(lái)真正幫助用戶解決問(wèn)題,成為一個(gè)業(yè)務(wù)能力強(qiáng)大的“數(shù)字員工”。因此騰訊除了在語(yǔ)義技術(shù)方面發(fā)力之外,還十分重視知識(shí)圖譜的建構(gòu)。等于為AI搭建了一個(gè)先驗(yàn)的知識(shí)庫(kù),讓它能夠及時(shí)調(diào)動(dòng)龐大的知識(shí)儲(chǔ)備,更好地理解用戶言語(yǔ)的意圖,來(lái)顯示出“智商很高”的樣子。

除此之外,數(shù)字員工的“情商”也很重要。利用利用個(gè)性化、沉浸式的TTS語(yǔ)音合成技術(shù),再結(jié)合虛擬人技術(shù),將對(duì)話內(nèi)容以多模態(tài)、多層次的形式表達(dá)出來(lái),就能很好地通過(guò)表情、動(dòng)作傳達(dá)出語(yǔ)言的情緒,讓用戶更加可感、可知。

而這一整個(gè)技術(shù)體系要真正落地,一方面需要打通數(shù)據(jù)閉環(huán),從而訓(xùn)練出更可靠、精準(zhǔn)的對(duì)話模型。因此騰訊云小微團(tuán)隊(duì)也建構(gòu)了一套系統(tǒng)工程。從沒(méi)有數(shù)據(jù)怎么辦開(kāi)始,系統(tǒng)地鉆研數(shù)據(jù)如何打通,推動(dòng)數(shù)據(jù)共享,到缺失數(shù)據(jù)的采集,系統(tǒng)化地為客戶規(guī)劃了基于數(shù)據(jù)智能化目標(biāo)的數(shù)據(jù)采集和信息化建設(shè)方案。

另外,數(shù)字助理的最終目標(biāo)不是“賣萌”,而是幫助企業(yè)提質(zhì)增效,推動(dòng)數(shù)字生產(chǎn)力變革,達(dá)成體驗(yàn)/服務(wù)到業(yè)績(jī)/留存的真實(shí)轉(zhuǎn)化。因此要具備統(tǒng)籌全局、貫穿業(yè)務(wù)周期的能力。所以也需要對(duì)企業(yè)的全業(yè)務(wù)場(chǎng)景進(jìn)行覆蓋,來(lái)保證無(wú)論是簡(jiǎn)單的問(wèn)題咨詢,還是復(fù)雜的業(yè)務(wù)流程辦理,抑或只是想跟數(shù)字員工閑聊談心,背后的語(yǔ)音技術(shù)解決方案都能夠通過(guò)正確響應(yīng)來(lái)滿足用戶所需、企業(yè)所想。在這一點(diǎn)上,騰訊云小微也通過(guò)流式語(yǔ)義+語(yǔ)義VAD技術(shù),讓AI在極低時(shí)延的情況下也能邊聽(tīng)邊思考。

也正是“數(shù)據(jù)+業(yè)務(wù)”的雙重閉環(huán),形成了數(shù)字助理進(jìn)入產(chǎn)業(yè)規(guī)?;哪芰ψV系,得以為企業(yè)智能化轉(zhuǎn)型全程護(hù)航。

AI語(yǔ)音助手+X=無(wú)限可能

毫無(wú)疑問(wèn),數(shù)字化、智能化潮流的全面噴發(fā),未來(lái)會(huì)有更多的數(shù)字助理、AI助手被納入到人類的工作環(huán)境當(dāng)中。對(duì)于廣大普通人來(lái)說(shuō),數(shù)字助理的能力蝶變真的有現(xiàn)實(shí)意義嗎?

答案是肯定的??梢灶A(yù)期的是,至少有幾種社會(huì)生活會(huì)被革新:

一是文旅導(dǎo)游。一場(chǎng)疫情讓旅游行業(yè)元?dú)獯髠酪叩摹俺志脩?zhàn)”也決定了限人限流會(huì)成為一段時(shí)期依賴的常態(tài),如何在這樣的情況下依然保持甚至超越原有的服務(wù)質(zhì)量,將基礎(chǔ)講解工作交給數(shù)字員工,就是一個(gè)不錯(cuò)的選擇。未來(lái)走進(jìn)景區(qū),打開(kāi)手機(jī),也許就是一個(gè)數(shù)字導(dǎo)游引領(lǐng)我們游覽,實(shí)時(shí)講解,互動(dòng)答疑;

二是家居場(chǎng)景。你的家里有多少智能音箱在等著落灰?年邁的父母呼喚語(yǔ)音助手的名字時(shí)是否還是會(huì)感到一絲尷尬?而一旦語(yǔ)音助手有了數(shù)字形象,被賦予擬人化色彩之后,一切可能都會(huì)變得不同。從原本的一問(wèn)一答,到有情感、更自然的交流,大概率會(huì)有不少人開(kāi)始發(fā)帖“我覺(jué)得家里的AI助理才是我爸媽親生的”。

三是教育產(chǎn)業(yè)。一進(jìn)九月臨近教師節(jié),家長(zhǎng)群們總少不了“送禮物擔(dān)心老師不收,不送禮物擔(dān)心孩子得不到關(guān)照”的年度討論,而現(xiàn)實(shí)中,確實(shí)存在老師無(wú)法針對(duì)學(xué)生進(jìn)行一對(duì)一特定輔導(dǎo)、難以記住所有學(xué)生的學(xué)情狀況、教學(xué)壓力大等情況。能化身虛擬老師的“數(shù)字助手”,無(wú)疑就是妥妥的多贏,老師們得以從機(jī)械工作中解放出來(lái),學(xué)生們也能得到實(shí)時(shí)、個(gè)性化的輔導(dǎo),而家長(zhǎng)們也不用發(fā)愁怎樣才能在AI眼里刷存在感了。

三是智能營(yíng)銷。對(duì)于企業(yè)來(lái)說(shuō),數(shù)字助手不僅僅是一位德智體美勞全面發(fā)展的優(yōu)秀員工,還可以是輔助商業(yè)營(yíng)銷決策的“超級(jí)智囊”。舉個(gè)例子,一些汽車小白用戶,通過(guò)互聯(lián)網(wǎng)的消費(fèi)行為偏好分析,進(jìn)而設(shè)計(jì)出一些“傻瓜式”產(chǎn)品功能,比如一鍵詢問(wèn)維修、一鍵呼叫客戶、智能導(dǎo)航、輔助駕駛等等,而這些用戶洞察,基于騰訊云小微所處的數(shù)字生態(tài)都可以轉(zhuǎn)化為車機(jī)企業(yè)爭(zhēng)取潛在用戶好感度的關(guān)鍵武器。

一個(gè)能聽(tīng)會(huì)說(shuō)、知識(shí)全面,又善于表達(dá)、喜怒形于色的數(shù)字員工,擁有的可能性還有很多。不難發(fā)現(xiàn),不僅企業(yè)需要重新認(rèn)知數(shù)字助理所帶來(lái)的價(jià)值紅利,想要擴(kuò)大數(shù)字助理的商業(yè)價(jià)值與應(yīng)用邊界,還需要一套體系化的平臺(tái)性技術(shù)解決方案,來(lái)降低各行各業(yè)引入數(shù)字員工的門(mén)檻及成本。

從這一點(diǎn)來(lái)看,數(shù)字生態(tài)大會(huì)上所展示的人機(jī)交互技術(shù)前景與商業(yè)宏圖,不是一種偶然,而是騰訊云小微從長(zhǎng)期實(shí)戰(zhàn)與技術(shù)研發(fā)中生長(zhǎng)出來(lái)的確定性。

騰訊云小微扳動(dòng)了一下技術(shù)齒輪,人與機(jī)器如同精密儀器適配一樣,在某個(gè)瞬間發(fā)出“咔”的一聲,于是我們知道,一個(gè)全新的產(chǎn)業(yè)世界大門(mén),開(kāi)啟了……

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無(wú)關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2020-09-11
探路人與解題者:騰訊數(shù)字生態(tài)大會(huì)上AI語(yǔ)音助手+X的無(wú)限可能
許多主打智能語(yǔ)音功能的硬件(比如音箱),只有在剛拿到手的新鮮勁里,或者是網(wǎng)絡(luò)上又出現(xiàn)了“調(diào)戲”語(yǔ)音助手的段子,才會(huì)想起來(lái)跟它們對(duì)話。

長(zhǎng)按掃碼 閱讀全文