AI能聽懂你的情緒了,人機交互會變得更好嗎?

原標(biāo)題:AI能聽懂你的情緒了,人機交互會變得更好嗎?

第一次使用手機語音助手的時候,這個令我新奇不已的玩意兒,總是會在我興沖沖地問一個問題之后,令人失望地回答一句:“我好想聽不懂你在說什么……”

后來技術(shù)演進,它終于能夠通過我的一些關(guān)鍵詞,聽懂我說什么了。但一板一眼,一字一句,程式化十足。

慢慢地,簡單的對話已經(jīng)難不倒它。語音助手開始不局限于僅僅是對“文本”的理解,而是加入視覺、聽覺等分析技術(shù),通過“察言觀色”來捕捉人的“話語”背后蘊藏的情感。它們開始試圖獲取人類的情緒。

就像亞馬遜近日所透露的,基于Alexa語音識別情緒的技術(shù)能力,他們有計劃打造一款類似手表的可穿戴設(shè)備,通過捕捉用戶的情緒,而去提供更多的服務(wù)。

萬事不離“視聽”:AI探知情緒的主要途徑

對人類的情緒進行研究和總結(jié),是一個已經(jīng)開展了將近一個半世紀(jì)的課題。最初研究者們往返于不同的種族人群,進行比對、分析,得出了人類的幾大基本情緒類別,然后可以應(yīng)用在人際交往、醫(yī)療護理等行業(yè)。

而在人機交互越來越深入的今天,機器能否對人的情緒進行充分的理解,將會直接影響到交互體驗。由此而來,諸多人工智能公司開始對機器識別情緒展開了攻關(guān)。得益于圖像識別和語音識別技術(shù)的不斷取得突破,目前AI識別情緒主要有兩種途徑。

第一種是視覺情緒識別。這是一種最基本的情緒識別方式,因為人的情緒往往會以面部肌肉運動的形式來直接呈現(xiàn),這也是美國心理學(xué)家保羅·艾克曼和福里森證明人類有六大基本情緒的直接原因。

而面部識別如今已經(jīng)是一項非常成熟的技術(shù),通過“喂給”AI大量的面部表情數(shù)據(jù),然后進行學(xué)習(xí),從而就可以對現(xiàn)實中人臉?biāo)尸F(xiàn)的情緒進行判斷。國內(nèi)就有專門做面部情緒識別的人工智能公司,比如曠視、太古等。

第二種是語音情緒識別。人的情緒出了能“看”出來,也能“聽”出來。與之直接相關(guān)的就是不同情緒下人說話的語調(diào):深沉之于悲傷、高昂之于愉悅等。

相較于視覺識別,語音識別的難度要高了不少。因為情緒與表情的對應(yīng)度要遠(yuǎn)高于語調(diào)與情緒,比如你很難將哭喪臉與開心聯(lián)系到一起,但一個人如果說話聲音低沉的話可以表示他心情沉重,也可能是因為他的音色本就如此。正因如此,對聲音信號的分析才會要求更加精細(xì)。百度、谷歌、亞馬遜等對此均有一定的技術(shù)積累。

除了這兩種情緒識別途徑之外,通過文本識別和生理信號(腦電波、呼吸、皮膚阻力等)也是AI進行情緒識別的方法,但由于文本涉及的場景狹窄和生理信號的準(zhǔn)確率低的短板,其尚不能成為主流的情緒識別方法。

顯然,Alexa所擅長的就是第二種途徑。在語音情緒識別方面,去年10月Alexa就已經(jīng)取得了相關(guān)專利,其可以通過聲音的模式來確定用戶的幸福、快樂、憤怒、悲傷、恐懼、厭惡、無聊、壓力和其他一些情緒的狀態(tài)。而如今,這項專利終于要派上用場了。

從買止咳糖漿到在線購物:Alexa聽懂情緒后怎樣

Alexa是亞馬遜專門研究智能語音技術(shù)的團隊,它的技術(shù)要進行應(yīng)用轉(zhuǎn)化,往往和亞馬遜的另一個團隊Lab 126(曾經(jīng)開發(fā)過kindle和echo等產(chǎn)品)有關(guān)。這一次,兩個團隊再次攜手,準(zhǔn)備把語音情緒識別的最新成果搭載到一個類似智能手表的可穿戴設(shè)備上。通過與手機APP的連接,來為用戶提供個性化服務(wù)。

根據(jù)亞馬遜的內(nèi)部文件,這款手表的功能定位很簡單,就是健康輔助。而在此之外,它還可以通過識別用戶的語音特征來進行情緒判斷,然后為其提供與他人交流的最佳方式。

根據(jù)描述,如果一個女生一邊擤鼻涕一邊咳嗽一邊又跟Alexa說自己有點餓了,那么Alexa就會通過對女生說話的的音調(diào)(虛弱、低沉)和背景音(咳嗽、擤鼻涕)分析出她很可能得病了,然后發(fā)出來自機器的貼心關(guān)懷:要不要來碗雞湯,或者叫個外賣?甚至直接線上訂購一瓶止咳糖漿一小時內(nèi)送貨上門?

說真的,妹子要真有這么一個貼心助理,還要什么男朋友?

從這個角度來說,Alexa作為個人生活助理的角色會得到進一步的加強。比如將其和手機音樂、電商APP等業(yè)務(wù)進行連接,在感知到你比較悲傷的時候為你唱一支快樂的歌,或者為你購買一盒甜品來讓你通過食物獲取愉悅感等。

由此而往,Alexa很可能將開啟一種全新的語音購物推薦方式。與傳統(tǒng)的通過捕捉用戶的瀏覽記錄、搜索記錄或者通過“竊取”其他用戶在手機其他APP上留下的隱私足跡,然后進行毫無目標(biāo)的泛化、低效的推薦不同,通過感知情緒和問詢來為用戶進行購物推薦,能夠獲得更高的成交效率。這無疑將對電商形成巨大的吸引,也是可能成為Alexa獲利的一種新的商業(yè)模式。

當(dāng)然,現(xiàn)在這種可穿戴設(shè)備尚且處于研究的早期階段。亞馬遜并未完全確定是否執(zhí)行此項計劃。如果技術(shù)可行的話,才會進一步地去進行設(shè)計。我們這樣長篇大論似乎有“過度解讀”之嫌。

但在這個時代,最不可小看也最無法預(yù)測的,就是技術(shù)的走勢。如果它真的走入了現(xiàn)實,或許還真有一些東西需要認(rèn)真對待并妥善解決。

謹(jǐn)防“服務(wù)”變成“買賣”

首當(dāng)其沖需要被關(guān)注的,就是我們不厭其煩地再三提及但也不得不提的隱私問題。

隱私數(shù)據(jù)是互聯(lián)網(wǎng)時代不可回避的,用戶提供自己的數(shù)據(jù)以獲取服務(wù)這種交換每天都在發(fā)生。在各種APP中,為了改進產(chǎn)品的使用體驗,服務(wù)商一般都會明確告知會搜集用戶的部分隱私數(shù)據(jù),并且僅用于改進產(chǎn)品之用。但這種話向來被認(rèn)為是鬼話,尤其是Alexa還是有前科的——echo就不止一次被用戶曝出偷聽用戶和私自收集隱私的劣行。

但如果是做成監(jiān)測健康和識別情緒的穿戴設(shè)備的話情況又不一樣了。智能音箱正常情況下是需要喚醒才能工作的(我們假如非正常情況不存在……),而智能手表等可穿戴設(shè)備需要全天候地開啟,也就是說它隨時隨地都在感知著你的變化……想一想,有個東西默默地掌握著你情緒的一切,然后很有可能在背著你做著一些不知情的事情,是不是有點害pia?

獲取隱私的邊界在哪兒,是需要解決的第一個問題。

其次,需要警惕它由一種私人服務(wù)“異化”為不合理的商業(yè)用途。上文我們分析過的,它可以和電商達(dá)成一種合作,形成一種新的購物模式。但是,如果它所推薦的商品或者商家都是“充值”過的呢?你以為被推薦的商品是最合適的,沒想到卻是給錢最合適的……利用用戶的情緒進行商業(yè)分發(fā),顯然會給用戶添不少堵。

從這個角度來說,如何劃分服務(wù)和商業(yè)的界限,也是需要重點關(guān)注的。

最后,每次覺察到人的情緒變化,都會及時做出反應(yīng),很可能對人產(chǎn)生兩個截然相反的影響。

一是過分地依賴。情緒不好有它安撫,情緒愉悅有它“錦上添花”,將會讓人順著天性而行,缺乏自主的情緒調(diào)節(jié)能力。成年人還好,如果是兒童的話將很可能對其性格的形成產(chǎn)生不良影響。如何限制兒童使用此類產(chǎn)品,就會成為一個新問題。

二則是引起反感。人與人性格不同,有的人可能會喜歡被安撫,但有的人如果事無巨細(xì)都要被“噓寒問暖”,反而會引起精神的煩躁。這點很好理解,就跟你嫌爸媽嘮嘮叨叨是一個道理。那么,如何掌握好既能通過察覺情緒提供貼心的服務(wù)、又不至于引起反感的節(jié)奏,也是個技術(shù)活兒。

從總體上來說,Alexa如果能基于情緒識別提供正向的服務(wù)的話,還是很值得肯定的。畢竟人機交互到最后階段,是不可避免的要進行情緒上的碰撞;而基于此提供一些商業(yè)化的服務(wù)也無可厚非。但由于情緒的私密性和個人化色彩,無論是Alexa還是其他提供類似語音技術(shù)服務(wù)的公司,都必須要在符合倫理常識和保證體驗的前提下,提供有分寸、有邊界的服務(wù)。

否則的話,被用戶拋棄將會是注定之事。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2019-05-31
AI能聽懂你的情緒了,人機交互會變得更好嗎?
這是一種最基本的情緒識別方式,因為人的情緒往往會以面部肌肉運動的形式來直接呈現(xiàn),這也是美國心理學(xué)家保羅·艾克曼和福里森證明人類有六大基本情緒的直接原因。

長按掃碼 閱讀全文