123,123,123

從有了Siri作為先例，擬人化已經(jīng)成為了自然語言交互工具的必備能力。不論是服務(wù)于個(gè)人用戶的AI語音助手，還是企業(yè)提供的智能客服，甚至是各種有語音功能的家用電器，都要做IP、造人設(shè)，幾乎有了成精之勢。

在大多數(shù)時(shí)候，我們認(rèn)為自然語言交互的工具的擬人化可以降低用戶的“恐怖谷效應(yīng)”，讓用戶更喜歡與其交流。但最新的研究結(jié)果卻表明，事實(shí)或許并非如此。

成為人類的千重套路

首先我們可以來看看，自然語言交互工具擬人化的“千重套路”。

第一步，給自己起一個(gè)人畜無害的名字。

我們常說，當(dāng)你撿到一只小動(dòng)物后，如果給它起了名字，那么它十有八九會(huì)成為你的寵物。AI也是一樣，當(dāng)自然語言交互工具擁有姓名，基本就注定了它會(huì)在成精的道路上越走越遠(yuǎn)。自然語言交互工具的名字通常是“小”字輩，既顯得弱小無害又無關(guān)性別足夠政治正確。

第二步，利用語音生成技術(shù)模仿人類語氣。

擁有了名字之后，肯定就不能再用冷冰冰的電子音了，甚至以往語音生成技術(shù)管用的真人錄音+規(guī)則匹配的模式也略顯死板。這時(shí)便出現(xiàn)了以谷歌WaveNet為代表的神經(jīng)網(wǎng)絡(luò)語音生成，通過對真人說話方式多種特征的抓取，對語義、詞性、語法包括上下文等等參數(shù)綜合考慮，最終生成谷歌助手那樣像真人一樣說話會(huì)停頓、有思考的語氣。

第三步，讓對話內(nèi)容更加人性化。

在自然語言交互的過程中，語音生成需要建立在文本內(nèi)容之上。滿足了“說話語氣”的擬人化，同樣也要讓“說話內(nèi)容”更加人性化。這時(shí)語義理解、多輪對話、自然語言生成等等技術(shù)的成熟度就變得非常重要。例如微軟在微軟小冰上應(yīng)用的全雙工自然語言交互，就能實(shí)現(xiàn)“邊聽邊想”和“節(jié)奏控制”——通過整個(gè)對話過程對用戶意圖進(jìn)行理解，減少用戶的等待時(shí)間，并且能夠主動(dòng)引發(fā)新話題打破沉默，自行調(diào)節(jié)回答的內(nèi)容和時(shí)機(jī)。這樣的對話內(nèi)容通過語音生成技術(shù)“展現(xiàn)”出來，就可以以假亂真，讓人以為自己真的在和人類對話。

最后一步，披上“人皮”。

除了技術(shù)之外，還要以一些外圍模式讓自然語言交互工具更加擬人化。比如為它們設(shè)計(jì)一個(gè)可愛的卡通形象，增加幾條指令讓它們學(xué)會(huì)一些撒嬌賣萌的口頭語，在交互界面上增加一些細(xì)節(jié)讓人們意識不到他們在與機(jī)器對話等等。

有了這幾步套路，基本就能塑造出一個(gè)“化作人形”的自然語言交互工具了。

越人性越可愛？自然語言交互工具的期望值管理

可我們從未想過的一個(gè)問題是，在實(shí)際應(yīng)用時(shí)，自然語言交互工具真的越擬人化越好嗎？最近賓州州立大學(xué)媒體效果研究實(shí)驗(yàn)室就進(jìn)行了這樣一項(xiàng)實(shí)驗(yàn)。

研究人員們告知志愿者，他們將在電商平臺中選購數(shù)碼相機(jī)，并需要和在線客服交談咨詢。這些客服背后都是智能自然語言交互系統(tǒng)，但研究人員對其進(jìn)行人性化和響應(yīng)程度上的區(qū)分。不同組的志愿者們分別會(huì)接觸不同的在線客服系統(tǒng)，有在對話時(shí)直接告知對方自己是機(jī)器客服的，有的只展示出對話框內(nèi)容，有的會(huì)通過真人頭像和名字“偽裝”成人類。

同時(shí)這些擬人程度不同的智能客服，又分別有著不同的響應(yīng)程度。有些可以迅速精準(zhǔn)的回答用戶問題，有的卻聽不懂人話顧左右而言他。

在交互過后調(diào)查實(shí)驗(yàn)者的滿意程度時(shí)，結(jié)果卻令人意外。

在一般的邏輯中，我們會(huì)認(rèn)為智能客服在交互時(shí)響應(yīng)程度越高，人們的滿意度自然也會(huì)越高。可實(shí)際情況是，在同樣的響應(yīng)程度下，使用者的滿意程度是與智能客服的人性化程度相關(guān)的。比如同樣的交互內(nèi)容，明確知道對方是機(jī)器客服的實(shí)驗(yàn)者就會(huì)給出80分的滿意度評價(jià)，而那些偽裝成人類的機(jī)器客服卻只能獲得60分的滿意度評價(jià)。原因是當(dāng)機(jī)器客服表現(xiàn)出較高的人性化特征時(shí)，用戶對他們的期望程度也會(huì)隨著上升，盼望著他們能和人類一樣幫助自己解決問題，如果得不到想要的答案，則會(huì)放大失望感。

其實(shí)在我們自己應(yīng)用自然語言交互時(shí)也有同樣的感受，當(dāng)語音助手、智能客服等等產(chǎn)品不能解決問題還要強(qiáng)行賣萌講笑話時(shí)，我們的暴躁指數(shù)往往會(huì)呈直線上升。

說到底，自然語言交互的人性化與否是一個(gè)“用戶期望值管理”問題，有時(shí)過度提升用戶期望值反而會(huì)弄巧成拙。

做人容易，做工具難

但目前我們能看到一個(gè)重要的趨勢是，自然語言交互人性和工具性的發(fā)展程度是不均衡的。

從技術(shù)發(fā)展的難易程度來看，讓自然語言交互工具更加接近人類，遠(yuǎn)遠(yuǎn)要比讓自然語言交互工具更加有效容易得多。

不管是谷歌的WaveNet還是微軟的全雙工自然語言交互，都足以讓自然語言交互的發(fā)音模式、對話節(jié)奏等等細(xì)節(jié)無限接近人類。未來結(jié)合上計(jì)算機(jī)視覺層面，甚至機(jī)器人制作工藝層面的能力，我們可以打造出一個(gè)與人類無異的對話者。

其實(shí)在今天，我們就能看到諸如AI主播或harmony推出的索菲亞等等在視覺上極致人性化的“AI演說者”。

可這些自然語言交互解決問題的能力卻沒有因此提高。具體表現(xiàn)為：對于人類語料的理解還存在一定隔閡，尤其是小語種、老年人、兒童等等相對冷門的語料庫；對于不同領(lǐng)域詞匯的認(rèn)知還不夠全面，很多時(shí)候涉及到一些垂直產(chǎn)業(yè)時(shí)，AI往往會(huì)進(jìn)入知識盲區(qū)。

如此以來，幫助自然語言交互的“工具性”追趕“人性”或許將成為未來很長一段時(shí)間內(nèi)的產(chǎn)業(yè)熱潮。例如建立各個(gè)細(xì)分產(chǎn)業(yè)領(lǐng)域的知識圖譜、累積詞匯庫，或收集不同人群不同方言語種的語料庫用于AI訓(xùn)練。

在技術(shù)的不斷追趕之下，人們對自然語言交互工具的期望值不斷提高已經(jīng)是一種必然，為了避免出現(xiàn)“短板效應(yīng)”，我們或許應(yīng)該投入更多精力去追求“人性”以外的東西。

免責(zé)聲明：此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章，所有文字和圖片版權(quán)歸作者所有，且僅代表作者個(gè)人觀點(diǎn)，與極客網(wǎng)無關(guān)。文章僅供讀者參考，并請自行核實(shí)相關(guān)內(nèi)容。投訴郵箱：editor@fromgeek.com。

免責(zé)聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請進(jìn)一步核實(shí)，并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏，概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí)，應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后，將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí)，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

為什么越像人的自然語言交互工具，越容易讓人失望？

下一篇

為什么越像人的自然語言交互工具，越容易讓人失望？

下一篇

為什么越像人的自然語言交互工具，越容易讓人失望？