理工男的逆襲:做AI,不做聊天殺手

原標題:理工男的逆襲:做AI,不做聊天殺手

理工男是這個星球上的一個神奇物種,他們經(jīng)常會被貼上低情商、木訥、耿直等標簽。比如浙江大學計算機科學與技術(shù)學院的學生焦云皓,就在打游戲是的時候無情地對同學說了一句“你這樣的水平如果是其他人,我才不帶他玩呢”,然后順利被同窗了16年的同學拉黑了……

但是理工男的腦洞一旦開起來也是無人可擋。比如被拉黑的焦云皓百思不得解,最終痛定思痛,下決心對“聊天殺手”這樣的現(xiàn)象進行研究。接著,神奇的事情出現(xiàn)了:他開發(fā)出了一套基于AI技術(shù)的智能對話分析系統(tǒng)ConverNet。這個系統(tǒng)的功能定位也非常簡單粗暴:

拒做聊天殺手,友誼天長地久。

拒絕做聊天殺手:理工男是怎么操作的?

ConverNet建立在深度學習神經(jīng)網(wǎng)絡(luò)之上,通過對大量文字聊天數(shù)據(jù)進行分析,試圖從其中找到對話終結(jié)、聊不下去的原因。為了能夠給ConverNet找到足夠的學習數(shù)據(jù),焦云皓在導師的幫助下找到了兩個公開的海量數(shù)據(jù)庫:Reddit-Treads和Movie Dialogs。這兩個數(shù)據(jù)庫分別以討論組式的群聊內(nèi)容和對白式的一對一聊天內(nèi)容為主。在這些內(nèi)容中,ConverNet著重針對兩種聊天終止場景進行分析。一種是單聊中的聊著聊著沒有話說,另一種則是群聊中某人發(fā)言之后出現(xiàn)冷場。

ConverNet的運行原理是對大量對話數(shù)據(jù)進行編碼,尋找到聊天中斷的“斷點”,再利用LSTM神經(jīng)網(wǎng)絡(luò)單元對這些對話數(shù)據(jù)進行理解和特征提取,為那些被中斷的尬聊對話提取共同特征。最終實現(xiàn)對對話是否會因尬聊而中斷的概率預測。

在學習了一共接近20萬組對話之后,ConverNet已經(jīng)基本掌握了一些“聊天殺手”的特征,在測試中實現(xiàn)了80%的預測準確率。通過ConverNet人們還把握了一些尬聊規(guī)律,比如在單聊場合中,大段發(fā)送長文字可能會終結(jié)聊天,但在群體討論時長文字反而會刺激群聊的積極性。

這套系統(tǒng)的首位受益人是焦云皓的老爸。經(jīng)過分析,他的老爸總是大段大段地發(fā)送消息,與其他人顯得格格不入;后來改發(fā)發(fā)表情包和短句子,結(jié)果聊天冷場的情況就少多了。

多場景應(yīng)用:不止于讓聊天繼續(xù)

這個創(chuàng)意如果只停留在實驗室里,充其量只能被看做是一場關(guān)于AI的人機交互的一種獵奇。我們需要看重的,更應(yīng)該是它在現(xiàn)實應(yīng)用場景中落地的可能。

既然是聊天系統(tǒng),那么其首要落地場景應(yīng)該集中在社交軟件當中,如陌陌、探探等主打陌生社交的產(chǎn)品,用戶的主要訴求基本都是通過溝通拉近彼此的關(guān)系。

在這類產(chǎn)品中光把兩位用戶匹配到對話場景中僅僅是個開始,幫助用戶好好聊天才能更深入的滿足用戶訴求。在這時 ConverNet就可以發(fā)揮作用,在軟件中植入對話實時指導功能。當用戶編輯好要發(fā)送的內(nèi)容的時候,系統(tǒng)可以自動根據(jù)聊天的場景給出具體的指導意見。

比如,當你輸入“發(fā)個自拍看看”這種典型尬聊語句的時候,軟件就會彈出“有百分之××的用戶在發(fā)送該句的時候?qū)υ捊K止,確定要發(fā)送嗎”的提示,然后給出獲取照片的可能性方式。在這個過程中,ConverNet既能在很大程度上保證聊天的繼續(xù),也在一定程度上培養(yǎng)用戶自身的語言表達習慣。

此外,將ConverNet落地于PUA(Pick up Artist)群體也是一個不錯的選擇。既然有那么多人愿意掏錢學習如何與異性交流,何不如利用ConverNet這類分析系統(tǒng)對聊天內(nèi)容的正反案例進行分析,尋找搭訕過程中成功與失敗的原因。甚至可以摸索出男女之間在不同的交往階段的語言使用風格,掌握不同性格的個體在各個階段的語言親密度。比如什么時候可以說一些有吸引力的話,什么時候又需要保持一定的距離。在AI的幫助下,有的放矢地進行交流。到故事的最后,ConverNet在手,妹子我有。

不光是PUA,一切需要溝通藝術(shù)的地方都可以讓AI發(fā)揮功效:銷售、公關(guān)、客服……對于一切不會說話、說話磕巴、說話招人煩的人類,都可以對其整體對話數(shù)據(jù)進行分析,再作具體的針對性補短。

當然,想做到這一地步,需要涉及復雜的人類情感,AI必須要學習更多的數(shù)據(jù)、掌握強力的算法才有可能實現(xiàn)。

如果這些能夠?qū)崿F(xiàn),便可以將ConverNet系統(tǒng)的運行邏輯遷移到智能家居場景當中,或許我們可以尋找到優(yōu)化人機交互的新路徑。

利用智能音箱作為接口,對家用電器進行喚醒是當下智能家居領(lǐng)域的一個基本操作。但在更多層面上,這種交互是一種單向的命令式交互,家居產(chǎn)品智能被動性接受指令,無法實現(xiàn)反向的主動參與。在這種情況下,用戶跟智能家居就很難產(chǎn)生持續(xù)的交流意愿。

智能音箱可以通過不斷地對用戶語料的抓取分析,將語言字數(shù)與情緒、語言速度與情緒、語調(diào)高低與情緒進行結(jié)合,著重搜集任務(wù)未完成時的對話中斷。然后,根據(jù)以上幾個方面進行特征分析提取,再進行自我改進,以取得更優(yōu)質(zhì)的人機交互體驗效果。

從夢想到現(xiàn)實:技術(shù)仍是亟待突破的壁壘

美好的東西總是令人向往,但前提是,這套ConverNet系統(tǒng)要解決以下幾個問題。

首先是學習樣本的數(shù)量不足。目前,ConverNet的數(shù)據(jù)學習數(shù)量只有二十萬條左右,而在社交平臺上,每天會有億萬組的對話產(chǎn)出。與之相比,二十萬條的數(shù)據(jù)學習量只是九牛一毛。這樣小范圍數(shù)據(jù)上的準確率是否真的有應(yīng)用價值,其實是存有爭議的。

其次是對文本數(shù)據(jù)學習本身的局限。對于ConverNet來說,目前的模型完全是基于英語文字的學習??稍趯嶋H應(yīng)用場景中,往往是文字+語音+表情包的綜合打法,漢語中還會出現(xiàn)同音字替代、顏文字等復雜的情況。這些細節(jié)的變化很有可能會造成模型整體訓練難度的增加。

最后還有隱私問題,想實現(xiàn)所謂的對用戶對話是否會造成聊天終結(jié)的預測,一個必備前提就是對用戶聊天內(nèi)容進行分析。即使利用上端側(cè)AI計算和內(nèi)容脫敏,也難免會讓用戶有種隱私被AI“視奸”的毛骨悚然之感。

實際上,要達到讓Convernet在日常中發(fā)揮實際作用的目的,除了解決以上幾個方面的問題,還要考慮到語言發(fā)生的環(huán)境、語氣問題等,并且通過多種算法的綜合運用來協(xié)調(diào)處理一句話里包含的種種要素。從某種程度上來說,以前人類用AI是彌補智商,而現(xiàn)在更多的是彌補情商。這個技術(shù)難點,無疑需要較長的時間來克服。

而夢想到現(xiàn)實的距離,就是不斷克服技術(shù)壁壘的過程。人機交互的實質(zhì)性飛越,或許可以從好好聊天開始。讓聊天繼續(xù),也就存在了讓夢想繼續(xù)的可能 。

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2018-04-14
理工男的逆襲:做AI,不做聊天殺手
原標題:理工男的逆襲:做AI,不做聊天殺手理工男是這個星球上的一個神奇物種,他們經(jīng)常會被貼上低情商、木訥、耿直等標簽。

長按掃碼 閱讀全文