據(jù)最新的一項調(diào)查,世界人民三觀并不一定相同,但在識別“假笑”這件事兒上卻基本上都能做到。不管身處哪個國家,人們基本上都能更好地分辨出笑聲到底是真的還是假的。
這是因為自然笑容的肌肉、聲音和硬擠出來的笑容肌肉、聲音是截然不同的,比如緊繃度和流暢度。打個比方,你很容易看出來“假笑男孩”是在“假笑”。
那么,既然人能識別“假笑”,那機器能不能做到?或者說,以目前的技術(shù)發(fā)展水平來說,人工智能是否可以通過識別技術(shù)來對人進(jìn)行情緒識別進(jìn)而做出相應(yīng)的反應(yīng)呢?
我們知道,目前人工智能最成熟的應(yīng)用之一就是圖像和語音識別,其已經(jīng)廣泛應(yīng)用到拍照識物、畫面增強、人機交互等各種領(lǐng)域。但顯而易見的是,目前其很大程度上還是處于識別和歸類的層面,想要透過表層的識別去進(jìn)行深層的情緒認(rèn)識和理解,進(jìn)而優(yōu)化人機交互的體驗,尚需時日。
但這并不代人們對人工智情緒識別的望塵莫及。作為對人的表層識別的深層次延伸,情緒識別帶來的變化將是非常積極的。那么,如今的人工智能情緒識別到底發(fā)展怎樣?它離進(jìn)入我們的現(xiàn)實生活,到底還有多遠(yuǎn)?
情緒大都一樣,手法各有不同
我們知道,人的情緒體現(xiàn)是多方面的。表情、語言、動作等,都可以作為人類表達(dá)情緒的載體。不同的情緒會以不同的形式體現(xiàn)出來,比如一個人開心的話就會笑,嘴巴兩邊向上翹起,眼角也會微翹;如果特別開心的話,會“哈哈”大笑。那么,很多研究者就抓住各種情緒對應(yīng)的表情或動作,來對機器進(jìn)行訓(xùn)練和學(xué)習(xí)。
可以說,凡是能反映情緒的地方,都已經(jīng)被研究者們翻遍了。
眼球轉(zhuǎn)動分析個性。民科對眼球轉(zhuǎn)動體現(xiàn)人的心理活動早就有過一些總結(jié),比如興奮的時候兩眼放光,沮喪的時候兩眼無光,悲傷的時候瞳孔無神,憤怒的時候怒目圓睜等等。還有人認(rèn)為眼球向左上方看是說謊,右上方看則是思考。無論科學(xué)與否,其總歸是證明眼球?qū)ε袛嗳说男愿?、情緒是由一定的作用的。
比如最近由德國斯圖加特大學(xué)、澳大利亞弗林德斯大學(xué)和南澳大利亞大學(xué)的研究人員組成的團隊就開發(fā)出了一種機器學(xué)習(xí)算法,其通過對系統(tǒng)進(jìn)行大量的訓(xùn)練,調(diào)查了42位受試者日常生活中的眼球轉(zhuǎn)動情況,然后去評估性格特征。比如該算法可以顯示關(guān)于個人的交際能力、好奇心等,并且能與識別出大五人格中的四種。那么,能從總體上來判斷一個人的性格,某種程度上就縮小了需要識別的情緒的范圍。
微表情分析。很多情況下,人的情緒并不是大起大落的,所以情緒更多的是從微表情上體現(xiàn)出來,比如動動嘴角、眨眨眼睛。比如翻眼珠的動作可能會表示不屑一顧。因此,作為與情緒直接相關(guān)的一部分,關(guān)于微表情的研究成為眾多公司競相上馬的項目。
最近麻省理工就通過機器學(xué)習(xí)來捕捉面部表情的細(xì)微變化,從而衡量一個人的心理感受。通過把18段視頻分解為一幀一幀的圖片,模型可以通過學(xué)習(xí)來獲得相應(yīng)表情背后的情緒。最主要的是,它有別于傳統(tǒng)表情識別的一刀切,可以根據(jù)需要進(jìn)行重新訓(xùn)練,具有高度的個體適用性。
語言表現(xiàn)分析。除了觀色之外,判斷人的情緒的另一個直觀方法就是“察言”。比如說話聲音的高低、打字速度的快慢等等。
日本軟銀公司的情感機器人pepper,其搭載的攝像頭讓其具備表情識別的功能,同時又可以基于云端的語音識別來實現(xiàn)對人說話的語調(diào)識別,從而獲取人的說話情緒,來實現(xiàn)其所標(biāo)榜的“情感機器人”的功能。同時,IBM開發(fā)的能感知情感的在線客服系統(tǒng),也可以通過學(xué)習(xí)識別藏在語法、打字速度中的人的情緒,類似的對話式情感識別人工智能還有微軟的小冰等。
除此之外,結(jié)合可穿戴設(shè)備來獲取人的脈搏頻率等體征也將有助于情感的獲得。總之,在人臉識別、語音識別、傳感器和各種數(shù)據(jù)算法的加持下,人工智能識別情緒看起來呈現(xiàn)出欣欣向榮的態(tài)勢。
研究者的“小山頭”,或是情緒識別“笨笨的”之因
然而,我們從以上的研究現(xiàn)狀當(dāng)中可以看到比較明顯的研究特點。
第一,技術(shù)研究呈現(xiàn)“小山頭”。即很多研究者都在試圖通過自己所擅長的技術(shù)領(lǐng)域去進(jìn)行解釋和實驗,比如有的擅長圖像識別,有的擅長語音識別,有的則擅長傳感器數(shù)據(jù)分析等。這些研究者或研究團隊往往擁有自己的技術(shù)優(yōu)勢,但也存在一定的短板。
第二,技術(shù)研究的實驗室限制。雖然三歲小孩兒都會“看人臉色”,但這對機器來說已經(jīng)殊為不易。因此,目前的情緒識別仍然處于起步階段,很多技術(shù)還存在于實驗室或論文當(dāng)中。而這離走進(jìn)現(xiàn)實,至少要三五個年頭。
即便是一些公司研發(fā)出成品應(yīng)用,其也一直飽受詬病,顯得笨笨的。比如pepper常被吐槽總是聽不清人說的話,小冰受到的吐槽更是一言難盡。技術(shù)尚未成熟就推出產(chǎn)品,其用戶粘性自然不值一提。
那么,為什么情緒識別對pepper、小冰們來說這么難呢?
正常來說,利用機器識別人的表情從而進(jìn)行情緒判斷是非常有想象力的,而且遠(yuǎn)景誘人。因為即便是人,有時候也很難察覺一些一閃而過的表情,導(dǎo)致無法判斷對方此時的心理情緒。但是擁有了成熟圖像識別和聲音捕捉能力的人工智能,處理這些事情看來應(yīng)該是如砍瓜切菜。
那么,導(dǎo)致人工智能“笨笨的”的現(xiàn)狀,也算是事出有因了。
比如我們上文分析過的一個原因。各研究團隊或公司往往是利用一種或兩種識別技術(shù)進(jìn)行情緒判斷,或抓住某個微表情、某一個聲音,這顯然是不完善的、片面的。比如“憤怒”和“激勵”兩種情緒,瘋狂的激勵往往表現(xiàn)為離奇的憤怒,同樣都是怒目圓睜、吼聲震天,人工智能該如何把這兩種情緒識別開?
這時候,單純的表情識別和聲音識別就體現(xiàn)出局限性了,其還有必要加入動作識別。比如手是握緊拳頭的加油狀,還是食指指向?qū)Ψ降奶翎厾?。如果再加上語言內(nèi)容識別等其他因素,形成一個綜合性因素的判斷,將更有利于情緒的精準(zhǔn)識別。
也就是說,情緒識別也就不僅僅是“察言觀色”的事兒,還必須要“觀其行”,對人進(jìn)行全方位、立體式分析。
此外,情緒識別還有可能因為虛假的表象而增加難度。比如文章開頭提到的假笑。單單是識別人們的最直觀情緒就已經(jīng)困難重重,如何去破解隱藏在偽裝背后的情緒就顯得更為棘手。
(非常低落而緩慢地跟小冰說話得到無情回答)
但情緒識別的難度顯然并非僅僅是我們以上分析的幾點。原因在于,情緒是一種心理行為,其也會由于個體的不同而展現(xiàn)出不同的表現(xiàn)形式,比如不同的文化當(dāng)中同一手勢就代表不同的意思,就像貼面在有的國家是禮節(jié)行為,在有的國家就是流氓行徑。
因此,情緒與心理相關(guān)的復(fù)雜性導(dǎo)致其與人的動作、表情并不一定呈必然相關(guān)性。但這并不意味著就沒有研究它的意義,反而讓我們能夠明確:研究情緒識別并不是一定要令每種情緒都有對應(yīng)的外在表現(xiàn),而是能夠最大程度地利用人工智能幫助我們理解情緒,從而挖掘更多的可能。
不僅能聊天,還能破個案?
那么,人工智能情緒識別能力的提升,究竟可以給我們提供哪些方面的便利之處?
首先,人機交互的體現(xiàn)更加自然順暢,也將直接扭轉(zhuǎn)人們?nèi)粘Α叭斯ぶ悄堋钡摹叭斯ぶ钦稀痹u價。這對于空巢老人、兒童的陪護(hù)將起到積極的作用。通過對人的情緒捕捉,它可以為老人兒童提供心理安慰。而在這個基礎(chǔ)上,利用人工智能進(jìn)行情緒識別也能更好地幫助解決心理疾病問題,分擔(dān)心理醫(yī)生的精力。尤其是在對話這塊兒,成熟的人工智能會在對話的過程中照顧到患者的情緒,從而慢慢地緩解病情。
并且,在對老人的看護(hù)之中,其還可以根據(jù)微表情的識別來判斷老人是否有老年癡呆的情況,從而能夠及時作出提醒。比如上文提到的麻省理工開發(fā)的情緒識別算法,既識別了情緒,必然對微表情能夠進(jìn)行熟練而準(zhǔn)確的分析。
其次,情緒識別能夠幫助提高犯罪審訊的效率。影視劇中經(jīng)常出現(xiàn)的一幕是,嫌犯坐在審訊室若無其事,任憑警察如何審訊,其始終一言不發(fā)。而我們知道,警方在利用掌握的已知證據(jù)“詐”嫌犯的時候,也是非常想知道嫌犯的心理底線到底還有多遠(yuǎn)。
那么,在審訊室裝個攝像頭、傳感器,另一邊的技術(shù)室實時進(jìn)行對嫌犯的脈搏、體溫、表情、喉結(jié)蠕動等各個細(xì)節(jié)的分析檢測,更有助于掌握嫌犯的心理變化情況,從而對審訊進(jìn)程了如指掌。比如宜興市檢察院就和中國政法大學(xué)聯(lián)合建立了微反應(yīng)實驗室,并且通過對犯罪嫌疑人轉(zhuǎn)瞬即逝的表情的成功捕捉,調(diào)整了審訊的方向,成功引導(dǎo)嫌犯交代事實。
可以預(yù)見的是,隨著情緒識別的成熟,這項技術(shù)將很快會部署到警務(wù)系統(tǒng)當(dāng)中。
最后,微表情將對涉及安全作業(yè)的情況對人進(jìn)行實時提醒?,F(xiàn)代社會工作呈現(xiàn)出高強度的態(tài)勢,人們?yōu)榱松鎺缀醵荚谄S诒济?,比如司機。
疲勞駕駛是造成車禍的主要原因之一,尤其在高速上。往往是一秒鐘的打盹,造成了一輩子的悲劇。如果車輛在出廠的時候就配置了以情緒識別為主要構(gòu)成的疲勞駕駛提醒系統(tǒng),在司機打哈欠、瞇縫眼、乃至“磕頭”的時候不斷進(jìn)行警報提醒,并提出休息建議,將可以在一定程度上降低車禍發(fā)生概率。
此外,利用情緒識別來管理和控制情緒也可能會成為一些情緒易失控者的福音。
總之,盡管情緒識別目前還很單薄,不足以令其成為粘度很高的日常產(chǎn)品。但可以肯定的是,一旦技術(shù)成熟,其帶來的益處將不僅僅是工業(yè)級的,更是貼近最廣大的消費者。當(dāng)情緒可以被當(dāng)作讀懂自己的鏡子,人們也就可以獲得更多來自他“人”的理解,從而解決更多實際生活中的難題。
可是,你有沒有想過可能由此而來的另外一個難題:鑒于深度學(xué)習(xí)的黑箱問題尚未解決,萬一人工智能具備了自主的人類情感怎么辦?
那還能怎么辦?準(zhǔn)備拿起武器戰(zhàn)斗吧……
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- 國產(chǎn)手機大勝,蘋果銷量大跌,難怪急哄哄降價千元
- 這里不止“羊毛月”,少年也在以電商助農(nóng)
- 同仁堂醫(yī)養(yǎng)IPO: “三位一體”診療服務(wù)體系高效協(xié)同 “中醫(yī)+”健康服務(wù)未來可期
- 走出群山,長賽道“攀登者”vivo
- 三線結(jié)構(gòu)光與升降LDS激光雷達(dá) 石頭自清潔掃拖機器人G30導(dǎo)航避障新里程
- 石頭科技閃耀CES2025 首創(chuàng)仿生機械手掃拖機器人
- TCL華星亮相CES2025,印刷OLED等創(chuàng)新顯示技術(shù)全球吸睛
- 科技云報到:從大模型到云端,“AI+云計算”還能講出什么新故事?
- 承載AI的云南花卉,正在盛開
- 打造個人辦公新范式,科大訊飛召開辦公智能體產(chǎn)品升級發(fā)布會
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。