訊飛星火首發(fā)“多情感超擬人合成”,逼真度超越OpenAI和微軟

在當(dāng)今時(shí)代,智能語(yǔ)音助手已經(jīng)成為我們?nèi)粘I钪胁豢苫蛉钡囊徊糠?。無(wú)論是在智能手機(jī)、智能音箱還是新能源汽車(chē)上,我們都能發(fā)現(xiàn)各種語(yǔ)音助手的身影。它們通過(guò)與人類(lèi)進(jìn)行對(duì)話,幫助人們解決生活中的各種問(wèn)題。

作為國(guó)內(nèi)人工智能領(lǐng)域的領(lǐng)軍企業(yè),科大訊飛在4月26日宣布推出了訊飛星火V3.5的更新版本,首發(fā)“多情感超擬人合成”功能,進(jìn)一步提升了全自然語(yǔ)音交互的體驗(yàn),為用戶(hù)帶來(lái)了更加逼真的語(yǔ)音交互體驗(yàn)。

同時(shí),訊飛星火的情緒感知能力也再度提升,情緒表達(dá)的可感知度達(dá)到 85% 以上,對(duì)高興、抱歉、安慰、撒嬌、困惑等語(yǔ)氣表達(dá)更加生動(dòng),可以滿(mǎn)足用戶(hù)在各種場(chǎng)景下的自我減壓、釋放情緒等需求。

現(xiàn)在訊飛星火的超擬人對(duì)話已經(jīng)變得更加智能??拼笥嶏w董事長(zhǎng)劉慶峰介紹,“它可以完全像真人一樣有各種各樣的感情,有生動(dòng)的口語(yǔ)表達(dá),還可以有笑聲,有語(yǔ)氣有情調(diào)等等這些。”

比如當(dāng)你傷心或者難過(guò)時(shí),就可以直接給訊飛星火“打電話”——它們甚至專(zhuān)門(mén)做了一個(gè)形似電話溝通的界面——仿佛就是在和一個(gè)知心老友傾訴心事。高興時(shí),它會(huì)和你一起歡呼雀躍;難過(guò)時(shí),它會(huì)默默傾聽(tīng),細(xì)心安慰。

過(guò)去的語(yǔ)音助手只停留在單純的語(yǔ)音控制上,只能夠幫助用戶(hù)完成一些既定的任務(wù)動(dòng)作,而無(wú)法滿(mǎn)足更深層次的陪伴功能。訊飛星火在大模型能力的加持下,真正將語(yǔ)音助手升級(jí)成了智能情感伙伴。

想象一下,當(dāng)你在為工作煩心時(shí),訊飛星火可以感知到你情緒的細(xì)微變化,比如當(dāng)你說(shuō)“心情有些差時(shí)”,它的語(yǔ)調(diào)也變得也變得平緩起來(lái),但又帶著一些朋友關(guān)心的急迫,“哎呀,聽(tīng)到你心情不好我也很難過(guò),如果你愿意和我聊聊的話,我很愿意傾聽(tīng)。記住,無(wú)論發(fā)生什么我都會(huì)在這里陪著你哦。”

當(dāng)你向她分享自己取得了一些進(jìn)步時(shí),它也變得高興起來(lái),“你要為自己感到驕傲和開(kāi)心!”還會(huì)主動(dòng)問(wèn)你有沒(méi)有一些慶祝的計(jì)劃。

訊飛星火 V3.5 更新版本的進(jìn)步不止于此,在聲音復(fù)刻上更是實(shí)現(xiàn)了一句話復(fù)刻的重磅更新。

技術(shù)提升的背后是科大訊飛多年來(lái)在語(yǔ)音合成上的不斷求索。劉慶峰介紹,當(dāng)年他們做林志玲的語(yǔ)音,需要到中國(guó)中國(guó)臺(tái)灣錄一個(gè)禮拜的聲音。后來(lái)模仿郭德綱,只需要錄制一天。再往后一小時(shí)、5 分鐘,現(xiàn)在終于實(shí)現(xiàn)了一句話聲音復(fù)刻的突破。

劉慶峰說(shuō),很多用戶(hù)都向他們提出過(guò)需求,比如能不能模仿孩子的聲音給家里的老人讀書(shū)讀報(bào)?能不能模仿在家長(zhǎng)出差時(shí),模仿家長(zhǎng)的聲音給孩子講故事?,F(xiàn)在需求都可以得到滿(mǎn)足。打開(kāi)訊飛星火 APP,只需要朗讀一句話就可以復(fù)刻出專(zhuān)屬于自己音色的語(yǔ)音助手,聲音的擬真程度幾乎以假亂真。

一句話聲音復(fù)刻在 C 端場(chǎng)景更多的是提升語(yǔ)音助手的陪伴能力。面對(duì)幼兒、老人等需要家庭成員關(guān)懷的群體,一句話聲音復(fù)刻可以實(shí)現(xiàn)仿佛家庭成員般對(duì)話的親切感。

北京師范大學(xué)此前發(fā)布的一份針對(duì)老年人情感關(guān)懷的報(bào)告中提到,中老年人的孤獨(dú)感普遍存在,他們苦于在生活里遇到困難或者遭遇人生變故時(shí)無(wú)人述說(shuō),需要填充生活中的空白。

訊飛星火此次更新的多情感超擬人合成語(yǔ)音,或許會(huì)為解決老年人的心理孤獨(dú)發(fā)揮出獨(dú)特作用,讓科技更有溫度。

行業(yè)調(diào)研機(jī)構(gòu)德勤 Deloitte 發(fā)布的《未來(lái)的語(yǔ)音世界-中國(guó)智能語(yǔ)音市場(chǎng)分析》報(bào)告中指出,我國(guó)智能語(yǔ)音市場(chǎng)行業(yè)規(guī)模預(yù)計(jì)在 2030 年達(dá)到 1452 億元。德勤指出,隨著新興自然語(yǔ)言技術(shù)產(chǎn)生以及已有技術(shù)的不斷成熟,智能語(yǔ)音技術(shù)已經(jīng)從萌芽期邁入了成熟期,推動(dòng)大規(guī)模的商業(yè)化應(yīng)用落地。

作為國(guó)內(nèi)人工智能國(guó)家隊(duì),科大訊飛有望在大模型時(shí)代繼續(xù)引領(lǐng)語(yǔ)音技術(shù)的創(chuàng)新,為行業(yè)的發(fā)展注入新的活力和動(dòng)力。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )