興業(yè)證券打造更“自然”的數(shù)字人,火山語音提供技術支持

隨著AI技術的不斷成熟,越來越多金融機構將虛擬數(shù)字人應用到業(yè)務場景中。虛擬數(shù)字人能夠打破時空限制、實現(xiàn)降本增效、提高服務體驗,有望進一步助力金融機構數(shù)字化轉型、提升運營效率。

以興業(yè)小知為例,與此前諸多的虛擬數(shù)字人不同,小知是興業(yè)證券攜手火山引擎打造的業(yè)內首款以自有員工為原型、集“播報+服務”于一體的全真數(shù)字分身。作為智慧主播,數(shù)智服務官小知將在優(yōu)理寶App、興業(yè)證券App以及興業(yè)其他新媒體平臺為用戶解讀股市行情、播報市場資訊。

興業(yè)證券首位數(shù)智服務官小知

整體來看,小知不僅從外形上深度還原了興業(yè)證券明星投顧的形象,更重要的是其口唇形、微表情與動作也都達到了較高的仿真度與自然度。作為火山引擎金融虛擬數(shù)字人解決方案的技術提供方,火山語音通過使用行業(yè)領先的非自回歸模型的唇形生成網(wǎng)絡,合成與輸入文本或語音完全匹配的唇形,準確率高達98.55%;基于創(chuàng)新的Motion Graph技術,數(shù)字人可以輕松做到毫秒級動作切換延遲且自然無感知。

值得一提的是,數(shù)智服務官小知在火山語音領先的端到端語音合成技術加持下,還具有開心、驚訝、憤怒等豐富的情感演繹能力,還可通過控制音色的重音、停頓等,賦予多樣的語氣,實現(xiàn)笑聲、哭腔等非語言現(xiàn)象建模能力,貼近真人的同時為用戶提供更有溫度的服務。可以說,小知是興業(yè)證券在數(shù)智化轉型的一次重要探索和實踐。

據(jù)了解,在火山語音的“AI虛擬員工解決方案”支持下,火山引擎已建立了包括2D、3D卡通和3D超寫實在內的虛擬數(shù)字人產品矩陣;從場景適配出發(fā),包括“播報型數(shù)字人”和“交互型數(shù)字人”兩種類型。其中播報型數(shù)字人,即輸入文本或語音,就可生成自然生動的數(shù)字人播報視頻;交互數(shù)字人作為播報型數(shù)字人的形態(tài)升級,依托于火山語音長期積累的成熟語音交互技術,可以做到“善聽”、“會說”、“能想”,與用戶面對面實時交互。

數(shù)字人產品矩陣

交互數(shù)字人集成了全雙工語音交互鏈路,前向兼容語音以及文本輸入,后向兼容2D與3D數(shù)字人表現(xiàn)力,整體端到端交互延遲在500ms左右,性能效果達到業(yè)內領先水平。

多模態(tài)交互數(shù)字人技術環(huán)路

目前該方案已經具備標準平臺的快速交付能力,面向金融、大消費、泛互等行業(yè)提供涵蓋“金融客服”、“智慧導覽”、“智能助理”、“虛擬直播”等場景細分解決方案,為用戶帶來全新的互動服務和便捷體驗。2022年6月,火山引擎虛擬人數(shù)字平臺已獲得信通院首批數(shù)字人系統(tǒng)基礎能力認證。

在數(shù)字化浪潮之下,各行各業(yè)的虛擬數(shù)字人“大戰(zhàn)”已蓄勢待發(fā)。此次興業(yè)證券推出的虛擬數(shù)字人便是打響了新年“第一槍”。在火山引擎等科技公司的加持下,讓這場沒有硝煙的“戰(zhàn)爭”變得更加精彩。面對這一片新藍海,最終誰將脫穎而出,誰又將“笑到最后”,需等待時間檢驗。

(免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )