5月31日消息,奇富科技智能營銷及貸后提醒業(yè)務(wù)場景中,每天都能接到大量帶方言口音的電話,客戶口音的多樣性直接影響到語音識別的準(zhǔn)確率和業(yè)務(wù)的流暢度。為此,奇富科技宣布“QI語精靈”方言識別技術(shù)再度升級,成功將業(yè)內(nèi)首個全自研Qifusion框架集成到業(yè)務(wù)場景中,不僅彌合方言識別對自身業(yè)務(wù)的影響,而且在業(yè)內(nèi)知名的Kespeech 開源方言數(shù)據(jù)集性能對比測試中,字錯率刷新模型最低值,達到國內(nèi)頂尖水平。
圖:Kespeech 開源方言數(shù)據(jù)集性能對比
據(jù)悉,QI語精靈是奇富科技全自研智能語音模型,此次升級依托自身豐富的貸后提醒及方言數(shù)據(jù)樣本,不僅延續(xù)了對國內(nèi)八種主流地區(qū)方言的覆蓋,包括東北官話、膠遼官話、北京官話、冀魯官話、中原官話、江淮官話、蘭銀官話和西南官話,還特別針對四川、重慶、山東、河南、貴州等用戶分布較多的地區(qū)方言的識別能力進行了強化,平均識別準(zhǔn)確率相對提升了25%,川渝地區(qū)方言識別準(zhǔn)確率相對提升超35%。同時,融合方言信息提取模塊,它能夠自動識別不同口音,并在時間維度上對文字進行解碼修正,將方言口音的語音識別誤差率降低了30%以上,整體語音識別字錯率降低了16%以上,顯著提升了用戶體驗。
在模型結(jié)構(gòu)上,QI語精靈依托全自研的Qifusion結(jié)構(gòu),突破傳統(tǒng)方言識別模型受限于地區(qū)先驗條件,需預(yù)先知曉方言種類才能準(zhǔn)確識別的局限,無需方言種類的先驗條件,便能直接進行精準(zhǔn)的識別和轉(zhuǎn)譯。并創(chuàng)新采用了多任務(wù)學(xué)習(xí)方法,在復(fù)雜的通話環(huán)境下實現(xiàn)了超過93%的語音識別綜合準(zhǔn)確率。此外,意圖識別功能同樣表現(xiàn)出色,準(zhǔn)確率超過95%,能夠迅速而準(zhǔn)確地識別用戶需求并做出響應(yīng)。
在業(yè)務(wù)應(yīng)用上,基于QI語精靈提出的預(yù)訓(xùn)練方言信息模塊及增量業(yè)務(wù)數(shù)據(jù)訓(xùn)練策略的結(jié)合,能大幅提升智能營銷、貸后提醒、風(fēng)險控制業(yè)務(wù)應(yīng)用場景識別準(zhǔn)確率。在智能電銷及貸后客戶溝通服務(wù)中,QI語精靈能將大量的語音轉(zhuǎn)寫成文字,無論是標(biāo)準(zhǔn)的普通話還是方言口音都能精準(zhǔn)捕捉并轉(zhuǎn)寫,大幅減輕客服人員的工作壓力。同時,能快速且準(zhǔn)確地解析用戶需求并作出響應(yīng),為用戶提供精準(zhǔn)高效的服務(wù)體驗。
據(jù)介紹QI語精靈技術(shù)在實際應(yīng)用中展現(xiàn)出的顯著成效得益于奇富科技在人工智能語音領(lǐng)域的持續(xù)研究與開發(fā)積累?!禘den-TTS:一種簡單高效的非自回歸“端到端可微分”神經(jīng)網(wǎng)絡(luò)的語音合成架構(gòu)》、《基于多粒度Transformer的多模態(tài)情緒識別》和《基于SE模塊和多尺度特征學(xué)習(xí)的語音情感識別》等多篇論文被ICASSP和 INTERSPEECH兩大頂級語音領(lǐng)域的國際學(xué)術(shù)會議連續(xù)收錄。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )