聲紋識別(Voiceprint Recognition,VPR)也稱說話人識別,是一種通過聲音判別說話人身份的技術(shù),分為說話人辨識和說話人確認。前者用以判斷某段語音是若干人中的哪一個所說的,即“ N 選一”;后者用以確認某段語音是否是指定的某人所說,是“1對1匹配”問題。不同的任務(wù)和應(yīng)用會使用不同的聲紋識別技術(shù),如縮小刑偵范圍時可能需要辨認技術(shù),而銀行交易時則需用到確認技術(shù)。
云知聲在聲紋技術(shù)領(lǐng)域深耕多年,是國內(nèi)為數(shù)不多具備全棧語音技術(shù)能力的人工智能公司。早在 2004 年,尚就職于摩托羅拉公司的云知聲創(chuàng)始人黃偉博士便帶領(lǐng)團隊研發(fā)出世界上第一款手機聲紋認證系統(tǒng),搭載該系統(tǒng)的相關(guān)產(chǎn)品總計銷量超 2 億臺。
雖然聲紋識別優(yōu)勢明顯,但要想準確分辨聲音特征卻并非易事。首先,聲紋識別系統(tǒng)性能會受用戶發(fā)聲狀態(tài)影響,如用戶的身體狀況、情緒等都會影響識別準確度。其次,環(huán)境的嘈雜度,以及采集、傳輸音頻的硬件配置,都會在不同程度上對識別系統(tǒng)行成干擾。為解決上述問題,云知聲聲紋技術(shù)團隊進行了一系列技術(shù)攻堅與創(chuàng)新。
首先,依托云知聲強大的語音信號前端處理技術(shù),如 VAD、語音降噪等,準確地捕捉到人聲并進行背景噪聲消除。
其次,云知聲將 DNN 引入到傳統(tǒng)聲紋識別 ivector 技術(shù)框架中,并融合最新端到端聲紋識別技術(shù),基于云知聲超算平臺和海量聲紋訓(xùn)練數(shù)據(jù),使得模型得以學(xué)習(xí)到數(shù)萬說話人,每人多種發(fā)聲的特性,且在云端針對每個用戶采用說話人自適應(yīng)技術(shù),達到越用越好的效果。在信道處理上,采用 PLDA 信道補償技術(shù),可將信道影響降到最小。
近年來,伴隨深度學(xué)習(xí)的興起,云知聲在國內(nèi)率先將深度學(xué)習(xí)技術(shù)使用到語音識別中,且后續(xù)引入到聲紋識別領(lǐng)域,解決了一系列聲紋技術(shù)實用難點,并應(yīng)用到實際產(chǎn)品上。
在1月7日政法委“新時代市域社會治理智能應(yīng)用交流展”上,云知聲在公檢法領(lǐng)域的聲紋身份驗證和反欺詐方案得到了各級政法委領(lǐng)導(dǎo)的高度贊揚,表示這才是真正的“智治”,讓AI成為政府和社會組織實施精準治理、智能治理的重要利器,協(xié)助公安部門減少案發(fā)、更快破案,為平安城市保駕護航。
近日,中國領(lǐng)先的一站式醫(yī)療健康生態(tài)平臺平安好醫(yī)生宣布,由云知聲提供聲紋技術(shù)支持的平安好醫(yī)生客戶端“聲紋登陸系統(tǒng)”在經(jīng)過多次模型優(yōu)化和升級迭代后,登陸成功率接近99%,達行業(yè)一流水準。
與此同時,為保障用戶登陸的“安全性”,云知聲為平安好醫(yī)生客戶端聲紋登錄系統(tǒng)提供數(shù)字串注冊和登錄的“文本弱相關(guān)”技術(shù),工程難度更高,安全性更強。在同一賬號下,云知聲聲紋識別產(chǎn)品可支持 6 人注冊。在客戶端云知聲提供封裝好的 SDK,支持聲紋注冊、登錄、解綁等接口,供上層調(diào)用 API 實現(xiàn)產(chǎn)品邏輯。
此外,云知聲與國家電網(wǎng)合作的會議系統(tǒng)聲紋識別項目更是實現(xiàn)了10人以內(nèi)聲紋庫識別率高達90%以上。此系統(tǒng)采用云知聲最先進的聲紋識別、語音識別技術(shù),準確識別會議中的發(fā)言人身份和發(fā)言內(nèi)容,形成完整會議記錄,方便歸檔、追溯,實現(xiàn)會議全過程的數(shù)字化,推動會議管理的智能化發(fā)展。
同時,云知聲還提供成熟的聲紋服務(wù)私有化部署方案,基于在金融、客服、快遞等不同行業(yè)豐富的私有云部署經(jīng)驗,可有效保障客戶數(shù)據(jù)安全。未來,云知聲將更成熟、更先進的聲紋技術(shù)與產(chǎn)品應(yīng)用到金融、醫(yī)療、教育、公檢法等領(lǐng)域。
- 中國電影新篇章:哪吒2破百億,里程碑之下見證電影輝煌
- DeepSeek開發(fā)價值近乎零:博士大模型為何難逃閉源命運
- 周鴻祎自曝清白:為DeepSeek搖旗,稱其有顛覆性,理性推廣新創(chuàng)企業(yè)
- 蘋果研究人形機器人,字節(jié)因抄襲被判賠8266萬,科技巨頭新動態(tài)引發(fā)熱議
- 字節(jié)抄襲判賠8266萬,抖音副總裁回應(yīng):美攝前員工所寫,抄襲行為不可取
- 抖音集團回應(yīng)美攝起訴案:違規(guī)員工已經(jīng)離職,美攝索賠金額不合理
- 深度融合ChatBI,奇富科技Deepseek帶來全新數(shù)據(jù)洞察體驗
- 阿里巴巴助力iPhone,AI服務(wù)升級,科技巨頭如何合作共贏?
- 法拉第未來FF 91二手車賣出高價:首臺二手車誕生,23.5萬美元的轉(zhuǎn)售價值
- 自主崛起合資危機:上汽通用或關(guān)閉四大生產(chǎn)基地,競爭壓力山大
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。