聲紋識別(Voiceprint Recognition,VPR)也稱說話人識別,是一種通過聲音判別說話人身份的技術(shù),分為說話人辨識和說話人確認(rèn)。前者用以判斷某段語音是若干人中的哪一個(gè)所說的,即“ N 選一”;后者用以確認(rèn)某段語音是否是指定的某人所說,是“1對1匹配”問題。不同的任務(wù)和應(yīng)用會使用不同的聲紋識別技術(shù),如縮小刑偵范圍時(shí)可能需要辨認(rèn)技術(shù),而銀行交易時(shí)則需用到確認(rèn)技術(shù)。
云知聲在聲紋技術(shù)領(lǐng)域深耕多年,是國內(nèi)為數(shù)不多具備全棧語音技術(shù)能力的人工智能公司。早在 2004 年,尚就職于摩托羅拉公司的云知聲創(chuàng)始人黃偉博士便帶領(lǐng)團(tuán)隊(duì)研發(fā)出世界上第一款手機(jī)聲紋認(rèn)證系統(tǒng),搭載該系統(tǒng)的相關(guān)產(chǎn)品總計(jì)銷量超 2 億臺。
雖然聲紋識別優(yōu)勢明顯,但要想準(zhǔn)確分辨聲音特征卻并非易事。首先,聲紋識別系統(tǒng)性能會受用戶發(fā)聲狀態(tài)影響,如用戶的身體狀況、情緒等都會影響識別準(zhǔn)確度。其次,環(huán)境的嘈雜度,以及采集、傳輸音頻的硬件配置,都會在不同程度上對識別系統(tǒng)行成干擾。為解決上述問題,云知聲聲紋技術(shù)團(tuán)隊(duì)進(jìn)行了一系列技術(shù)攻堅(jiān)與創(chuàng)新。
首先,依托云知聲強(qiáng)大的語音信號前端處理技術(shù),如 VAD、語音降噪等,準(zhǔn)確地捕捉到人聲并進(jìn)行背景噪聲消除。
其次,云知聲將 DNN 引入到傳統(tǒng)聲紋識別 ivector 技術(shù)框架中,并融合最新端到端聲紋識別技術(shù),基于云知聲超算平臺和海量聲紋訓(xùn)練數(shù)據(jù),使得模型得以學(xué)習(xí)到數(shù)萬說話人,每人多種發(fā)聲的特性,且在云端針對每個(gè)用戶采用說話人自適應(yīng)技術(shù),達(dá)到越用越好的效果。在信道處理上,采用 PLDA 信道補(bǔ)償技術(shù),可將信道影響降到最小。
近年來,伴隨深度學(xué)習(xí)的興起,云知聲在國內(nèi)率先將深度學(xué)習(xí)技術(shù)使用到語音識別中,且后續(xù)引入到聲紋識別領(lǐng)域,解決了一系列聲紋技術(shù)實(shí)用難點(diǎn),并應(yīng)用到實(shí)際產(chǎn)品上。
在1月7日政法委“新時(shí)代市域社會治理智能應(yīng)用交流展”上,云知聲在公檢法領(lǐng)域的聲紋身份驗(yàn)證和反欺詐方案得到了各級政法委領(lǐng)導(dǎo)的高度贊揚(yáng),表示這才是真正的“智治”,讓AI成為政府和社會組織實(shí)施精準(zhǔn)治理、智能治理的重要利器,協(xié)助公安部門減少案發(fā)、更快破案,為平安城市保駕護(hù)航。
近日,中國領(lǐng)先的一站式醫(yī)療健康生態(tài)平臺平安好醫(yī)生宣布,由云知聲提供聲紋技術(shù)支持的平安好醫(yī)生客戶端“聲紋登陸系統(tǒng)”在經(jīng)過多次模型優(yōu)化和升級迭代后,登陸成功率接近99%,達(dá)行業(yè)一流水準(zhǔn)。
與此同時(shí),為保障用戶登陸的“安全性”,云知聲為平安好醫(yī)生客戶端聲紋登錄系統(tǒng)提供數(shù)字串注冊和登錄的“文本弱相關(guān)”技術(shù),工程難度更高,安全性更強(qiáng)。在同一賬號下,云知聲聲紋識別產(chǎn)品可支持 6 人注冊。在客戶端云知聲提供封裝好的 SDK,支持聲紋注冊、登錄、解綁等接口,供上層調(diào)用 API 實(shí)現(xiàn)產(chǎn)品邏輯。
此外,云知聲與國家電網(wǎng)合作的會議系統(tǒng)聲紋識別項(xiàng)目更是實(shí)現(xiàn)了10人以內(nèi)聲紋庫識別率高達(dá)90%以上。此系統(tǒng)采用云知聲最先進(jìn)的聲紋識別、語音識別技術(shù),準(zhǔn)確識別會議中的發(fā)言人身份和發(fā)言內(nèi)容,形成完整會議記錄,方便歸檔、追溯,實(shí)現(xiàn)會議全過程的數(shù)字化,推動會議管理的智能化發(fā)展。
同時(shí),云知聲還提供成熟的聲紋服務(wù)私有化部署方案,基于在金融、客服、快遞等不同行業(yè)豐富的私有云部署經(jīng)驗(yàn),可有效保障客戶數(shù)據(jù)安全。未來,云知聲將更成熟、更先進(jìn)的聲紋技術(shù)與產(chǎn)品應(yīng)用到金融、醫(yī)療、教育、公檢法等領(lǐng)域。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 新能源車技術(shù)升級搶先看,ChatGPT崩了引熱議:未來科技如何破局?
- 自動駕駛行業(yè)大洗牌即將結(jié)束,小馬智行引領(lǐng)千臺車隊(duì)新篇章
- 微軟反壟斷風(fēng)暴:Office捆綁銷售引質(zhì)疑,云服務(wù)策略遭調(diào)查,巨頭陷困境
- 顯卡漲價(jià)風(fēng)暴來襲!NVIDIA/AMD緊急應(yīng)對,全力加速生產(chǎn)運(yùn)回本土
- 微軟新目標(biāo):用1000億美元打造實(shí)用通用AI,未來可期但需謹(jǐn)慎
- 亞馬遜云科技陳曉建預(yù)測:未來三年內(nèi),生成式AI將引發(fā)云市場新革命
- 林肯中國辟謠:財(cái)務(wù)調(diào)整非合并,業(yè)務(wù)不變穩(wěn)如泰山
- 字節(jié)跳動研發(fā)大手筆:2024年投入接近BAT之和,能否引領(lǐng)中國OpenAI新潮流?
- 跨境匯款平臺新舉措:螞蟻集團(tuán)開發(fā)者服務(wù)限每日10萬美元,助力全球交易更便捷
- 我國充電樁建設(shè)提速,50%增長背后的高速服務(wù)區(qū)充電新篇章
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。