表現(xiàn)搶眼!中關(guān)村論壇年會(huì)這位AI播報(bào)員“說”得比真人還好

在剛剛落幕的2024年中關(guān)村論壇年會(huì)上,來自全球100多個(gè)國(guó)家和地區(qū)、150余家外國(guó)政府部門和國(guó)際組織機(jī)構(gòu)的上百位頂尖專家、上千名演講嘉賓齊聚一堂,世界的目光聚焦中國(guó),共同見證一場(chǎng)科技創(chuàng)新的盛宴。

全球首個(gè)通用人工智能系統(tǒng)原型“通通”、駕馭激光的利器“轉(zhuǎn)角菱方氮化硼”材料、拓展“心有靈犀”邊界的“北腦二號(hào)”智能腦機(jī)系統(tǒng)……在2024中關(guān)村論壇年會(huì)重大成果發(fā)布環(huán)節(jié),10項(xiàng)具有創(chuàng)新性、前瞻性、顛覆性的重大科技成果亮相,涉及基礎(chǔ)研究、前沿技術(shù)、科技基礎(chǔ)設(shè)施等各方面。

“就像是真人在說話一樣。”科大訊飛運(yùn)用先進(jìn)的語音合成技術(shù),為成果亮相視頻環(huán)節(jié)進(jìn)行AI配音,為傳統(tǒng)會(huì)議模式帶來了創(chuàng)新突破。

借助深度學(xué)習(xí)技術(shù),科大訊飛將文本轉(zhuǎn)化成擬人化的語音,賦予機(jī)器像人一樣自然流暢說話的能力,成為語音交互、語音翻譯的關(guān)鍵接口能力。

作為人工智能領(lǐng)域的龍頭企業(yè),科大訊飛在智能語音技術(shù)領(lǐng)域的深耕已有25年之久。自上世紀(jì)90年代開始探索語音領(lǐng)域以來,科大訊飛始終堅(jiān)持源頭技術(shù)創(chuàng)新,連續(xù)14年蟬聯(lián)國(guó)際語音合成大賽冠軍,并在語音識(shí)別、機(jī)器翻譯等領(lǐng)域多次在國(guó)際大賽上奪冠。

如今,科大訊飛不僅將中文語音技術(shù)做到了最好,還將多語種語音技術(shù)做到了最好。2020年,科大訊飛60個(gè)語種的語音識(shí)別、翻譯和37個(gè)語種的語音合成技術(shù)已達(dá)到國(guó)際領(lǐng)先水平,超越了谷歌、微軟等國(guó)際巨頭,達(dá)到國(guó)際領(lǐng)先水平。2021年,科大訊飛在美國(guó)國(guó)家標(biāo)準(zhǔn)與技術(shù)研究院NIST發(fā)起的國(guó)際低資源多語種語音識(shí)別競(jìng)賽OpenASR中,獲得全部受限賽道的15個(gè)語種冠軍及7個(gè)語種非受限賽道冠軍。目前,科大訊飛的多語種技術(shù)已經(jīng)可以滿足60余種語言的智能語音技術(shù)需求。

今年1月份,科大訊飛結(jié)合語音屬性解耦、多語種共享建模等技術(shù)創(chuàng)新發(fā)布訊飛星火語音大模型,在多語種語音識(shí)別方面首批37個(gè)主流語種效果超過OpenAI Whisper V3。星火語音大模型首批覆蓋語種中,24個(gè)主要語種識(shí)別率達(dá)到了90%,13個(gè)重點(diǎn)語種識(shí)別率更是超過了94%。在多語種語音合成能力方面,27個(gè)主要語種MOS評(píng)分達(dá)到了4.4,13個(gè)重點(diǎn)語種MOS評(píng)分高達(dá)4.6。

4月26日,訊飛星火大模型V3.5春季上新,科大訊飛發(fā)布業(yè)界首個(gè)支持長(zhǎng)文本、長(zhǎng)圖文以及長(zhǎng)語音的大模型產(chǎn)品。在此次升級(jí)中,面對(duì)廣泛的音視頻信息高效獲取需求,科大訊飛推出長(zhǎng)語音功能,將語音識(shí)別和翻譯技術(shù)結(jié)合起來,可以實(shí)現(xiàn)會(huì)議錄音、學(xué)習(xí)視頻等的一鍵研讀,實(shí)現(xiàn)音視頻場(chǎng)景的高效知識(shí)獲取。

科大訊飛進(jìn)一步升級(jí)星火語音大模型,首發(fā)多情感超擬人合成,情緒表達(dá)的可感知度達(dá)到 85% 以上,對(duì)高興、抱歉、安慰、撒嬌、困惑等語氣表達(dá)更加生動(dòng),可以滿足用戶在各種場(chǎng)景下的自我減壓、釋放情緒等需求,并推出一句話聲音復(fù)刻功能。

在2024中關(guān)村論壇年會(huì)上,科大訊飛智能語音技術(shù)的出色表現(xiàn),展示了中國(guó)科技企業(yè)在人工智能領(lǐng)域的技術(shù)實(shí)力和創(chuàng)新能力。在科大訊飛等中國(guó)企業(yè)的努力下,智能語音技術(shù)將為人類帶來更多便捷和智慧,引領(lǐng)科技創(chuàng)新的未來。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )