表現(xiàn)搶眼!中關(guān)村論壇年會(huì)這位AI播報(bào)員“說(shuō)”得比真人還好

在剛剛落幕的2024年中關(guān)村論壇年會(huì)上,來(lái)自全球100多個(gè)國(guó)家和地區(qū)、150余家外國(guó)政府部門和國(guó)際組織機(jī)構(gòu)的上百位頂尖專家、上千名演講嘉賓齊聚一堂,世界的目光聚焦中國(guó),共同見證一場(chǎng)科技創(chuàng)新的盛宴。

全球首個(gè)通用人工智能系統(tǒng)原型“通通”、駕馭激光的利器“轉(zhuǎn)角菱方氮化硼”材料、拓展“心有靈犀”邊界的“北腦二號(hào)”智能腦機(jī)系統(tǒng)……在2024中關(guān)村論壇年會(huì)重大成果發(fā)布環(huán)節(jié),10項(xiàng)具有創(chuàng)新性、前瞻性、顛覆性的重大科技成果亮相,涉及基礎(chǔ)研究、前沿技術(shù)、科技基礎(chǔ)設(shè)施等各方面。

“就像是真人在說(shuō)話一樣。”科大訊飛運(yùn)用先進(jìn)的語(yǔ)音合成技術(shù),為成果亮相視頻環(huán)節(jié)進(jìn)行AI配音,為傳統(tǒng)會(huì)議模式帶來(lái)了創(chuàng)新突破。

借助深度學(xué)習(xí)技術(shù),科大訊飛將文本轉(zhuǎn)化成擬人化的語(yǔ)音,賦予機(jī)器像人一樣自然流暢說(shuō)話的能力,成為語(yǔ)音交互、語(yǔ)音翻譯的關(guān)鍵接口能力。

作為人工智能領(lǐng)域的龍頭企業(yè),科大訊飛在智能語(yǔ)音技術(shù)領(lǐng)域的深耕已有25年之久。自上世紀(jì)90年代開始探索語(yǔ)音領(lǐng)域以來(lái),科大訊飛始終堅(jiān)持源頭技術(shù)創(chuàng)新,連續(xù)14年蟬聯(lián)國(guó)際語(yǔ)音合成大賽冠軍,并在語(yǔ)音識(shí)別、機(jī)器翻譯等領(lǐng)域多次在國(guó)際大賽上奪冠。

如今,科大訊飛不僅將中文語(yǔ)音技術(shù)做到了最好,還將多語(yǔ)種語(yǔ)音技術(shù)做到了最好。2020年,科大訊飛60個(gè)語(yǔ)種的語(yǔ)音識(shí)別、翻譯和37個(gè)語(yǔ)種的語(yǔ)音合成技術(shù)已達(dá)到國(guó)際領(lǐng)先水平,超越了谷歌、微軟等國(guó)際巨頭,達(dá)到國(guó)際領(lǐng)先水平。2021年,科大訊飛在美國(guó)國(guó)家標(biāo)準(zhǔn)與技術(shù)研究院NIST發(fā)起的國(guó)際低資源多語(yǔ)種語(yǔ)音識(shí)別競(jìng)賽OpenASR中,獲得全部受限賽道的15個(gè)語(yǔ)種冠軍及7個(gè)語(yǔ)種非受限賽道冠軍。目前,科大訊飛的多語(yǔ)種技術(shù)已經(jīng)可以滿足60余種語(yǔ)言的智能語(yǔ)音技術(shù)需求。

今年1月份,科大訊飛結(jié)合語(yǔ)音屬性解耦、多語(yǔ)種共享建模等技術(shù)創(chuàng)新發(fā)布訊飛星火語(yǔ)音大模型,在多語(yǔ)種語(yǔ)音識(shí)別方面首批37個(gè)主流語(yǔ)種效果超過(guò)OpenAI Whisper V3。星火語(yǔ)音大模型首批覆蓋語(yǔ)種中,24個(gè)主要語(yǔ)種識(shí)別率達(dá)到了90%,13個(gè)重點(diǎn)語(yǔ)種識(shí)別率更是超過(guò)了94%。在多語(yǔ)種語(yǔ)音合成能力方面,27個(gè)主要語(yǔ)種MOS評(píng)分達(dá)到了4.4,13個(gè)重點(diǎn)語(yǔ)種MOS評(píng)分高達(dá)4.6。

4月26日,訊飛星火大模型V3.5春季上新,科大訊飛發(fā)布業(yè)界首個(gè)支持長(zhǎng)文本、長(zhǎng)圖文以及長(zhǎng)語(yǔ)音的大模型產(chǎn)品。在此次升級(jí)中,面對(duì)廣泛的音視頻信息高效獲取需求,科大訊飛推出長(zhǎng)語(yǔ)音功能,將語(yǔ)音識(shí)別和翻譯技術(shù)結(jié)合起來(lái),可以實(shí)現(xiàn)會(huì)議錄音、學(xué)習(xí)視頻等的一鍵研讀,實(shí)現(xiàn)音視頻場(chǎng)景的高效知識(shí)獲取。

科大訊飛進(jìn)一步升級(jí)星火語(yǔ)音大模型,首發(fā)多情感超擬人合成,情緒表達(dá)的可感知度達(dá)到 85% 以上,對(duì)高興、抱歉、安慰、撒嬌、困惑等語(yǔ)氣表達(dá)更加生動(dòng),可以滿足用戶在各種場(chǎng)景下的自我減壓、釋放情緒等需求,并推出一句話聲音復(fù)刻功能。

在2024中關(guān)村論壇年會(huì)上,科大訊飛智能語(yǔ)音技術(shù)的出色表現(xiàn),展示了中國(guó)科技企業(yè)在人工智能領(lǐng)域的技術(shù)實(shí)力和創(chuàng)新能力。在科大訊飛等中國(guó)企業(yè)的努力下,智能語(yǔ)音技術(shù)將為人類帶來(lái)更多便捷和智慧,引領(lǐng)科技創(chuàng)新的未來(lái)。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )