“中文語音技術(shù)要由中國(guó)人做到最好,中文語音產(chǎn)業(yè)要掌握在我們自己手上。”二十多年前,正是憑借這股不屈不撓的信念,科大訊飛在劉慶峰的帶隊(duì)下艱難創(chuàng)業(yè),闖出了在中文語音產(chǎn)業(yè)的一片天。2024年開年,科大訊飛賦能語音產(chǎn)業(yè)再進(jìn)一步,科大訊飛正式發(fā)布星火語音大模型,實(shí)現(xiàn)了語音技術(shù)與大模型技術(shù)的協(xié)同共振,開啟了萬物互聯(lián)時(shí)代以語音大模型賦能千行百業(yè)的無限可能。
1月30日,科大訊飛在合肥總部正式發(fā)布星火語音大模型,其諸多亮點(diǎn)引發(fā)行業(yè)關(guān)注。根據(jù)發(fā)布會(huì)披露的信息,星火語音大模型效果驚艷,根據(jù)開源Fleurs集、語音交互實(shí)際應(yīng)用場(chǎng)景構(gòu)建測(cè)試集SPMASR-EVAL-V1.0對(duì)星火語音大模型和OpenAI Whisper V3的橫向測(cè)試結(jié)果顯示,星火語音大模型在首批37個(gè)主流語種的效果均保持勝出;而在多語種語音合成方面,星火語音大模型的首批40個(gè)語種平均MOS分絕對(duì)提升0.25,擬人度超83%。這充分說明,科大訊飛不僅有能力在中文語音領(lǐng)域做到最好,在多語種技術(shù)實(shí)力方面也是國(guó)際領(lǐng)先水平。
“大模型帶來了語音技術(shù)發(fā)展的全新機(jī)會(huì)。”劉慶峰在發(fā)布會(huì)上強(qiáng)調(diào)。星火語音大模型的重磅發(fā)布,是對(duì)智能語音技術(shù)的一次革新??拼笥嶏w作為人工智能領(lǐng)域的先行者,致力于讓機(jī)器“能聽會(huì)說,能理解會(huì)思考”,而有了領(lǐng)先的多語種語音合成和超擬人語音合成技術(shù),機(jī)器的聲音也可以像人類那樣繪聲繪色、情緒飽滿,充滿激情或溫度。劉慶峰表示:“借助大模型,我們讓一段語音具備更加豐富的屬性,有語種、有內(nèi)容、有韻律、有音色,還有情緒。”
得益于星火語音大模型讓機(jī)器更“聲情并茂”地表達(dá),使得它在千行百業(yè)能夠發(fā)揮出“1+1>2”的加持作用。在發(fā)布會(huì)上,劉慶峰宣布星火語音大模型全面賦能汽車、客服、陪伴機(jī)器人、家庭等更多場(chǎng)景應(yīng)用。
以大家熟知的汽車領(lǐng)域?yàn)槔?,目前中?guó)正處于燃油車到新能源汽車的轉(zhuǎn)型期,汽車電動(dòng)化、智能化與網(wǎng)聯(lián)化成為大勢(shì)所趨??拼笥嶏w率先將自主可控的星火大模型深入融合汽車座艙系統(tǒng),讓汽車根據(jù)語音意圖快速處理復(fù)雜的任務(wù),使得汽車語音交互不僅限于指令下達(dá),還可以自由聊天與知識(shí)提問,全方位解決用戶不同用車環(huán)境下的各類情景問題,真正做到只需動(dòng)口不動(dòng)手。而隨著星火語音大模型的發(fā)布,在助力車機(jī)實(shí)現(xiàn)更清晰、自然與情感化的語音合成功能基礎(chǔ)上,還大幅強(qiáng)化了海外語音能力。據(jù)悉,目前包括奇瑞、廣汽、長(zhǎng)城、長(zhǎng)安在內(nèi)的多家頭部車企與訊飛星火展開了合作,助力中國(guó)汽車“出海”遠(yuǎn)征,暢銷全球!
此外在客服領(lǐng)域,憑借星火大模型超擬人對(duì)話和更深刻的理解能力,“數(shù)字客服”能更準(zhǔn)確理解用戶真實(shí)需求與意圖,并通過不同的情緒表達(dá)與用戶交流,讓用戶感覺是在跟“人”對(duì)話,而不是冰冷的機(jī)器。當(dāng)然,星火語音大模型還可以在心理咨詢、輔助問診、旅游導(dǎo)覽等領(lǐng)域發(fā)揮重大作用。
在發(fā)布會(huì)上,星火語音大模型面向開發(fā)者正式全面開放。劉慶峰稱:“全新的語音大模型會(huì)賦能整個(gè)行業(yè),我相信萬物互聯(lián)時(shí)代一定會(huì)在新技術(shù)推動(dòng)下加速到來,訊飛星火V3.5和語音大模型的聯(lián)動(dòng)會(huì)極大地推動(dòng)產(chǎn)業(yè)升級(jí)”。顯然,星火語音大模型將為智能技術(shù)的應(yīng)用、推廣和擴(kuò)展提供更堅(jiān)實(shí)的基座,加速萬物互聯(lián)的時(shí)代的產(chǎn)業(yè)升級(jí),成為引爆智能語音技術(shù)革新的“奇點(diǎn)”。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )