成人a毛片免费全部播放,99精品国产高清自在线看超,国产免费一区二区三区久久

人工智能時(shí)代，自主可控的AI技術(shù)尤為重要。以正處于黃金期的智能語音技術(shù)為例，據(jù)國際數(shù)據(jù)公司IDC分析，2030年，全球智能語音服務(wù)市場規(guī)模將達(dá)約731.6 億美元，復(fù)合增長率27%。如此龐大的市場、如此關(guān)鍵的技術(shù)，中國如何不被“卡脖子”?以科大訊飛為代表的中國科技企業(yè)給出答案：自主創(chuàng)新。

(一)智能語音前景廣闊

在教室，老師通過遙控器和智能黑板直接對話;在家里，空調(diào)、電視機(jī)等家電早已實(shí)現(xiàn)語音控制;駕車行駛在路上，一句指令就能操控汽車;會議室里，多人發(fā)言都能立刻被清晰錄音并轉(zhuǎn)寫成文字、生成會議紀(jì)要……語音，是人類最自然便捷的溝通方式。智能語音技術(shù)不僅能夠賦能智慧教育、智慧城市、智慧醫(yī)療等多個(gè)領(lǐng)域，還能加載智能終端，為工作和生活帶來更多便利和可能性，正潤物細(xì)無聲地改變著人們的生活。

作為新一代信息技術(shù)和人工智能產(chǎn)業(yè)的重要組成部分，智能語音不斷實(shí)現(xiàn)關(guān)鍵技術(shù)突破，精度、速度與智能化水平正在逐年提升。在實(shí)際應(yīng)用環(huán)境的匹配度方面，相關(guān)技術(shù)產(chǎn)品已經(jīng)可以滿足“混合語種”“復(fù)雜環(huán)境”“多人交互”等更為高端的任務(wù)需求。尤其是隨著智能語音技術(shù)與認(rèn)知大模型技術(shù)持續(xù)融合，場景邊界、內(nèi)容價(jià)值被進(jìn)一步拓寬，其市場應(yīng)用范圍也在持續(xù)擴(kuò)大，讓機(jī)器從“能聽會說”到“能理解會思考”，變得越來越“懂你”。

(二)中國的語音技術(shù)要掌握在中國人自己手里

而在20世紀(jì)90年代，中國的智能語音技術(shù)和語音產(chǎn)業(yè)還是外國人的天下，微軟、谷歌、英特爾等企業(yè)紛紛在中國設(shè)研究院。如今的人工智能龍頭企業(yè)科大訊飛正是在這種情況下誕生。

創(chuàng)始人劉慶峰和幾位同學(xué)當(dāng)時(shí)還是中國科學(xué)技術(shù)大學(xué)的學(xué)生，在導(dǎo)師王仁華的支持下，立志“中文語音技術(shù)要由中國人做到世界最好，中文語音產(chǎn)業(yè)要掌握在中國人自己手上”，創(chuàng)立了科大訊飛。

經(jīng)過多年研究和實(shí)踐，科大訊飛不僅將中文語音技術(shù)做到最好，也將多語種技術(shù)做到全球領(lǐng)先。語音識別的準(zhǔn)確率達(dá)到98%，多人會議場景的說話人分離和識別的準(zhǔn)確率達(dá)到95%。2021年，科大訊飛在美國國家標(biāo)準(zhǔn)與技術(shù)研究院NIST發(fā)起的國際低資源多語種語音識別競賽OpenASR中，獲得全部受限賽道的15個(gè)語種冠軍及7個(gè)語種非受限賽道冠軍。

科大訊飛的多語種技術(shù)爆發(fā)，是在2019年。當(dāng)年10月8日，美國商務(wù)部突然宣布把科大訊飛、?？低暤?家中國人工智能企業(yè)列入實(shí)體名單。當(dāng)時(shí)，科大訊飛已儲備了11種語音的多語種技術(shù)。被列入實(shí)體清單之后，科大訊飛啟動緊急預(yù)案，迅速攻關(guān)，進(jìn)行40多種語種的研發(fā)。當(dāng)時(shí)，華為也在被制裁，沒有多語種技術(shù)，華為手機(jī)等設(shè)備在超過75個(gè)國家/地區(qū)的銷售都受到極大影響。華為終端部門從全球66個(gè)供應(yīng)商中經(jīng)過細(xì)致甄選，最終選擇科大訊飛作為多語種供應(yīng)商，保證了2020年3月的海外產(chǎn)品發(fā)布。

如今，在中國智能語音市場，科大訊飛的市場占有率多年保持第一。以大熱的智能汽車行業(yè)為例，2023年，中國汽車出口量超過日本，躍居全球第一，而出海十強(qiáng)企業(yè)中，有8家都在和科大訊飛合作。科大訊飛多語種技術(shù)已經(jīng)可以覆蓋全球60多個(gè)語種，訊飛智能車載語音系統(tǒng)覆蓋23個(gè)主要語種，搭載車型已銷往亞洲、歐洲、南美等地的60多個(gè)國家和地區(qū)。

(三)語音大模型，要建立在自主可控的國產(chǎn)平臺上

2006—2019年，連續(xù)十四年榮獲國際語音合成大賽冠軍;2016—2023年，連續(xù)4屆獲得國際多通道語音分離和識別比賽CHiME冠軍;2021—2023年，連續(xù)三年獲得國際語音翻譯比賽IWSLT冠軍……

作為中國人工智能“國家隊(duì)”，科大訊飛代表中國取得了多項(xiàng)重要標(biāo)志性成果，逐漸構(gòu)建起獨(dú)立的語音自主知識產(chǎn)權(quán)技術(shù)體系。

如今，大模型的出現(xiàn)發(fā)展給語音技術(shù)帶來了新的前進(jìn)動力，結(jié)合大語言模型更精準(zhǔn)的語義理解和更精細(xì)的描述能力，語音合成表現(xiàn)力、長時(shí)的語音識別等語音各類任務(wù)也能快速突破效果的上限。

1月30日，科大訊飛發(fā)布基于首個(gè)全國產(chǎn)算力訓(xùn)練的訊飛星火V3.5，正式發(fā)布星火語音大模型，首批37個(gè)主流語種效果超過OpenAI Whisper V3。4月26日，訊飛星火大模型V3.5再次更新，發(fā)布業(yè)界首個(gè)支持長文本、長圖文以及長語音的大模型產(chǎn)品。

其長語音功能，可以實(shí)現(xiàn)會議錄音、學(xué)習(xí)視頻等的一鍵研讀，實(shí)現(xiàn)中英文等語言音視頻場景的高效知識獲取。

如今，一個(gè)自主可控的多語種智能語音技術(shù)及全球產(chǎn)業(yè)生態(tài)正在構(gòu)建?？拼笥嶏w的技術(shù)算法全部自研，目前，已建成5個(gè)國產(chǎn)化集群，語音合成、識別、翻譯、交互等國產(chǎn)化能力日服務(wù)8.73億次。2023年，訊飛與華為聯(lián)合攻關(guān)大模型國產(chǎn)化算力底座核心難題，建設(shè)首個(gè)全國產(chǎn)算力平臺“飛星一號”，填補(bǔ)了國產(chǎn)超大模型訓(xùn)練平臺空白。

客觀來說，中國的大模型技術(shù)與美國存在動態(tài)差距?？拼笥嶏w董事長劉慶峰表示：“我們應(yīng)正視差距，聚焦自主創(chuàng)新的底座大模型‘主戰(zhàn)場’，從國家層面聚焦資源加快追趕，同時(shí)系統(tǒng)性構(gòu)建通用人工智能生態(tài)和應(yīng)用，打造綜合優(yōu)勢。”

（免責(zé)聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請進(jìn)一步核實(shí)，并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏，概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí)，應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后，將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí)，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。）

語音大模型要建立在自主可控的平臺上，科大訊飛“多語種”正走向世界

語音大模型要建立在自主可控的平臺上，科大訊飛“多語種”正走向世界