業(yè)界唯一!科大訊飛發(fā)布首個基于全國產(chǎn)算力的深度推理大模型X1

1月15日,科大訊飛發(fā)布了當前全國產(chǎn)算力平臺上唯一的深度推理大模型——訊飛星火X1。該模型中文數(shù)學能力國內(nèi)第一,并率先應(yīng)用于教育、醫(yī)療等剛需場景。

同時,訊飛星火4.0 Turbo底座能力再次迎來全新升級,圖文、數(shù)學和長文本能力顯著提升,并首發(fā)混域知識搜索技術(shù),進一步解決行業(yè)、企業(yè)痛點。

此外,作為國內(nèi)智能翻譯領(lǐng)域的佼佼者,科大訊飛還推出了業(yè)界首個具備端到端語音到語音同傳能力的大模型——星火語音同傳大模型,最快語音同傳時延小于5秒。

01

訊飛星火X1中文數(shù)學能力國內(nèi)第一,

率先落地真實場景

一直以來,訊飛星火堅持走全國產(chǎn)化路線。盡管在全國產(chǎn)算力平臺上訓練深度推理模型遭遇了諸多挑戰(zhàn),但科大訊飛攜手華為,成功攻克了訓練推理強交互、高吞吐推理優(yōu)化以及國產(chǎn)算子優(yōu)化等一系列難題,最終成功訓練出我國首個基于全國產(chǎn)算力訓練的具備深度思考和推理能力的大模型——訊飛星火X1。

發(fā)布會上,科大訊飛研究院的研究員們依次展示了訊飛星火X1解答高考題、AIME競賽題以及高中奧賽題的表現(xiàn)。訊飛星火X1不僅準確給出了這些題目的答案,還對解題思路和步驟進行了詳細拆解。與通用大模型相比,其解題過程更接近人類的“慢思考”方式。

過程中,訊飛星火X1充分展現(xiàn)深度推理模型的三大典型特征:化繁為簡,將復雜問題分步拆解簡化;進行自我探索和反思驗證;基于答案正確與否的優(yōu)質(zhì)反饋信息進行強化訓練。

值得一提的是,訊飛星火X1在近期參加的小初高(含競賽)、大學(含競賽)、AIME、MATH 500等多項“考試”中成績十分亮眼,用更少的算力,實現(xiàn)了業(yè)界一流的效果,多項指標國內(nèi)第一。

“大模型發(fā)展,應(yīng)用才是硬道理”是科大訊飛一直秉持的觀點。

目前,訊飛星火X1率先在教育等真實場景中實現(xiàn)了應(yīng)用落地。去年1024,科大訊飛聯(lián)合中國教育科學研究院發(fā)布了基于“問題鏈”的高中數(shù)學智能教師助手。同時也正面向全國百個試點區(qū)域、聯(lián)合千名優(yōu)秀教研員和老師打造上萬個優(yōu)秀案例。目前,星火X1已經(jīng)部署上述試點區(qū)域,并廣獲好評,體驗過的老師們紛紛表示,X1在一題多解、教學知識關(guān)聯(lián)、拓展學生高階思維等方面表現(xiàn)出色。訊飛星火X1也將成為學生和家長的幫手,隨著相關(guān)技術(shù)的深度融入,科大訊飛AI學習機學習推薦和診斷將變得更加精準,解題思路和知識鏈條將更加清晰,后續(xù)也將持續(xù)升級。

醫(yī)療領(lǐng)域,訊飛星火X1的模型策略已取得初步驗證成效,可使得??戚o助診斷和復雜病歷內(nèi)涵質(zhì)控的準確率均達90%。發(fā)布會上,科大訊飛還宣布將在今年上半年正式發(fā)布基于訊飛星火X1的醫(yī)療大模型升級版,確保其深層次診斷推理效果和質(zhì)控能力業(yè)界領(lǐng)先。

02

訊飛星火4.0 Turbo底座能力再升級,

成為更懂行業(yè)的大模型

此次發(fā)布會,訊飛星火4.0 Turbo底座能力實現(xiàn)了全新升級,七大核心能力全面提升,全面對標OpenAI 最新版的GPT-4o。此次升級最重要的特點,是針對行業(yè)、企業(yè)的痛點問題,在數(shù)學能力、行業(yè)知識、圖文識別、長文本能力等能力上實現(xiàn)提升。

數(shù)學能力一直是訊飛星火的強項,此次基于訊飛星火X1的高質(zhì)量合成數(shù)據(jù),訊飛星火4.0 Turbo的數(shù)學能力變得更強,可以在數(shù)學教學、金融分析和科研推演等工作中更好的幫助用戶。

圖文識別能力直接關(guān)乎著企業(yè)能否高效的采編和利用行業(yè)、私域數(shù)據(jù),是大模型“學習”的基礎(chǔ)。在各行各業(yè)的實際工作中,經(jīng)常面臨圖文識別的“疑難雜癥”:如醫(yī)療的體檢報告、法院的文書、學術(shù)論文、企業(yè)合同等,還有復雜長表格、雜亂板式、手寫公式、印章手寫合同、傾斜少線等情況,訊飛星火4.0 Turbo圖文識別能力升級,使得通用文檔版面分析、文字識別的準確率相對提升了40%,復雜表格結(jié)構(gòu)、潦草手寫文字等方面的準確率相對提升了60%,可以解決上述難題、大幅提升高價值數(shù)據(jù)的獲取能力。對比測試表明,訊飛星火4.0 Turbo的圖文識別能力顯著領(lǐng)先國內(nèi)外頂尖競品。

此次升級還針對性地提升了文檔要素檢測能力,在知識切分和構(gòu)建的粒度上更加精細、準確,能有效防止大模型幻覺,同時發(fā)布了掃描文檔解析的極速版本,文檔理解速度提升了10倍以上。對于一份500頁的項目文件,從掃描、識別到解析的全過程,僅需2分鐘即可全部完成。

大模型的長文本能力一直是用戶關(guān)注的重點,特別是在企業(yè)知識問答這類嚴謹?shù)膽?yīng)用場景中,用戶對大模型幻覺的容忍度幾乎為零。因此,訊飛星火推出了基于智能體的全新長文本框架,并行業(yè)首發(fā)了句子級溯源功能。這一新框架優(yōu)化了超長注意力機制,同時利用大規(guī)模網(wǎng)頁和書籍數(shù)據(jù)進行知識關(guān)聯(lián)式合成,使得知識回復的錯誤率降低了40%,句子級溯源效果更是超越了GPT-4o,顯著緩解了問答搜索服務(wù)中因大模型幻覺而需要反復溯源確認的應(yīng)用落地難題。

考慮到不少用戶在寫報告、做調(diào)研這類工作時,往往需要花費大量時間搜集信息、整理資料,基于圖文、長文本能力的提升和行業(yè)應(yīng)用能力的積累,訊飛星火行業(yè)首發(fā)了混域知識搜索技術(shù)。該技術(shù)能夠?qū)崿F(xiàn)對個人知識、企業(yè)知識、業(yè)務(wù)系統(tǒng)數(shù)據(jù)、精品行業(yè)數(shù)據(jù)以及互聯(lián)網(wǎng)信息的綜合搜索,用戶只需一次提問,即可獲得綜合搜索后的結(jié)果,大大提升信息搜索效率。

根據(jù)第三方數(shù)據(jù),2024年,訊飛星火在大模型中標數(shù)量和中標金額上取得“雙第一”,尤其是在能源、金融、汽車、運營商等行業(yè),與客戶共同打磨了近百個智能體應(yīng)用。

基于“技術(shù)+應(yīng)用”的不斷正向循環(huán),訊飛星火4.0 Turbo的行業(yè)能力全面提升,金融、油氣、能源、電力、鋼鐵、 航司等領(lǐng)域綜合能力的絕對提升全部超過10%,可以說是“最懂行業(yè)的大模型”。

03

首發(fā)星火語音同傳大模型,

助力全系產(chǎn)品翻譯能力提升

作為國內(nèi)智能翻譯領(lǐng)域的領(lǐng)軍者,科大訊飛不僅擁有在業(yè)內(nèi)率先通過全國翻譯專業(yè)資格考試的機器翻譯系統(tǒng),且在最近連續(xù)3屆IWSLT國際口語機器翻譯比賽都獲得了冠軍。發(fā)布會上,科大訊飛帶來了在智能翻譯領(lǐng)域又一突破:針對日常對話、商務(wù)交流、行業(yè)翻譯等國際交流場景中的高難度同傳翻譯需求,發(fā)布了國內(nèi)首個具備端到端語音同傳能力的大模型——星火語音同傳大模型。

眾所周知,語音同傳的技術(shù)難度較高,“現(xiàn)在大模型能力的發(fā)展,結(jié)合訊飛在智能語音技術(shù)上的獨特算法積累,可以做端到端的語音同傳?!睋?jù)了解,該模型通過模仿人類同傳譯員的思維鏈路進行訓練,具備實時意群理解和切分、上下文語境精準選詞以及碎片化信息重組的能力,這一特性使得星火語音同傳大模型在處理復雜句式和語境時表現(xiàn)出色,能夠迅速準確地傳達原意。

技術(shù)測試結(jié)果顯示,即便將訊飛的語音同傳技術(shù)和國外最優(yōu)競品的交傳技術(shù)對比,訊飛語音同傳在內(nèi)容完整度、信息準確度以及語言質(zhì)量上都處于領(lǐng)先水平,同時星火語音同傳大模型還可以最快實現(xiàn)僅5秒的同傳時延,達到人類專家譯員的水平。

集成了最新的同傳技術(shù)的產(chǎn)品用起來怎么樣?訊飛翻譯機的產(chǎn)品經(jīng)理也進行了演示。無論是海外旅游場景中的景點介紹,還是國際展會上的專業(yè)產(chǎn)品介紹,翻譯機能在短時間內(nèi)完成高質(zhì)量的英到中和中到英的雙向同傳任務(wù)。

除了端到端的語音同傳能力,星火語音同傳大模型還促進了語音到文字翻譯效果的提升,使得科大訊飛全系產(chǎn)品的翻譯能力都得到顯著提升,在日常對話、單人演講、影視節(jié)目,包括場景更復雜、翻譯難度更高的多人會議等場景以及醫(yī)療等專業(yè)領(lǐng)域,為各種國際交流場景提供高質(zhì)量翻譯服務(wù)。

發(fā)布會最后,科大訊飛透露,針對語音到語音的同傳場景,訊飛翻譯機將會配置耳機、音箱、麥克風,在2025年推出商務(wù)套裝,滿足用戶在不同的商務(wù)洽談場景的使用需求。(Suky)

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2025-01-15
業(yè)界唯一!科大訊飛發(fā)布首個基于全國產(chǎn)算力的深度推理大模型X1
1月15日,科大訊飛發(fā)布了當前全國產(chǎn)算力平臺上唯一的深度推理大模型——訊飛星火X1。

長按掃碼 閱讀全文