百川智能發(fā)布一站式解決方案,1+3產(chǎn)品矩陣助力企業(yè)“多快好省”落地大模型

10月31日消息,百川智能推出一站式大模型商業(yè)化解決方案,即1+3產(chǎn)品矩陣(全鏈路優(yōu)質(zhì)通用訓練數(shù)據(jù),Baichuan4-Turbo、Baichuan4-Air兩款模型和全鏈路領域增強工具鏈),該方案“工具多、速度快、效果好、成本低”,能夠幫助企業(yè)以最低成本實現(xiàn)效果最佳的私有化部署。并支持企業(yè)將專有數(shù)據(jù)與百川智能自用的全鏈路優(yōu)質(zhì)訓練數(shù)據(jù)混合,對Baichuan4-Turbo、Baichuan4-Air兩款模型進行調(diào)優(yōu)和增強,實現(xiàn)了行業(yè)最高的96%多場景可用率。

企業(yè)多元場景可用率高達96%

眾所周知,盡管大模型具備良好的泛化能力,但由于每個企業(yè)都有自身獨特的專業(yè)知識和應用場景,直接應用通用模型無法達到理想效果,必須對模型進行定制化優(yōu)化使其適應特定領域和場景需求,而優(yōu)化后模型在多場景下的可用率是評估其價值的關鍵標準。此前行業(yè)的主流做法是將企業(yè)專有數(shù)據(jù)和通用數(shù)據(jù)混合定向調(diào)優(yōu)、增強通用模型,但受限于諸多因素,企業(yè)很難獲得與原模型高度匹配的通用訓練數(shù)據(jù),因此即便經(jīng)過調(diào)優(yōu),模型也有很大概率會失去通用性,變成無法應對多個場景的專用模型。

為解決這一關鍵難題,百川智能將自用的優(yōu)質(zhì)預訓練數(shù)據(jù)、SFT微調(diào)數(shù)據(jù)、強化學習中的通用訓練數(shù)據(jù),以及自研的超參自動化搜索和調(diào)優(yōu)技術、數(shù)據(jù)動態(tài)自適應配比技術等統(tǒng)一封裝,打造了一套全鏈路優(yōu)質(zhì)通用訓練數(shù)據(jù)方案。

由于Baichuan4-Turbo、Baichuan4-Air均為百川智能自研,所以這些優(yōu)質(zhì)通用訓練數(shù)據(jù)與兩者的數(shù)據(jù)分布高度一致,結(jié)合超參動態(tài)搜索和自適應配比等算法,與企業(yè)私有數(shù)據(jù)混合微調(diào),顯著提升了兩個模型多場景下的可用率,在金融、教育、醫(yī)療等場景下的專業(yè)細分任務平均可用率高達 96%,位居行業(yè)首位。

Baichuan4-Turbo部署成本、Baichuan4-Air推理成本均為行業(yè)同梯隊最低

成本是影響企業(yè)應用大模型的另一個重要因素,不同場景階段,企業(yè)對模型性能和成本的要求各不相同。為更好滿足行業(yè)用戶的多樣化需求,百川智能對兩個模型進行了差異化定位。

具體而言,Baichuan4-Turbo的文本生成、知識問答、多語言處理等核心能力相比Baichuan 4均有顯著提升,只需2卡4090的算力即可完成部署,在 GPT—4o同檔位效果的模型中部署成本最低,非常適合企業(yè)探索復雜場景。而Baichuan4-Air則更適用于已經(jīng)驗證過的較大規(guī)模流量的場景,其效果與Baichuan 4基本持平,但推理成本行業(yè)最低,僅為Baichuan 4的1%,百萬Token只需0.98元。

此外,兩款模型的響應速度也均提升顯著,相比Baichuan 4,Baichuan4-Turbo首Token速度提升51%、Token流速提升73%;Baichuan4-Air的首Token速度提升77%、Token流速提升93%。

值得一提的是,作為百川智能的首個MoE(Mixture of Experts)模型,Baichuan 4-Air首創(chuàng)了PRI(Pyramid、Residual、Interval)架構。與標準的MoE架構相比,Baichuan4-Air保持了MLP(多層感知機)和Attention(注意力機制)的內(nèi)部結(jié)構不變,僅對混合專家MLP層的配置方式進行優(yōu)化,通過合理配置專家數(shù)量和激活策略,能夠更好地平衡計算負載,減少計算量,提高推理速度。在相同訓練數(shù)據(jù)下,Baichuan4-Air不僅時效率更高,性能也大幅領先于GPT4-style、Mixtral-style結(jié)構的MoE模型。

Baichuan4-Air的時效率對比測試效果圖

企業(yè)在部署模型過程中還面臨著專業(yè)算法人才稀缺,模型調(diào)優(yōu)技術門檻高等阻礙。面向這些痛點,百川智能打造了簡單易用的全鏈路領域增強工具鏈。該工具鏈集成了數(shù)據(jù)抓取、數(shù)據(jù)清洗、數(shù)據(jù)增強、模型訓練、模型評測、模型壓縮和模型部署等諸多工具,企業(yè)可以根據(jù)自身需求自由選擇相應工具,對模型進行加密部署和訓練。

此外,百川智能還通過大量適配工作解決了不同硬件的適配問題,目前能夠高效適配英偉達4090/A/H系列、華為昇騰、寒武紀、高通、MTK、天數(shù)等多種主流芯片。

據(jù)悉,目前百川智能已經(jīng)服務了數(shù)千家客戶, 包括北電數(shù)智、完美世界游戲、愛奇藝、360集團、生學教育、愛學堂等各行業(yè)的領軍企業(yè),并且與信雅達、用友、軟通動力、新致軟件、達觀數(shù)據(jù)、華勝天成等多家行業(yè)生態(tài)伙伴,以及華為、中科曙光等硬件廠商,中國移動、中國電信、中國聯(lián)通等運營商達成合作,攜手構建百川大模型生態(tài)。(宜月)

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。

2024-10-31
百川智能發(fā)布一站式解決方案,1+3產(chǎn)品矩陣助力企業(yè)“多快好省”落地大模型
10月31日消息,百川智能推出一站式大模型商業(yè)化解決方案。

長按掃碼 閱讀全文