123,123

10月31日消息，百川智能推出一站式大模型商業(yè)化解決方案，即1+3產(chǎn)品矩陣（全鏈路優(yōu)質(zhì)通用訓練數(shù)據(jù)，Baichuan4-Turbo、Baichuan4-Air兩款模型和全鏈路領域增強工具鏈），該方案“工具多、速度快、效果好、成本低”，能夠幫助企業(yè)以最低成本實現(xiàn)效果最佳的私有化部署。并支持企業(yè)將專有數(shù)據(jù)與百川智能自用的全鏈路優(yōu)質(zhì)訓練數(shù)據(jù)混合，對Baichuan4-Turbo、Baichuan4-Air兩款模型進行調(diào)優(yōu)和增強，實現(xiàn)了行業(yè)最高的96%多場景可用率。

企業(yè)多元場景可用率高達96%

眾所周知，盡管大模型具備良好的泛化能力，但由于每個企業(yè)都有自身獨特的專業(yè)知識和應用場景，直接應用通用模型無法達到理想效果，必須對模型進行定制化優(yōu)化使其適應特定領域和場景需求，而優(yōu)化后模型在多場景下的可用率是評估其價值的關鍵標準。此前行業(yè)的主流做法是將企業(yè)專有數(shù)據(jù)和通用數(shù)據(jù)混合定向調(diào)優(yōu)、增強通用模型，但受限于諸多因素，企業(yè)很難獲得與原模型高度匹配的通用訓練數(shù)據(jù)，因此即便經(jīng)過調(diào)優(yōu)，模型也有很大概率會失去通用性，變成無法應對多個場景的專用模型。

為解決這一關鍵難題，百川智能將自用的優(yōu)質(zhì)預訓練數(shù)據(jù)、SFT微調(diào)數(shù)據(jù)、強化學習中的通用訓練數(shù)據(jù)，以及自研的超參自動化搜索和調(diào)優(yōu)技術、數(shù)據(jù)動態(tài)自適應配比技術等統(tǒng)一封裝，打造了一套全鏈路優(yōu)質(zhì)通用訓練數(shù)據(jù)方案。

由于Baichuan4-Turbo、Baichuan4-Air均為百川智能自研，所以這些優(yōu)質(zhì)通用訓練數(shù)據(jù)與兩者的數(shù)據(jù)分布高度一致，結(jié)合超參動態(tài)搜索和自適應配比等算法，與企業(yè)私有數(shù)據(jù)混合微調(diào)，顯著提升了兩個模型多場景下的可用率，在金融、教育、醫(yī)療等場景下的專業(yè)細分任務平均可用率高達 96%，位居行業(yè)首位。

Baichuan4-Turbo部署成本、Baichuan4-Air推理成本均為行業(yè)同梯隊最低

成本是影響企業(yè)應用大模型的另一個重要因素，不同場景階段，企業(yè)對模型性能和成本的要求各不相同。為更好滿足行業(yè)用戶的多樣化需求，百川智能對兩個模型進行了差異化定位。

具體而言，Baichuan4-Turbo的文本生成、知識問答、多語言處理等核心能力相比Baichuan 4均有顯著提升，只需2卡4090的算力即可完成部署，在 GPT—4o同檔位效果的模型中部署成本最低，非常適合企業(yè)探索復雜場景。而Baichuan4-Air則更適用于已經(jīng)驗證過的較大規(guī)模流量的場景，其效果與Baichuan 4基本持平，但推理成本行業(yè)最低，僅為Baichuan 4的1%，百萬Token只需0.98元。

此外，兩款模型的響應速度也均提升顯著，相比Baichuan 4，Baichuan4-Turbo首Token速度提升51%、Token流速提升73%；Baichuan4-Air的首Token速度提升77%、Token流速提升93%。

值得一提的是，作為百川智能的首個MoE（Mixture of Experts）模型，Baichuan 4-Air首創(chuàng)了PRI（Pyramid、Residual、Interval）架構。與標準的MoE架構相比，Baichuan4-Air保持了MLP（多層感知機）和Attention（注意力機制）的內(nèi)部結(jié)構不變，僅對混合專家MLP層的配置方式進行優(yōu)化，通過合理配置專家數(shù)量和激活策略，能夠更好地平衡計算負載，減少計算量，提高推理速度。在相同訓練數(shù)據(jù)下，Baichuan4-Air不僅時效率更高，性能也大幅領先于GPT4-style、Mixtral-style結(jié)構的MoE模型。

Baichuan4-Air的時效率對比測試效果圖

企業(yè)在部署模型過程中還面臨著專業(yè)算法人才稀缺，模型調(diào)優(yōu)技術門檻高等阻礙。面向這些痛點，百川智能打造了簡單易用的全鏈路領域增強工具鏈。該工具鏈集成了數(shù)據(jù)抓取、數(shù)據(jù)清洗、數(shù)據(jù)增強、模型訓練、模型評測、模型壓縮和模型部署等諸多工具，企業(yè)可以根據(jù)自身需求自由選擇相應工具，對模型進行加密部署和訓練。

此外，百川智能還通過大量適配工作解決了不同硬件的適配問題，目前能夠高效適配英偉達4090/A/H系列、華為昇騰、寒武紀、高通、MTK、天數(shù)等多種主流芯片。

據(jù)悉，目前百川智能已經(jīng)服務了數(shù)千家客戶，包括北電數(shù)智、完美世界游戲、愛奇藝、360集團、生學教育、愛學堂等各行業(yè)的領軍企業(yè)，并且與信雅達、用友、軟通動力、新致軟件、達觀數(shù)據(jù)、華勝天成等多家行業(yè)生態(tài)伙伴，以及華為、中科曙光等硬件廠商，中國移動、中國電信、中國聯(lián)通等運營商達成合作，攜手構建百川大模型生態(tài)。（宜月）

免責聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性，但不保證有關資料的準確性及可靠性，讀者在使用前請進一步核實，并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏，概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時，應及時向本網(wǎng)站提出書面權利通知或不實情況說明，并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后，將會依法盡快聯(lián)系相關文章源頭核實，溝通刪除相關內(nèi)容或斷開相關鏈接。

百川智能發(fā)布一站式解決方案，1+3產(chǎn)品矩陣助力企業(yè)“多快好省”落地大模型

下一篇

百川智能發(fā)布一站式解決方案，1+3產(chǎn)品矩陣助力企業(yè)“多快好省”落地大模型

下一篇

百川智能發(fā)布一站式解決方案，1+3產(chǎn)品矩陣助力企業(yè)“多快好省”落地大模型