123,123,123

國內(nèi)首發(fā)，魔搭社區(qū)上架百川智能Baichuan 2系列模型

人閱讀

2023-09-06 19:15:38

來源：極客網(wǎng)
相關關鍵詞

9月6日,百川智能發(fā)布第二代開源模型Baichuan 2，正式開源微調(diào)后的Baichuan 2-7B、Baichuan 2-13B、Baichuan 2-13B-Chat與其4bit量化版本。模型均免費可商用，已在AI模型社區(qū)魔搭ModelScope首發(fā)上架，魔搭第一時間推出了模型部署相關教程，供開發(fā)者參考并快速上手。

國內(nèi)首發(fā)，魔搭社區(qū)上架百川智能Baichuan 2系列模型.jpg

今年6月、7月，百川先后開源了上一代的7B和13B模型。本次開源的Baichuan 2-7B-Base和 Baichuan 2-13B-Base基于 2.6萬億高質(zhì)量多語言數(shù)據(jù)進行訓練，保留了上一代開源模型良好的生成與創(chuàng)作能力、流暢的多輪對話能力以及部署門檻較低等眾多特性。

與此同時，兩個模型的數(shù)學、代碼、安全、邏輯推理、語義理解等能力有顯著提升，Baichuan 2-13B-Base相比上一代13B模型，數(shù)學能力提升49%，代碼能力提升46%，安全能力提升37%，邏輯推理能力提升25%，語義理解能力提升15%。

兩個模型在各大評測榜單上的表現(xiàn)優(yōu)秀，在MMLU、CMMLU、GSM8K等幾大權威評估基準中以絕對優(yōu)勢領先LLaMA2，相比其他同等參數(shù)量大模型表現(xiàn)也十分亮眼。更值得一提的是，根據(jù)MMLU等多個權威英文評估基準評分 Baichuan2-7B以70億的參數(shù)在英文主流任務上與130億參數(shù)量的LLaMA2持平。

7B參數(shù)模型的Benchmark成績.jpg

7B參數(shù)模型的Benchmark成績

13B參數(shù)模型的Benchmark成績.jpg

13B參數(shù)模型的Benchmark成績

Baichuan2-7B和Baichuan2-13B不僅對學術研究完全開放，開發(fā)者也僅需郵件申請獲得官方商用許可后，即可以免費商用。百川智能還開源了模型訓練的Check Point，并宣布將發(fā)布 Baichuan 2 技術報告，詳細介紹Baichuan 2 的訓練細節(jié)。此舉為國內(nèi)首創(chuàng)。

作為魔搭社區(qū)的重要合作伙伴，百川智能歷次開源模型都以魔搭作為國內(nèi)首發(fā)平臺，百川的開源模型在魔搭AI開發(fā)者群體中廣受歡迎。

針對本次開源，魔搭社區(qū)基于Baichuan2-13B-Chat開發(fā)了體驗接口，普通用戶可以直接體驗或使用模型；魔搭公眾號則推出了最佳實踐教程，提前跑通模型的部署、推理和微調(diào)，供開發(fā)者參考。

魔搭社區(qū)上架百川智能Baichuan 2系列模型.jpg

百川模型體驗入口：

https://modelscope.cn/studios/baichuan-inc/Baichuan-13B-Chatdemo/summary

魔搭最佳實踐：

https://mp.weixin.qq.com/s?__biz=MzkxNTM5NTg2OA==&mid=2247486340&idx=1&sn=c87d949cc6f84366ed394eb427a5d550&chksm=c15e8ff7f62906e1d1950a22b6c1731d2883988d828df7096f6fa9b8beecd07f47394a0986f9&token=1053714178&lang=zh_CN#rd

魔搭是國內(nèi)規(guī)模最大、開發(fā)者最活躍的AI模型社區(qū)，由阿里云牽頭發(fā)起。社區(qū)聚集了國內(nèi)20多家頭部人工智能機構貢獻的1000多款優(yōu)質(zhì)AI模型，為開發(fā)者提供一站式的模型體驗、下載、推理、調(diào)優(yōu)、定制等服務。目前魔搭社區(qū)模型的累計下載量已突破6800萬次。

附：魔搭社區(qū)模型下載鏈接

百川2-7B-預訓練模型：

https://modelscope.cn/models/baichuan-inc/Baichuan2-7B-Base/summary

百川2-7B-對話模型：

https://modelscope.cn/models/baichuan-inc/Baichuan2-7B-Chat/summary

百川2-7B-對話模型-int4量化版：

https://modelscope.cn/models/baichuan-inc/Baichuan2-7B-Chat-int4/summary

百川2-13B-預訓練模型：

https://modelscope.cn/models/baichuan-inc/Baichuan2-13B-Base/summary

百川2-13B-對話模型：

https://modelscope.cn/models/baichuan-inc/Baichuan2-13B-Chat/summary

百川2-13B-對話模型-4bits量化版：

https://modelscope.cn/models/baichuan-inc/Baichuan2-13B-Chat-4bits/summary

百川2-7B-訓練過程模型：

https://modelscope.cn/models/baichuan-inc/Baichuan2-7B-Intermediate-Checkpoints/summary

（免責聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性，但不保證有關資料的準確性及可靠性，讀者在使用前請進一步核實，并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏，概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時，應及時向本網(wǎng)站提出書面權利通知或不實情況說明，并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后，將會依法盡快聯(lián)系相關文章源頭核實，溝通刪除相關內(nèi)容或斷開相關鏈接。）