123,123,123

9月25日消息，百川智能發(fā)布Baichuan2-53B 閉源大模型，全面升級了Baichuan1-53B的各項能力。Baichuan2-53B不僅數(shù)學(xué)和邏輯推理能力提升顯著，還通過高質(zhì)量數(shù)據(jù)體系和搜索增強(qiáng)極大降低了模型幻覺。

作為首批通過備案的大模型企業(yè)，百川智能此次還開放了Baichuan2-53B API接口，正式進(jìn)軍To B領(lǐng)域，開啟商業(yè)化進(jìn)程。此次開放API后，百川智能將把行業(yè)領(lǐng)先的大模型能力賦能給各行各業(yè)的合作伙伴，助力萬千企業(yè)智能化發(fā)展。

Baichuan2-53B 是百川智能發(fā)布的第6款大模型，自4月10日成立以來，該公司以平均每28天推出一個大模型的速度持續(xù)創(chuàng)新。不久之前發(fā)布的Baichuan 2開源大模型在多項評估任務(wù)中大幅領(lǐng)先 LLaMA2。

數(shù)學(xué)和邏輯推理能力大幅提升

百川智能于2023年8月8日發(fā)布Baichuan-53B搜索增強(qiáng)大模型，模型在知識問答、文學(xué)創(chuàng)作等方面表現(xiàn)優(yōu)異，展現(xiàn)出商業(yè)文案創(chuàng)作（郵件撰寫、公司命名、營銷文案生成）、文學(xué)創(chuàng)作（故事續(xù)寫、詩詞創(chuàng)作）、中文理解（語義識別、成語含義、詩詞分析）等多種任務(wù)場景下的強(qiáng)大能力。

大模型的數(shù)學(xué)和邏輯推理能力一直是業(yè)內(nèi)的關(guān)注焦點，也是評價一款大模型是否領(lǐng)先的重要指標(biāo)。在Baichuan-53B的基礎(chǔ)上，Baichuan2-53B不僅重點強(qiáng)化了以上兩個維度的能力，并且對整體能力進(jìn)行了全面升級。其中，邏輯推理能力提升100%，數(shù)學(xué)能力提升31%，語言理解能力提升29%，文本創(chuàng)作提升18%，知識問答提升9%。

客觀問答準(zhǔn)確率行業(yè)領(lǐng)先

幻覺是大模型落地應(yīng)用必須跨越的鴻溝。通常而言，解決這一問題有兩種方式，一種是不斷增加模型的數(shù)據(jù)規(guī)模、提升數(shù)據(jù)質(zhì)量；另一種是通過調(diào)用搜索等外部工具讓模型能夠獲取實時信息。

據(jù)悉，Baichuan2-53B在兩個方面均做了大量優(yōu)化。高質(zhì)量數(shù)據(jù)構(gòu)建方面，Baichuan2-53B獨創(chuàng)了一套數(shù)據(jù)質(zhì)量體系。以低質(zhì)、優(yōu)質(zhì)為標(biāo)準(zhǔn)將數(shù)據(jù)進(jìn)行分類，確保Baichuan-53B始終使用優(yōu)質(zhì)數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練。

信息獲取方面，Baichuan2-53B對多個模塊進(jìn)行了升級，包括指令意圖理解、智能搜索和結(jié)果增強(qiáng)等關(guān)鍵組件。這一綜合體系通過深入理解用戶指令，精確驅(qū)動查詢詞的搜索，最終結(jié)合大語言模型技術(shù)，優(yōu)化模型結(jié)果生成的可靠性，實現(xiàn)更精確、更智能的模型回答結(jié)果，減少模型幻覺。

在高質(zhì)量數(shù)據(jù)體系和搜索增強(qiáng)技術(shù)的加持下，Baichuan2-53B有效降低了模型幻覺。百川智能使用 FacTool 評測后的結(jié)果顯示，Baichuan2-53B 的綜合得分為140.5，在主流基礎(chǔ)大模型中僅排在GPT-4之后，處于國內(nèi)領(lǐng)先水平。

FacTool是由上海交通大學(xué)、卡內(nèi)基梅隆大學(xué)、香港城市大學(xué)、Meta 等機(jī)構(gòu)學(xué)者共同提出的一款通用框架（項目地址：https://github.com/GAIR-NLP/factool），能夠查核大模型生成內(nèi)容的事實準(zhǔn)確性（也能查核一般性內(nèi)容的事實準(zhǔn)確性）。

開放API，全面進(jìn)軍To B領(lǐng)域

除了能力全面升級，Baichuan2-53B 還開放了API接口，企業(yè)和開發(fā)者可以通過API將Baichuan2-53B集成至他們的應(yīng)用程序和服務(wù)中。Baichuan2-53B融合了最前沿的大模型技術(shù)，可以很好的適配不同企業(yè)的各種業(yè)務(wù)需求，無論是智能客服、智能寫作還是智能推薦都能打造行業(yè)領(lǐng)先的用戶體驗。

據(jù)介紹，Baichuan2-53B的API接口便捷易用，客戶只需要簡單的配置和集成即可接入，同時其對OpenAI的接口高度兼容，客戶可以快速遷移，極大降低了模型的部署和轉(zhuǎn)換成本。

同時，百川智能強(qiáng)調(diào)，對于企業(yè)用戶最關(guān)注的安全合規(guī)問題，作為首批通過《生成式人工智能服務(wù)管理暫行辦法》備案的大模型企業(yè)，百川智能為Baichuan2-53B打造了覆蓋大模型預(yù)訓(xùn)練、精調(diào)、推理全周期的安全增強(qiáng)，能夠為客戶和合作伙伴提供全流程的安全保障。

免責(zé)聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請進(jìn)一步核實，并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏，概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時，應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后，將會依法盡快聯(lián)系相關(guān)文章源頭核實，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

百川智能發(fā)布Baichuan2-53B，開放API全面進(jìn)軍To B領(lǐng)域

下一篇