9月25日消息,百川智能發(fā)布Baichuan2-53B 閉源大模型,全面升級(jí)了Baichuan1-53B的各項(xiàng)能力。Baichuan2-53B不僅數(shù)學(xué)和邏輯推理能力提升顯著,還通過(guò)高質(zhì)量數(shù)據(jù)體系和搜索增強(qiáng)極大降低了模型幻覺(jué)。
作為首批通過(guò)備案的大模型企業(yè),百川智能此次還開(kāi)放了Baichuan2-53B API接口,正式進(jìn)軍To B領(lǐng)域,開(kāi)啟商業(yè)化進(jìn)程。此次開(kāi)放API后,百川智能將把行業(yè)領(lǐng)先的大模型能力賦能給各行各業(yè)的合作伙伴,助力萬(wàn)千企業(yè)智能化發(fā)展。
Baichuan2-53B 是百川智能發(fā)布的第6款大模型,自4月10日成立以來(lái),該公司以平均每28天推出一個(gè)大模型的速度持續(xù)創(chuàng)新。不久之前發(fā)布的Baichuan 2開(kāi)源大模型在多項(xiàng)評(píng)估任務(wù)中大幅領(lǐng)先 LLaMA2。
數(shù)學(xué)和邏輯推理能力大幅提升
百川智能于2023年8月8日發(fā)布Baichuan-53B搜索增強(qiáng)大模型,模型在知識(shí)問(wèn)答、文學(xué)創(chuàng)作等方面表現(xiàn)優(yōu)異,展現(xiàn)出商業(yè)文案創(chuàng)作(郵件撰寫、公司命名、營(yíng)銷文案生成)、文學(xué)創(chuàng)作(故事續(xù)寫、詩(shī)詞創(chuàng)作)、中文理解(語(yǔ)義識(shí)別、成語(yǔ)含義、詩(shī)詞分析)等多種任務(wù)場(chǎng)景下的強(qiáng)大能力。
大模型的數(shù)學(xué)和邏輯推理能力一直是業(yè)內(nèi)的關(guān)注焦點(diǎn),也是評(píng)價(jià)一款大模型是否領(lǐng)先的重要指標(biāo)。在Baichuan-53B的基礎(chǔ)上,Baichuan2-53B不僅重點(diǎn)強(qiáng)化了以上兩個(gè)維度的能力,并且對(duì)整體能力進(jìn)行了全面升級(jí)。其中,邏輯推理能力提升100%,數(shù)學(xué)能力提升31%,語(yǔ)言理解能力提升29%,文本創(chuàng)作提升18%,知識(shí)問(wèn)答提升9%。
客觀問(wèn)答準(zhǔn)確率行業(yè)領(lǐng)先
幻覺(jué)是大模型落地應(yīng)用必須跨越的鴻溝。通常而言,解決這一問(wèn)題有兩種方式,一種是不斷增加模型的數(shù)據(jù)規(guī)模、提升數(shù)據(jù)質(zhì)量;另一種是通過(guò)調(diào)用搜索等外部工具讓模型能夠獲取實(shí)時(shí)信息。
據(jù)悉,Baichuan2-53B在兩個(gè)方面均做了大量?jī)?yōu)化。高質(zhì)量數(shù)據(jù)構(gòu)建方面,Baichuan2-53B獨(dú)創(chuàng)了一套數(shù)據(jù)質(zhì)量體系。以低質(zhì)、優(yōu)質(zhì)為標(biāo)準(zhǔn)將數(shù)據(jù)進(jìn)行分類,確保Baichuan-53B始終使用優(yōu)質(zhì)數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練。
信息獲取方面,Baichuan2-53B對(duì)多個(gè)模塊進(jìn)行了升級(jí),包括指令意圖理解、智能搜索和結(jié)果增強(qiáng)等關(guān)鍵組件。這一綜合體系通過(guò)深入理解用戶指令,精確驅(qū)動(dòng)查詢?cè)~的搜索,最終結(jié)合大語(yǔ)言模型技術(shù),優(yōu)化模型結(jié)果生成的可靠性,實(shí)現(xiàn)更精確、更智能的模型回答結(jié)果,減少模型幻覺(jué)。
在高質(zhì)量數(shù)據(jù)體系和搜索增強(qiáng)技術(shù)的加持下,Baichuan2-53B有效降低了模型幻覺(jué)。百川智能使用 FacTool 評(píng)測(cè)后的結(jié)果顯示,Baichuan2-53B 的綜合得分為140.5,在主流基礎(chǔ)大模型中僅排在GPT-4之后,處于國(guó)內(nèi)領(lǐng)先水平。
FacTool是由上海交通大學(xué)、卡內(nèi)基梅隆大學(xué)、香港城市大學(xué)、Meta 等機(jī)構(gòu)學(xué)者共同提出的一款通用框架(項(xiàng)目地址:https://github.com/GAIR-NLP/factool),能夠查核大模型生成內(nèi)容的事實(shí)準(zhǔn)確性(也能查核一般性內(nèi)容的事實(shí)準(zhǔn)確性)。
開(kāi)放API, 全面進(jìn)軍To B領(lǐng)域
除了能力全面升級(jí),Baichuan2-53B 還開(kāi)放了API接口,企業(yè)和開(kāi)發(fā)者可以通過(guò)API將Baichuan2-53B集成至他們的應(yīng)用程序和服務(wù)中。Baichuan2-53B融合了最前沿的大模型技術(shù),可以很好的適配不同企業(yè)的各種業(yè)務(wù)需求,無(wú)論是智能客服、智能寫作還是智能推薦都能打造行業(yè)領(lǐng)先的用戶體驗(yàn)。
據(jù)介紹,Baichuan2-53B的API接口便捷易用,客戶只需要簡(jiǎn)單的配置和集成即可接入,同時(shí)其對(duì)OpenAI的接口高度兼容,客戶可以快速遷移,極大降低了模型的部署和轉(zhuǎn)換成本。
同時(shí),百川智能強(qiáng)調(diào),對(duì)于企業(yè)用戶最關(guān)注的安全合規(guī)問(wèn)題,作為首批通過(guò)《生成式人工智能服務(wù)管理暫行辦法》備案的大模型企業(yè),百川智能為Baichuan2-53B打造了覆蓋大模型預(yù)訓(xùn)練、精調(diào)、推理全周期的安全增強(qiáng),能夠?yàn)榭蛻艉秃献骰锇樘峁┤鞒痰陌踩U稀?/p>
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 國(guó)內(nèi)單次最大規(guī)模汽車碰撞測(cè)試結(jié)果出爐 中國(guó)品牌表現(xiàn)亮眼
- TechWeb微晚報(bào):OpenAI推出ChatGPT搜索,華為前三季度凈利潤(rùn)628.7億元
- 尚網(wǎng)網(wǎng)絡(luò)張黎黎:AI產(chǎn)品設(shè)計(jì)需要聚焦用戶真實(shí)需求
- Akamai與Kyndryl合作:加速企業(yè)零信任安全策略的實(shí)施
- 懂車帝CPS迎來(lái)四大產(chǎn)品升級(jí) 加速?gòu)臅?huì)員到交易模式轉(zhuǎn)型
- 凱迪拉克新XT6將于11月15日上市
- 消息稱蔚來(lái)第三品牌將采用混合動(dòng)力 官方回應(yīng)來(lái)了
- 小米汽車:10月小米SU7單月交付量首次突超2萬(wàn)臺(tái)
- 紙質(zhì)火車票成為歷史 今起鐵路客運(yùn)全面推廣使用電子發(fā)票
- 防不勝防!今年雙11的這些坑,你踩了幾個(gè)?
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。