司南OpenCompass 2.0評(píng)測(cè)GLM-4穩(wěn)坐國(guó)內(nèi)榜首,智譜AI大模型實(shí)力強(qiáng)悍

近期,大模型開(kāi)源開(kāi)放評(píng)測(cè)體系司南(OpenCompass 2.0)公布了2024年4月大語(yǔ)言模型最新評(píng)測(cè)榜單,智譜AI的GLM-4繼續(xù)保持國(guó)產(chǎn)大模型第一的領(lǐng)先身位。

大模型開(kāi)源開(kāi)放評(píng)測(cè)體系司南(OpenCompass 2.0)由上海人工智能實(shí)驗(yàn)室發(fā)布。其月度榜單從基礎(chǔ)能力和綜合能力的設(shè)計(jì)出發(fā),構(gòu)建了一套高質(zhì)量的中英文雙語(yǔ)評(píng)測(cè)基準(zhǔn)體系,對(duì)主流開(kāi)源模型和商業(yè)API模型進(jìn)行了全面評(píng)測(cè)分析。評(píng)測(cè)榜單涉及的大語(yǔ)言模型和多模態(tài)大模型超過(guò)150個(gè),更有包括Meta、阿里巴巴、騰訊、百度等30余家國(guó)內(nèi)外企業(yè)和科研機(jī)構(gòu)采用OpenCompass助力開(kāi)展技術(shù)研發(fā)。

在4月客觀評(píng)測(cè)榜單中,OpenCompass基于語(yǔ)言、知識(shí)、推理、數(shù)學(xué)、代碼、智能體六個(gè)維度構(gòu)建了15000余道高質(zhì)量中英文雙語(yǔ)問(wèn)題,并引入OpenCompass團(tuán)隊(duì)首創(chuàng)的循環(huán)評(píng)估 (Circular Evalution) 策略,系統(tǒng)性分析了國(guó)內(nèi)外大模型的客觀性能。其中,GLM-4位列第四名,僅次于GPT-4-Turbo系列與Claude3-Opus,成為國(guó)內(nèi)大模型客觀評(píng)測(cè)月度總榜第一名。在語(yǔ)言維度方面,GLM-4分?jǐn)?shù)達(dá)到57.7分表現(xiàn)突出,超過(guò)GPT-4-Turbo系列與Claude3-Opus。在知識(shí)維度上,GLM-4得到68.9分,超過(guò)第二名的GPT-4-Turbo-1106,與第三名Claude3-Opus不相上下。

值得一提的是,GLM-4此前便長(zhǎng)期占據(jù)OpenCompass 2.0榜單前列,并多次在權(quán)威榜單與全球頂級(jí)大模型一較高下。清華《SuperBench大模型綜合能力評(píng)測(cè)報(bào)告》顯示,GLM-4在語(yǔ)義理解等方面的能力表現(xiàn)超過(guò)了GPT-4-Turbo等國(guó)際一流模型,在代碼、智能體等方面,排名國(guó)內(nèi)第一。在SuperCLUE-Fin(SC-Fin)中文原生金融大模型測(cè)評(píng)基準(zhǔn)中,GLM-4斬獲一項(xiàng)A+及多項(xiàng)A級(jí)評(píng)價(jià),在國(guó)內(nèi)大模型中排名第一。

據(jù)了解,GLM-4是由智譜AI于今年1月推出的新一代基座大模型。GLM-4整體性能逼近GPT-4,它可以支持更長(zhǎng)的上下文,具備更強(qiáng)的多模態(tài)能力。同時(shí),它的推理速度更快,支持更高的并發(fā),大大降低推理成本。依托GLM-4 All Tools能力,GLM-4智能體能夠?qū)崿F(xiàn)自主根據(jù)用戶意圖,自動(dòng)理解、規(guī)劃復(fù)雜指令,自由調(diào)用網(wǎng)頁(yè)瀏覽器、Code Interpreter代碼解釋器和多模態(tài)文生圖大模型以完成復(fù)雜任務(wù)。

開(kāi)發(fā)者可以通過(guò)智譜AI大模型開(kāi)放平臺(tái)bigmodel.cn接入GLM-4模型開(kāi)放API,便捷高效地體驗(yàn)GLM-4的強(qiáng)大能力。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )