1月16日消息,智譜AI今天發(fā)布全自研第四代基座大模型GLM-4,性能相比前一代GLM-3提升60%、中文能力比肩GPT-4。
智譜AI CEO張鵬介紹,GLM-4的整體性能相比上一代大幅提升,逼近GPT-4。它可以支持更長(zhǎng)的上下文,具備更強(qiáng)的多模態(tài)能力。同時(shí),它的推理速度更快,支持更高的并發(fā),大大降低推理成本。
除此之外,GLM-4大幅提升了智能體能力,GLM-4 All Tools 實(shí)現(xiàn)自主根據(jù)用戶意圖,自動(dòng)理解、規(guī)劃復(fù)雜指令,自由調(diào)用網(wǎng)頁(yè)瀏覽器、Code Interpreter代碼解釋器和多模態(tài)文生圖大模型以完成復(fù)雜任務(wù)。GLMs 個(gè)性化智能體定制功能亦同時(shí)上線,用戶用簡(jiǎn)單的提示詞指令就能創(chuàng)建屬于自己的 GLM 智能體。
中文能力比肩GPT-4
在基礎(chǔ)能力方面,GLM-4在各項(xiàng)評(píng)測(cè)集上的最終得分如下:
MMLU:81.5,達(dá)到GPT-4的94%水平;
GSM8K:87.6 ,達(dá)到GPT-4的95%水平;
MATH :47.9,達(dá)到GPT-4的91%水平;
BBH :82.3,達(dá)到GPT-4的99%水平;
HellaSwag :85.4,達(dá)到GPT-4 的90%水平;
HumanEval:72,達(dá)到GPT-4的100%水平。
指令跟隨能力方面, GLM-4在IFEval Prompt提示詞跟隨中文方面達(dá)到和GPT-4的88%水平,指令跟隨(中文)方面達(dá)到 90%水平。
對(duì)齊能力上,基于AlignBench數(shù)據(jù)集,GLM-4超過(guò)了GPT-4的6月13日版本,逼近GPT-4最新11月6日版本的效果。GLM-4在中文推理、邏輯推理方面的能力,還有待進(jìn)一步提升。
GLM-4可以支持128k的上下文窗口長(zhǎng)度,單次提示詞可以處理的文本可以達(dá)到300頁(yè)。同時(shí),在needle test(大海撈針)測(cè)試中,128K文本長(zhǎng)度內(nèi)GLM-4 模型均可做到幾乎100%的精度召回,并未出現(xiàn)長(zhǎng)上下文全局信息因?yàn)槭Ы苟鴮?dǎo)致的精度下降問(wèn)題。
同時(shí),多模態(tài)能力方面,GLM-4在文生圖(CogView3)和多模態(tài)理解都得到了增強(qiáng)。CogView3效果超過(guò)開源最佳的Stable Diffusion XL,逼近DALLE?3。
此外,GLM-4的All Tools能力全新發(fā)布。
GLM-4實(shí)現(xiàn)了自主根據(jù)用戶意圖,自動(dòng)理解、規(guī)劃復(fù)雜指令,自由調(diào)用網(wǎng)頁(yè)瀏覽器、Code Interpreter代碼解釋器和文生圖CogView3模型。
同時(shí),GLM-4 通過(guò)代碼解釋器,會(huì)自動(dòng)調(diào)用代碼解釋器進(jìn)行復(fù)雜的方程或者微積分求解。對(duì)比GSM8K、Math以及Math23K三個(gè)數(shù)據(jù)集上的結(jié)果,GLM-4 All Tools取得和GPT-4 All Tools相當(dāng)?shù)男Ч?/p>
GLM-4的All Tools能力完全自動(dòng),而且可以處理各種任務(wù),比如包括文件處理、數(shù)據(jù)分析、圖表繪制等復(fù)雜任務(wù),支持處理 Excel、PDF、PPT 等格式的文件。
GLMs上線 大模型開源基金共建生態(tài)
GLMs個(gè)性化智能體定制能力也同步上線。
基于GLM-4模型的強(qiáng)大能力,張鵬介紹介紹,用戶只要登錄智譜清言官方網(wǎng)站,用簡(jiǎn)單的提示詞指令就能創(chuàng)建屬于自己的GLM智能體。
用戶可以通過(guò)全新上線的智能體中心分享自己創(chuàng)建的各種智能體。GLM模型智能體的推出標(biāo)志著任何人都能夠自由運(yùn)用GLM-4模型并挖掘它的潛力,沒(méi)有任何編程基礎(chǔ)也能夠?qū)崿F(xiàn)大模型的便捷開發(fā)。這是智譜AI為降低大模型使用門檻所做的最新努力。
此前,智譜AI分別聯(lián)合CCF中國(guó)計(jì)算機(jī)學(xué)會(huì)、中國(guó)中文信息學(xué)會(huì)社會(huì)媒體處理專委會(huì)發(fā)起了CCF-智譜大模型基金、SMP-智譜大模型交叉學(xué)科基金,用于支持大模型理論、算法、模型、應(yīng)用等相關(guān)研究和跨領(lǐng)域交叉創(chuàng)新。去年兩支基金為來(lái)自全國(guó)三十余所高校參與的41個(gè)研究項(xiàng)目累計(jì)提供了超1000萬(wàn)元現(xiàn)金和算力資源的科研支持。
2024年智譜AI也將發(fā)起開源開放的大模型開源基金。
據(jù)介紹,該計(jì)劃包括三個(gè)“1000”:智譜AI將為大模型開源社區(qū)提供1000張卡,助力開源開發(fā);提供1000萬(wàn)元的現(xiàn)金用來(lái)支持與大模型相關(guān)的開源項(xiàng)目;為優(yōu)秀的開源開發(fā)者提供1000億免費(fèi)API tokens。
張鵬表示,大模型開源基金的目的在于推動(dòng)大模型研發(fā)的大進(jìn)展,促進(jìn)大模型整個(gè)開源生態(tài)的大繁榮。面對(duì)全球的大模型創(chuàng)業(yè)者,智譜AI也將“Z計(jì)劃”進(jìn)一步升級(jí),聯(lián)合生態(tài)伙伴發(fā)起總額10億人民幣的大模型創(chuàng)業(yè)基金用于支持大模型原始創(chuàng)新,覆蓋大模型算法、底層算子、芯片優(yōu)化、行業(yè)大模型和超級(jí)應(yīng)用等方向。
- 蔚來(lái)法務(wù)部重拳出擊:揭露有組織網(wǎng)絡(luò)攻擊,啟動(dòng)法律追責(zé)程序
- 寶馬高管談車載屏幕:追求實(shí)用而非尺寸,調(diào)侃奔馳大屏不實(shí)用
- 固態(tài)電池技術(shù)重大突破:實(shí)現(xiàn)分鐘級(jí)快充與萬(wàn)次循環(huán)充電
- 上汽集團(tuán)新動(dòng)作頻出:申請(qǐng)“尚界”、“上汽尚界”等商標(biāo)
- X平臺(tái)面臨歐盟重罰:未能遵守廣告透明度規(guī)定,罰款或達(dá)數(shù)億歐元
- 抖音2024年累計(jì)處理452萬(wàn)條虛假謠言,協(xié)助警方抓獲90名“水軍”
- DeepSeek R1模型驚艷全球,Meta楊立昆:這是開源模型的勝利
- B站看春晚完整玩法公布:UP主探班后臺(tái)、實(shí)時(shí)互動(dòng)看晚會(huì)
- 周鴻祎送粉絲100輛國(guó)產(chǎn)新能源車:報(bào)名就能參加,正月十五揭曉第一波車主
- 互聯(lián)網(wǎng)大廠春節(jié)撒錢 這些搶紅包姿勢(shì)趕緊掌握
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。