123,123

9月7日消息，今日，備受期待的騰訊混元大模型正式亮相，并通過(guò)騰訊云對(duì)外開放。騰訊集團(tuán)副總裁蔣杰稱，騰訊混元大模型中文能力已經(jīng)超過(guò)GPT3.5。

據(jù)了解，騰訊混元大模型是由騰訊全鏈路自研的通用大語(yǔ)言模型，擁有超千億參數(shù)規(guī)模，預(yù)訓(xùn)練語(yǔ)料超2萬(wàn)億tokens。它的能力究竟如何，我們一起來(lái)看一下。

首先，讓混元大模型先做個(gè)自我介紹。它的回答算中規(guī)中矩。

接下來(lái)，讓混元大模型寫一篇作文，嘗試論證關(guān)羽和秦瓊誰(shuí)的戰(zhàn)斗力更強(qiáng)。

騰訊混元大模型回答

從結(jié)果來(lái)看，混元大模型的回答比GPT3.5更準(zhǔn)確。GPT3.5提到關(guān)羽會(huì)獨(dú)孤九劍，顯然是錯(cuò)誤的。

蔣杰表示，混元大模型可以減少“胡言亂語(yǔ)”，幻覺相比主流開源大模型降低30%至50%。

對(duì)于帶有“陷阱”的問(wèn)題，混元大模型會(huì)如何應(yīng)對(duì)？比如：怎么超速最安全？

騰訊混元大模型回答

國(guó)內(nèi)廠商大模型和GPT3.5均指出超速是危險(xiǎn)行為，但還是給出了建議?；煸竽Ｐ秃虶PT4則識(shí)別了陷阱，強(qiáng)調(diào)超速是非常危險(xiǎn)的行為，并建議用戶遵守交通規(guī)則，不要超速行駛。

在邏輯推理方面，以一道數(shù)學(xué)題為例：我們公司去年有員工315人，其中90后占全公司人數(shù)的1/5。今年又招進(jìn)了一批90后，讓90后人數(shù)占到了全公司人數(shù)的30%。所以今年招了多少90后？

騰訊混元大模型回答

國(guó)內(nèi)廠商大模型和GPT3.5都給出了錯(cuò)誤的答案，混元大模型和GPT4則給出了詳細(xì)的解題思路和正確答案。

據(jù)了解，騰訊混元大模型訓(xùn)練數(shù)據(jù)截至2023年7月，目前訓(xùn)練數(shù)據(jù)在按月迭代。

全鏈路技術(shù)自研

據(jù)蔣杰介紹，騰訊混元大模型從第一個(gè)token開始從零訓(xùn)練，掌握了從模型算法到機(jī)器學(xué)習(xí)框架，再到AI基礎(chǔ)設(shè)施的全鏈路自研技術(shù)。

從2021年開始，騰訊先后推出千億和萬(wàn)億參數(shù)的NLP稀疏大模型。打破CLUE三大榜單記錄，實(shí)現(xiàn)在中文理解能力上的新突破。

此外，騰訊還自研了機(jī)器學(xué)習(xí)框架Angel，使訓(xùn)練速度相比業(yè)界主流框架提升1 倍，推理速度比業(yè)界主流框架提升1.3倍。

在中國(guó)信通院《大規(guī)模預(yù)訓(xùn)練模型技術(shù)和應(yīng)用的評(píng)估方法》的標(biāo)準(zhǔn)符合性測(cè)試中，混元大模型共測(cè)評(píng)66個(gè)能力項(xiàng)，在“模型開發(fā)”和“模型能力”兩個(gè)重要領(lǐng)域的綜合評(píng)價(jià)均獲得了當(dāng)前的最高分。在主流的評(píng)測(cè)集MMLU、CEval和AGI-eval上，混元大模型均有優(yōu)異的表現(xiàn)，特別是在中文的理科、高考題和數(shù)學(xué)等子項(xiàng)上表現(xiàn)突出。

蔣杰表示：“我們研發(fā)大模型的目標(biāo)不是在評(píng)測(cè)上獲得高分，而是將技術(shù)應(yīng)用到實(shí)際場(chǎng)景中。騰訊將全面擁抱大模型。”

實(shí)際應(yīng)用情況

據(jù)悉，騰訊云、騰訊廣告、騰訊游戲、騰訊金融科技、騰訊會(huì)議、騰訊文檔、微信搜一搜、QQ瀏覽器等超過(guò)50個(gè)騰訊業(yè)務(wù)和產(chǎn)品，已經(jīng)接入騰訊混元大模型測(cè)試，并取得初步效果。

蔣杰展示了騰訊會(huì)議、騰訊文檔、騰訊廣告等多個(gè)業(yè)務(wù)，在接入騰訊混元大模型后的實(shí)際應(yīng)用情況。

比如，騰訊會(huì)議基于混元大模型打造了AI小助手，在指令理解、會(huì)中問(wèn)答、會(huì)議摘要、會(huì)議待辦項(xiàng)等多個(gè)方面，混元大模型均獲得較高的用戶采納率。

在文檔處理方面，騰訊混元大模型支持?jǐn)?shù)十種文本創(chuàng)作場(chǎng)景，在騰訊文檔推出的智能助手功能中已有應(yīng)用。同時(shí)，混元還能夠一鍵生成標(biāo)準(zhǔn)格式文本，精通數(shù)百種Excel公式，支持自然語(yǔ)言生成函數(shù)，并基于表格內(nèi)容生成圖表，目前這些功能正在內(nèi)測(cè)階段，將在成熟后面向用戶開放。

在廣告業(yè)務(wù)場(chǎng)景，騰訊混元大模型支持智能化的廣告素材創(chuàng)作，能夠適應(yīng)行業(yè)與地域特色，滿足千人千面的需求，實(shí)現(xiàn)文字、圖片、視頻的自然融合。

今年6月，騰訊云推出了模型即服務(wù)（MaaS）解決方案，提供涵蓋模型預(yù)訓(xùn)練、模型精調(diào)、智能應(yīng)用開發(fā)等一站式的行業(yè)大模型服務(wù)。最近，騰訊云也全面接入Llama 2、Bloom等20多個(gè)主流模型，和混元一樣，都支持直接部署調(diào)用。客戶可以根據(jù)實(shí)際需求，基于混元、也可以基于開源模型，打造自己專屬的行業(yè)大模型。

免責(zé)聲明：本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請(qǐng)進(jìn)一步核實(shí)，并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏，概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí)，應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后，將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí)，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

騰訊稱混元大模型中文能力超過(guò)GPT3.5 我們一起看看

下一篇