通義千問升級旗艦模型Qwen-Max,性能接近GPT-4o

9月19日消息,在今日開幕的云棲大會上,阿里云CTO周靖人宣布,通義旗艦模型Qwen-Max全方位升級,性能接近GPT-4o。通義官網和通義APP的后臺模型均已切換為Qwen-Max,繼續(xù)免費為所有用戶提供服務。用戶也可通過阿里云百煉平臺調用Qwen-Max的API。

相比上一代模型,Qwen-Max在訓練中使用了更多的訓練數據、更大的模型規(guī)模、更強的人類對齊,最終達到了更高的智能水平。在MMLU-Pro、MATH、GSM8K、MBPP、MultiPL-E、LiveCodeBench等十多個權威基準上,Qwen-Max表現接近GPT-4o,數學能力、代碼能力則超越了GPT-4o。數學和代碼所代表的推理能力是大模型智能水平的最重要體現。

相比2023年4月的初代通義千問大模型,Qwen-Max的理解能力提升46%、數學能力提升75%、代碼能力提升102%、幻覺抵御能力提升35%、指令遵循能力提升105%,模型與人類偏好的對齊水平更是有了質的飛躍,提升了700%以上。

免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2024-09-19
通義千問升級旗艦模型Qwen-Max,性能接近GPT-4o
在今日開幕的云棲大會上,阿里云CTO周靖人宣布,通義旗艦模型Qwen-Max全方位升級,性能接近GPT-4o。通義官網和通義APP的后臺模型均已切換為Qwen-Max,繼續(xù)免費為所有用戶提供服務。用戶也可通過阿里云百煉平臺調用Qwen-Max的API。相比上一代模型,Qwen-Max在訓練中使用了更多的訓練數據、更大的模型規(guī)模、更強的人類對齊,最終達到了更高的智能水平。在MMLU-Pro、MATH、GSM8K、MBPP、MultiPL-E、LiveCodeBench等十多個權威基準上,Qwen-Max表現接近GPT-4o,數學能力、代碼能力則超越了GPT-4o。

長按掃碼 閱讀全文