支持超萬億參數(shù)大模型訓(xùn)練:華為發(fā)布全新架構(gòu)AI集群Atlas 900 SuperCluster

C114 9月20日下午消息(蔣均牧)智能化掀開新篇章,華為全聯(lián)接大會2023上,華為常務(wù)董事、ICT基礎(chǔ)設(shè)施業(yè)務(wù)管理委員會主任、企業(yè)BG總裁汪濤正式發(fā)布了全新架構(gòu)的昇騰AI計(jì)算集群Atlas 900 SuperCluster。

隨著人工智能進(jìn)入大模型時(shí)代,大算力正在成為發(fā)展的AI核心引擎。華為改變傳統(tǒng)的服務(wù)器堆疊模式,以系統(tǒng)架構(gòu)創(chuàng)新打造AI集群,實(shí)現(xiàn)算力、運(yùn)力、存力的一體化設(shè)計(jì),突破大算力瓶頸。華為最新推出的Atlas 900 SuperCluster,可支持超萬億參數(shù)的大模型訓(xùn)練。

新集群采用了全新的華為星河AI智算交換機(jī)CloudEngine XH16800,借助其高密的800GE端口能力,兩層交換網(wǎng)絡(luò)即可實(shí)現(xiàn)2250節(jié)點(diǎn)(相當(dāng)于1.8萬張卡)超大規(guī)模無收斂集群組網(wǎng)。新集群同時(shí)使用了創(chuàng)新的超節(jié)點(diǎn)架構(gòu),可提供高達(dá)200PFLOPS@FP16的算力,大大提升了大模型訓(xùn)練能力。此外,發(fā)揮華為在計(jì)算、網(wǎng)絡(luò)、存儲、能源等領(lǐng)域的綜合優(yōu)勢,從器件級、節(jié)點(diǎn)級、集群級和業(yè)務(wù)級全面提升系統(tǒng)可靠性,將大模型訓(xùn)練穩(wěn)定性從天級提升到月級。

硬件使能是釋放大算力的關(guān)鍵,也是大模型開發(fā)的基礎(chǔ)。為了加速大模型的創(chuàng)新,華為發(fā)布了更開放、更易用的CANN7.0,不僅全面兼容業(yè)界的AI框架、加速庫和主流大模型,還深度開放底層能力,讓AI框架和加速庫可以更直接地調(diào)用和管理計(jì)算資源,使能開發(fā)者自定義高性能算子,讓大模型具備差異化的競爭力。

C114獲悉,面向Transformer網(wǎng)絡(luò)模型的開發(fā),華為升級了Ascend C編程語言,以更高效的編程方式,簡化算子實(shí)現(xiàn)邏輯,將融合算子的開發(fā)周期從2人月縮短到2人周,使能AI模型與應(yīng)用的快速開發(fā)。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2023-09-20
支持超萬億參數(shù)大模型訓(xùn)練:華為發(fā)布全新架構(gòu)AI集群Atlas 900 SuperCluster
支持超萬億參數(shù)大模型訓(xùn)練:華為發(fā)布全新架構(gòu)AI集群Atlas 900 SuperCluster,C114 9月20日下午消息(蔣均牧)智能化掀開新篇章,華為全聯(lián)接大會2023上,華為常務(wù)董事、IC

長按掃碼 閱讀全文