浪潮信息助力淮海智算中心,千億參數(shù)AI大模型訓(xùn)練算力效率超50%

近日,淮海智算中心攜手浪潮信息進(jìn)行了超大規(guī)模參數(shù)AI大模型訓(xùn)練性能測(cè)試,實(shí)測(cè)數(shù)據(jù)表明,千億參數(shù)規(guī)模的自然語(yǔ)言AI單體大模型在淮海智算中心計(jì)算平臺(tái)上的訓(xùn)練算力效率達(dá)53.5%,刷新了業(yè)內(nèi)AI大模型訓(xùn)練算力效率新高。這意味著淮海智算中心將可為國(guó)內(nèi)生成式AI創(chuàng)新團(tuán)隊(duì)提供高性能、高效率的AI大模型訓(xùn)練算力服務(wù)。

生成式AI需要基于海量的自然語(yǔ)言或多模態(tài)數(shù)據(jù)集,對(duì)擁有巨大參數(shù)的超大規(guī)模AI模型進(jìn)行訓(xùn)練,其訓(xùn)練所需AI算力當(dāng)量非常高,如以PD(Petaflops-Day)為單位來(lái)衡量,OpenAI的GPT-3大模型訓(xùn)練的算力當(dāng)量為3640PD,而浪潮“源1.0”大模型的算力當(dāng)量則為4095PD。

超大規(guī)模AI大模型的訓(xùn)練一般必須在擁有成百上千加速卡的AI服務(wù)器集群上進(jìn)行,如何在AI計(jì)算集群上獲得更高的訓(xùn)練算力效率則會(huì)直接影響到模型訓(xùn)練時(shí)長(zhǎng)以及算力消耗成本,這對(duì)于提升生成式AI研發(fā)創(chuàng)新效率有著非常重要的影響。據(jù)公開(kāi)資料表明,GPT-3大模型在其V100GPU集群上的訓(xùn)練算力效率為21.3%,而浪潮“源1.0”的訓(xùn)練算力效率則達(dá)到了44.8%。

針對(duì)AI大模型訓(xùn)練的計(jì)算特點(diǎn),浪潮信息AI團(tuán)隊(duì)對(duì)淮海智算中心算力系統(tǒng)進(jìn)行了專(zhuān)業(yè)設(shè)計(jì),對(duì)集群架構(gòu)、高速互聯(lián)、算力調(diào)度等方面進(jìn)行全面優(yōu)化,在系統(tǒng)架構(gòu)上,采用單節(jié)點(diǎn)集成8顆加速器的AI服務(wù)器,節(jié)點(diǎn)內(nèi)加速器間實(shí)現(xiàn)超高速P2P通信,節(jié)點(diǎn)間建立極低延遲、超高帶寬的Infiniband通信網(wǎng)絡(luò)。在大模型訓(xùn)練技術(shù)層面,成功運(yùn)用了中文巨量AI模型“源1.0”的訓(xùn)練優(yōu)化經(jīng)驗(yàn),對(duì)分布式訓(xùn)練策略進(jìn)行了針對(duì)性?xún)?yōu)化,通過(guò)合理設(shè)計(jì)張量并行、流水并行和數(shù)據(jù)并行,精準(zhǔn)調(diào)整模型結(jié)構(gòu)和訓(xùn)練過(guò)程的超參數(shù),最終實(shí)現(xiàn)了千億參數(shù)規(guī)模AI大模型的訓(xùn)練算力效率達(dá)到53.5%。

千億參數(shù)AI模型結(jié)構(gòu)及其實(shí)際性能表現(xiàn)

淮海智算中心由安徽省宿州市與浪潮共同推進(jìn)建設(shè),目標(biāo)是建成技術(shù)先進(jìn)、架構(gòu)開(kāi)放、應(yīng)用豐富、生態(tài)完善的國(guó)內(nèi)領(lǐng)先智算樞紐?;春V撬阒行膶⒁揽款I(lǐng)先的算力、算法基礎(chǔ)設(shè)施,開(kāi)放的技術(shù)架構(gòu),成熟豐富的生態(tài)應(yīng)用,面向全國(guó)提供智能算力、數(shù)據(jù)和算法服務(wù),打造良好的智算產(chǎn)業(yè)生態(tài)。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )