浪潮信息趙帥:未來一切計算皆AI,構(gòu)建開放算力模組規(guī)范至關(guān)重要

8月12日消息,2024開放計算中國峰會上,開放算力模組(OCM)規(guī)范正式啟動立項(xiàng),首批成員包括中國電子技術(shù)標(biāo)準(zhǔn)化研究院、浪潮信息、Intel、AMD、百度、小紅書、聯(lián)想、超聚變等,旨在打造國內(nèi)首個服務(wù)器計算模組設(shè)計規(guī)范,構(gòu)建CPU統(tǒng)一算力底座。

開放計算模組規(guī)范(OCM) 規(guī)范的正式啟動,旨在建立基于處理器的標(biāo)準(zhǔn)化算力模組單元,通過統(tǒng)一不同處理器算力單元對外高速互連、管理協(xié)議、供電接口等,實(shí)現(xiàn)不同架構(gòu)處理器芯片兼容,構(gòu)建CPU的統(tǒng)一的算力底座,以解決CPU生態(tài)挑戰(zhàn)問題,方便客戶根據(jù)人工智能、云計算、大數(shù)據(jù)等多樣化應(yīng)用場景,靈活、快速匹配最適合的算力平臺,推動算力產(chǎn)業(yè)高質(zhì)量快速發(fā)展。

為何要構(gòu)建“OCM”規(guī)范?

在談及“OCM”規(guī)范發(fā)起的初衷時,浪潮信息服務(wù)器產(chǎn)品線總經(jīng)理趙帥表示,現(xiàn)在,無論是手機(jī)、電腦、邊緣設(shè)備、CPU服務(wù)器、加速服務(wù)器都具有了AI計算的能力,也都在承載著多樣化的AI應(yīng)用。AI算力已經(jīng)深入到千行百業(yè),滲透進(jìn)每一個計算設(shè)備里,面向人工智能的算力范式不斷革新。通用算力也要具有AI計算的能力,可以說“未來一切計算皆AI”。

在智算時代背景下,CPU算力單元應(yīng)用越來越豐富,除了大數(shù)據(jù)、關(guān)鍵計算、科學(xué)計算外,也要承擔(dān)AI應(yīng)用的重要任務(wù),這是CPU算力單元的重大機(jī)遇。

與此同時,隨著應(yīng)用范式的多樣化,CPU呈現(xiàn)了多元化發(fā)展方向。目前x86、ARM、RISC-V等不同架構(gòu)的CPU處理器百花齊放,僅在中國,目前就有10多種CPU處理器,不同CPU協(xié)議標(biāo)準(zhǔn)不統(tǒng)一,系統(tǒng)功耗、總線速率、電流密度不斷提升,導(dǎo)致硬件開發(fā)、固件適配、部件測試資源等時間激增,給算力系統(tǒng)設(shè)計帶來巨大挑戰(zhàn)。

趙帥強(qiáng)調(diào):“需要構(gòu)建一個CPU的統(tǒng)一算力底座,解決CPU計算的效率問題?!?/p>

“OCM”規(guī)范的思路就是把原來一個緊耦合式的服務(wù)器架構(gòu)拆散,以CPU和內(nèi)存作為最小的算力單元,標(biāo)準(zhǔn)化高速和低速的互連接口。這樣,未來不同的算力平臺,只更換計算的模組,就可以實(shí)現(xiàn)從芯片到算力快速的落地應(yīng)用。

通過這種標(biāo)準(zhǔn)化的算力模組,讓算力可以快速抵達(dá)用戶,讓用戶可以快速地利用最先進(jìn)的算力。

“OCM”規(guī)范的價值和意義

浪潮信息服務(wù)器產(chǎn)品部產(chǎn)品規(guī)劃經(jīng)理羅劍認(rèn)為,隨著OCM規(guī)范的啟動,對算力上游廠商、終端用戶、系統(tǒng)集成商都大有裨益。

對于上游廠商來說,這個規(guī)范可以讓他們在做處理器的同時,把這個算力模塊做出來,新的平臺可以快速地在系統(tǒng)上面去做集成。

對于終端用戶來說,這種標(biāo)準(zhǔn)化可以實(shí)現(xiàn)對多元算力的統(tǒng)一管理、統(tǒng)一運(yùn)維,管理復(fù)雜性極大降低了。

對于系統(tǒng)集成商來說,算力標(biāo)準(zhǔn)化后,就可以在不同的系統(tǒng)里應(yīng)用統(tǒng)一的算力模塊,類似于硬盤一樣,一個系統(tǒng)里面可以支持多家的硬盤,一樣的道理,未來一個系統(tǒng)里面就可以支持多元算力平臺。

事實(shí)上,這不是浪潮信息首次參與發(fā)起相關(guān)行業(yè)規(guī)范。此前,浪潮信息就參與和支持了針對超大規(guī)模深度學(xué)習(xí)訓(xùn)練的AI加速卡的“開放加速規(guī)范OAM”。

“OAM”構(gòu)建了一個統(tǒng)一的加速芯片底座,解決了單個服務(wù)器內(nèi)多元AI加速卡形態(tài)和接口不統(tǒng)一,高速互連效率低,研發(fā)周期長等問題,促進(jìn)了加速算力單元接口的統(tǒng)一和生態(tài)的完善。

目前開放計算規(guī)范OAM已成為全球最多高端AI加速芯片遵循的統(tǒng)一設(shè)計標(biāo)準(zhǔn),全球20多家芯片企業(yè)支持開放加速規(guī)范,為AI芯片企業(yè)節(jié)省研發(fā)時間6個月以上,為整體產(chǎn)業(yè)研發(fā)投入節(jié)省數(shù)十億元,極大地降低了AI算力產(chǎn)業(yè)創(chuàng)新的難度,加速高質(zhì)量AI算力普惠發(fā)展。

浪潮信息最新一代基于OAM規(guī)范的AI服務(wù)器NF5698G7支持多種基于OAM規(guī)范的開放加速芯片,并為用戶構(gòu)建了一個千卡液冷集群,支持超千億參數(shù)量的AI大模型訓(xùn)練。

目前,OAM規(guī)范還在持續(xù)迭代,未來基于OAM2.0規(guī)范的AI加速卡將支持1024張加速卡的卡間互聯(lián),突破大模型互聯(lián)瓶頸。

談到剛剛啟動的OCM規(guī)范,趙帥表示:“開放計算對于智算時代有非常重要的意義和價值,要用開放應(yīng)對多元算力的挑戰(zhàn)。OCM是國內(nèi)首個服務(wù)器模組設(shè)計規(guī)范,希望更多的行業(yè)伙伴以及更多的用戶參與進(jìn)來,真正讓多元的統(tǒng)一算力模組盡快地走進(jìn)每一個用戶的機(jī)房當(dāng)中?!?br>

2024-08-12
浪潮信息趙帥:未來一切計算皆AI,構(gòu)建開放算力模組規(guī)范至關(guān)重要
通用算力也要具有AI計算的能力,可以說“未來一切計算皆AI”。事實(shí)上,這不是浪潮信息首次參與發(fā)起相關(guān)行業(yè)規(guī)范。此前,浪潮信息就參與和支持了針對超大規(guī)模深度學(xué)習(xí)訓(xùn)練的AI加速卡的“開放加速規(guī)范OAM”。浪潮信息最新一代基于OAM規(guī)范的AI服務(wù)器NF5698G7支持多種基于OAM規(guī)范的開放加速芯片,并為用戶構(gòu)建了一個千卡液冷集群,支持超千億參數(shù)量的AI大模型訓(xùn)練。

長按掃碼 閱讀全文