融合架構(gòu)3.0:開啟計(jì)算體系架構(gòu)再創(chuàng)新的密鑰

2019年,圖靈獎(jiǎng)獲得者John Hennessy和David Patterson在ACM刊登署名文章《計(jì)算機(jī)體系結(jié)構(gòu)的新黃金時(shí)代》中認(rèn)為:計(jì)算體系架構(gòu)又將迎來(lái)創(chuàng)新的黃金十年,新的架構(gòu)創(chuàng)新會(huì)帶來(lái)更低成本,以及更優(yōu)的性能、安全性和能耗。

的確,在摩爾定律(Moore’s Law)和登納德縮放(Dennard Scaling)定律逐漸放緩甚至走向失效之際,現(xiàn)有計(jì)算機(jī)體系架構(gòu)的弱缺點(diǎn)日趨凸顯。尤其是2016年以來(lái),深度學(xué)習(xí)、機(jī)器學(xué)習(xí)、大模型等獲得突飛猛進(jìn)的進(jìn)步,GPU、NPU等XPU需求旺盛,算力需求全面走向異構(gòu)化、多樣化,計(jì)算體系架構(gòu)開啟新紀(jì)元已是大勢(shì)所趨。

那么,計(jì)算體系架構(gòu)再創(chuàng)新的重點(diǎn)與方向有哪些?XPU等部件級(jí)的架構(gòu)創(chuàng)新固然令人眼前一亮,但從算力整體視角的創(chuàng)新終究能給產(chǎn)業(yè)發(fā)展帶來(lái)更具影響力的突破。正如浪潮信息從2014年開始就致力于融合架構(gòu)的探索,兩代融合架構(gòu)對(duì)于算力產(chǎn)業(yè)發(fā)展起到關(guān)鍵作用。

如今,在OCP China Day 2023上,浪潮信息又發(fā)布了融合架構(gòu)3.0原型系統(tǒng),帶來(lái)系統(tǒng)級(jí)多元異構(gòu)融合、機(jī)柜級(jí)解耦和池化以及資源異步升級(jí)等多個(gè)層面的創(chuàng)新,為計(jì)算體系架構(gòu)新黃金時(shí)代書寫濃墨重彩的一筆。

浪潮信息推出融合架構(gòu)3.0原型系統(tǒng)

以數(shù)據(jù)為中心的時(shí)代到來(lái)

如果說(shuō)數(shù)據(jù)是這個(gè)時(shí)代最重要的生產(chǎn)要素,那么AI則是實(shí)現(xiàn)數(shù)據(jù)價(jià)值的最佳生產(chǎn)工具。

如今,一個(gè)以數(shù)據(jù)為中心的時(shí)代正在加速到來(lái)。IDC《全球計(jì)算力指數(shù)白皮書203》認(rèn)為,未來(lái)基礎(chǔ)架構(gòu)將是以數(shù)據(jù)為中心的計(jì)算體系架構(gòu)。事實(shí)上,從最近十年人工智能的發(fā)展也能透視這一趨勢(shì),深度學(xué)習(xí)、機(jī)器學(xué)習(xí)、LLM大模型的興起,帶來(lái)了翻天覆地般的算力新需求,也對(duì)于傳統(tǒng)以CPU為核心的計(jì)算體系架構(gòu)帶來(lái)巨大沖擊。

AIGC浪潮到來(lái),讓數(shù)據(jù)規(guī)模、參數(shù)量、并行處理規(guī)模再上一個(gè)臺(tái)階,也使得數(shù)據(jù)中心的 “內(nèi)存墻”、“I/O墻”、“功耗墻”等現(xiàn)象愈發(fā)突出。例如,OpenAI的GPT-4的參數(shù)量已經(jīng)達(dá)到驚人的1.8萬(wàn)億,有13萬(wàn)億Token訓(xùn)練,未來(lái)的GPT-5參數(shù)量更可能達(dá)到10萬(wàn)億,海量參數(shù)的并行處理,不僅帶來(lái)對(duì)于內(nèi)存需求的大幅增加,也會(huì)產(chǎn)生梯度數(shù)據(jù)聚合與分發(fā)等海量通信需求,以及極高的能耗表現(xiàn)。

除了AI帶來(lái)顯著算力挑戰(zhàn)之外,千行百業(yè)用戶們的數(shù)字化轉(zhuǎn)型已步入深水區(qū),云、邊、端等業(yè)務(wù)場(chǎng)景極為豐富多樣,這些業(yè)務(wù)場(chǎng)景均有一個(gè)顯著特點(diǎn),即以數(shù)據(jù)驅(qū)動(dòng)為核心,對(duì)于算力需求卻五花八門,對(duì)于底層的算力基礎(chǔ)設(shè)施提出了更加復(fù)雜和細(xì)分化的需求,而傳統(tǒng)計(jì)算架構(gòu)從處理能力、運(yùn)維管理、資源共享等維度均很難滿足數(shù)字化轉(zhuǎn)型的深層次需求。

因此,以系統(tǒng)創(chuàng)新的視角來(lái)推動(dòng)計(jì)算體系架構(gòu)發(fā)展是當(dāng)下最為重要的方向,需要讓基礎(chǔ)設(shè)施整體資源進(jìn)行解耦與池化,以更加細(xì)粒度功能服務(wù)來(lái)支撐起豐富多樣的應(yīng)用需求。正如浪潮信息服務(wù)器產(chǎn)品線總經(jīng)理趙帥所言:“當(dāng)前計(jì)算體系架構(gòu)的不足已經(jīng)在逐漸放大。融合架構(gòu)3.0是浪潮信息對(duì)計(jì)算體系架構(gòu)整體創(chuàng)新的一種探索。”

融合架構(gòu)3.0創(chuàng)新難在哪

《人月神話》有句名言:“這個(gè)世界上沒(méi)有銀彈。”同樣,計(jì)算體系架構(gòu)的創(chuàng)新是一個(gè)長(zhǎng)期、不斷摸索和迭代上升的過(guò)程,創(chuàng)新逐步積累才能實(shí)現(xiàn)從量變到質(zhì)變,絕沒(méi)有捷徑可走。

浪潮信息融合架構(gòu)九年發(fā)展歷程最能體現(xiàn)這一點(diǎn)。在融合架構(gòu)1.0時(shí)期,浪潮信息主要解決的是集中供電、散熱等非IT資源的模塊化;融合架構(gòu)2.0實(shí)現(xiàn)進(jìn)一步的升級(jí),實(shí)現(xiàn)存儲(chǔ)、網(wǎng)絡(luò)等資源的池化,并利用虛擬化、云計(jì)算等技術(shù)來(lái)滿足用戶需求;而融合架構(gòu)3.0則有了突破性的進(jìn)展,實(shí)現(xiàn)計(jì)算資源、存儲(chǔ)資源、內(nèi)存資源、異構(gòu)加速資源等核心IT資源徹底解耦與池化,通過(guò)軟件定義的方式實(shí)現(xiàn)資源協(xié)同動(dòng)態(tài)調(diào)度。

“融合架構(gòu)3.0原型系統(tǒng)效率可比上一代軟件虛擬化系統(tǒng)提升一到兩個(gè)數(shù)量級(jí),可擴(kuò)展性提高2~4倍,系統(tǒng)延時(shí)降低90%。”趙帥介紹道。

所有資源的解耦與池化,意味著打破了過(guò)去資源孤立的情況,通過(guò)整體協(xié)調(diào)與調(diào)度,應(yīng)用可以根據(jù)需求來(lái)對(duì)資源進(jìn)行隨需所用,這無(wú)疑會(huì)對(duì)性能、成本、能耗等方面帶來(lái)全面的優(yōu)化。

趙帥直言,浪潮信息在探索融合架構(gòu)3.0時(shí)遇到最大的挑戰(zhàn)有二:其一是內(nèi)存池化資源,其二是池化后系統(tǒng)的互連。

眾所周知,內(nèi)存解耦與池化一直都是計(jì)算體系架構(gòu)創(chuàng)新的難點(diǎn)。在AI大模型等帶動(dòng)下,CPU、GPU、FPGA等多設(shè)備的大容量?jī)?nèi)存使用已經(jīng)成為常態(tài),進(jìn)而導(dǎo)致了內(nèi)存資源池化之后的緩存一致性等挑戰(zhàn)。融合架構(gòu)3.0的思路就是研制新型應(yīng)用串行緩存一致性總線及其交換技術(shù)的內(nèi)存模組和內(nèi)存池化系統(tǒng),利用CXL互聯(lián)技術(shù)來(lái)實(shí)現(xiàn)多設(shè)備之間的高速互聯(lián),為大規(guī)模內(nèi)存擴(kuò)展與內(nèi)存資源池化提供了低延時(shí)的訪問(wèn)路徑以及緩存一致性保證,滿足內(nèi)存池化后的資源共享和高效運(yùn)算調(diào)度需求。

趙帥介紹:“利用CXL高速互聯(lián)技術(shù),可以讓遠(yuǎn)端內(nèi)存像本地內(nèi)存一樣,達(dá)到相近的延遲。CXL已經(jīng)發(fā)布3.0版本,數(shù)據(jù)傳輸速率提升到64GT/s,隨著更多AI相關(guān)處理器接入CXL 交換網(wǎng)絡(luò),整系統(tǒng)內(nèi)存可以實(shí)現(xiàn)硬件層面全局共享,將顯著緩解AI大模型訓(xùn)練‘內(nèi)存墻’問(wèn)題。”

由于實(shí)現(xiàn)了機(jī)柜級(jí)的解耦和池化,這意味著數(shù)據(jù)速率不斷攀升和系統(tǒng)鏈路更加復(fù)雜,池化之后互連設(shè)計(jì)變得無(wú)比重要,這是確保池化之后資源協(xié)同調(diào)度和靈活按需使用的關(guān)鍵。浪潮信息的解決思路是在融合架構(gòu)3.0中針對(duì)復(fù)雜鏈路高速互連進(jìn)行高精度的擬合仿真研究,準(zhǔn)確分析系統(tǒng)互連鏈路多樣化拓?fù)浜蛡鬏斔俾实臉O限。并通過(guò)探索服務(wù)器內(nèi)部總線光互連技術(shù),延展鏈路傳輸距離,實(shí)現(xiàn)數(shù)據(jù)中心大規(guī)模資源解耦池化。

浪潮信息技術(shù)研發(fā)部副總經(jīng)理吳安認(rèn)為:“融合架構(gòu)3.0從設(shè)計(jì)角度是按照三步走,首先是解耦,之后把不同資源進(jìn)行池化,池化之后就是重構(gòu)。在這個(gè)過(guò)程中,互連是核心所在。例如,解耦池化之后,涉及到時(shí)序、時(shí)鐘管理、供電管理、散熱管理等如何協(xié)同管理與控制;資源重構(gòu)時(shí)的邏輯單元、池化管理以及策略自動(dòng)化等都需要互聯(lián)技術(shù)來(lái)協(xié)調(diào)。”

事實(shí)上,浪潮信息融合架構(gòu)3.0原型系統(tǒng)的出現(xiàn),將逐步打破未來(lái)算力產(chǎn)品迭代的模式。眾所周知,過(guò)去服務(wù)器等算力產(chǎn)品的更新與迭代以處理器更新為產(chǎn)品更新?lián)Q代的基礎(chǔ)。如今,融合架構(gòu)3.0原型系統(tǒng)的出現(xiàn),則有望真正實(shí)現(xiàn)以數(shù)據(jù)處理為需求中心,根據(jù)用戶業(yè)務(wù)需求來(lái)進(jìn)行更新迭代。

吳安介紹:“融合架構(gòu)3.0提供了異步迭代這個(gè)更具想象空間的方式。因?yàn)槿诤霞軜?gòu)3.0不再以CPU處理器為核心,而是與數(shù)據(jù)處理為核心。例如,很多用戶業(yè)務(wù)上并不需要很快升級(jí)到DDR 5,業(yè)務(wù)對(duì)于DDR 5帶寬速率提升并不在意,反而希望利用DDR 4延時(shí)、價(jià)格等優(yōu)勢(shì),此時(shí)可以通過(guò)融合架構(gòu)3.0實(shí)現(xiàn)異步升迭代,在DDR 5平臺(tái)上使用DDR 4?!?/p>

John Hennessy和David Patterson在《計(jì)算機(jī)體系架構(gòu)的新黃金時(shí)代》也認(rèn)為,未來(lái)的計(jì)算體系架構(gòu)垂直整合將變得無(wú)比重要。顯然,融合架構(gòu)3.0原型系統(tǒng)是體系架構(gòu)創(chuàng)新的一次重要探索,它在多個(gè)技術(shù)點(diǎn)突破的基礎(chǔ)上,從整體角度形成一個(gè)系統(tǒng)級(jí)的解決方案。

“融合架構(gòu)3.0 目前是一個(gè)原型系統(tǒng),未來(lái)在技術(shù)上還會(huì)有更多突破點(diǎn),從而實(shí)現(xiàn)更好的落地效果?!壁w帥如是說(shuō)。

開啟體系架構(gòu)再創(chuàng)新的密鑰

近年來(lái),業(yè)界關(guān)于計(jì)算體系架構(gòu)創(chuàng)新的呼聲此起彼伏。在眾多廠商中,浪潮信息是為數(shù)不多路線規(guī)劃明確、穩(wěn)步推進(jìn)的廠商之一。隨著融合架構(gòu)3.0 原型系統(tǒng)的發(fā)布,作為算力產(chǎn)業(yè)領(lǐng)導(dǎo)者的浪潮信息也有望以融合架構(gòu)3.0為抓手,牽引整個(gè)產(chǎn)業(yè)界加速開啟計(jì)算體系架構(gòu)的黃金時(shí)代。

首先,融合架構(gòu)3.0 作為計(jì)算體系架構(gòu)創(chuàng)新探索的一次突破,猶如一個(gè)開放的生態(tài),將極大降低新技術(shù)融入和采用的門檻,并有望帶動(dòng)整個(gè)算力產(chǎn)業(yè)界的創(chuàng)新活躍度。例如,GPU之所以在當(dāng)前AI大模型等領(lǐng)域受到追捧,很關(guān)鍵的因素在于其工具等生態(tài)的成熟,隨著AI大模型逐步融入到各行各業(yè)之中,未來(lái)還會(huì)衍生出大量的推理和訓(xùn)練需求,通過(guò)融合架構(gòu)3.0可以引入更多優(yōu)秀的新技術(shù)。

其次,融合架構(gòu)3.0原型系統(tǒng)的發(fā)布,有望帶動(dòng)創(chuàng)新技術(shù)加速落地到千行百業(yè)的數(shù)字化轉(zhuǎn)型之中。當(dāng)前,融合架構(gòu)主要還是互聯(lián)網(wǎng)用戶在廣泛使用,但隨著千行百業(yè)數(shù)字化轉(zhuǎn)型步入深水區(qū),互聯(lián)網(wǎng)用戶今天在基礎(chǔ)設(shè)施遇到的挑戰(zhàn)可能就是未來(lái)行業(yè)用戶會(huì)遇到的。因此,融合架構(gòu)3.0可以快速?gòu)浹a(bǔ)傳統(tǒng)行業(yè)用戶的技術(shù)鴻溝,實(shí)現(xiàn)業(yè)務(wù)的加速轉(zhuǎn)型。

毫無(wú)疑問(wèn),下一個(gè)十年將是計(jì)算體系架構(gòu)創(chuàng)新的“寒武紀(jì)”,各種創(chuàng)新必然大爆發(fā)和層出不窮,一個(gè)令人激動(dòng)的時(shí)代已然開啟。浪潮信息融合架構(gòu)3.0原型系統(tǒng)無(wú)疑是計(jì)算體系架構(gòu)一次大膽創(chuàng)新,對(duì)于產(chǎn)業(yè)界有著深遠(yuǎn)意義。

“面向未來(lái),企業(yè)各項(xiàng)業(yè)務(wù)會(huì)越來(lái)越依賴數(shù)據(jù)及價(jià)值,算力技術(shù)也需要不斷演進(jìn),去幫助企業(yè)提升數(shù)據(jù)處理效率和最大化釋放數(shù)據(jù)價(jià)值?!壁w帥最后表示道。

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無(wú)關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2023-08-27
融合架構(gòu)3.0:開啟計(jì)算體系架構(gòu)再創(chuàng)新的密鑰
融合架構(gòu)3.0:開啟計(jì)算體系架構(gòu)再創(chuàng)新的密鑰

長(zhǎng)按掃碼 閱讀全文