大緩存更強勁,搭載 AMD Milan-X 的浪潮 GPU 服務器 NF5468A5 深度評測

據(jù)近日業(yè)界發(fā)布的評測報告顯示,以浪潮 GPU 服務器 NF5468A5 為平臺,搭載 2 顆 AMD Milan-X 7773X 運行常見的氣象應用 WRF 和計算流體力學應用 OpenFOAM 作為性能基準測試,其性能相比搭載兩顆 Rome 7742 時的計算性能提升可高達 80%。

NF5468A5 是一款 4U 支持 2 顆 AMD EPYC 處理器和 8 顆雙寬 GPU 卡,面向 AI 訓練、推理、視頻編解碼等多種應用場景的 GPU 服務器。此次測試采用分別搭載 2 顆 AMD Milan-X 7773X、Milan 7543 和 Rome 7742 的配置組合。

AMD Milan-X 處理器最大的亮點,就是采用 3D 堆疊技術(3D V-Cache),在不改變處理器面積的前提下,可用 L3 緩存(SRAM)總數(shù)增加三倍。做個形象的比喻,這種 3D 堆疊技術就像將把相同面積的平房升級成三層小樓,通過縱向空間成倍擴展緩存數(shù)量。評測采用的 NF5468A5 平臺是浪潮信息暢銷海內(nèi)外的彈性云 AI 服務器 NF5468 系列的全新產(chǎn)品,率先支持 PCIe 4.0 技術,4U 空間內(nèi)可裝載 2 顆采用 7nm 先進制程工藝的 AMD EPYC 處理器和 8 塊 PCIe Gen4 接口的 AI 加速卡,能夠最大限度的發(fā)揮 Milan-X 處理器的極致性能。

WRF(The Weather Research and Forecasting Model),即天氣預報模式,被譽為是次世代的中尺度天氣預報模式,往往用于大范圍高分辨的氣候模擬,對系統(tǒng)的運算性能、內(nèi)存的要求非常高;OpenFOAM(Open Source Field Operation and Manipulation)是對連續(xù)介質(zhì)力學問題進行數(shù)值計算的軟件,經(jīng)常應用于汽車仿真等行業(yè),進行仿真計算需要處理大量的實時數(shù)據(jù),所以對系統(tǒng)的計算能力、數(shù)據(jù)吞吐能力都有很高的要求。

基于浪潮 NF5468A5 評測報告顯示,Milan-X 處理器通過搭載 3D 堆疊技術獲得更高的 L3 緩存,確實對計算性能有較大提升,而性能改進意味著企業(yè)可以在更少的服務器上運行相同的作業(yè),消耗的功率也能有明顯降低。如下是評測報告中的性能測試數(shù)據(jù):

在 WRF 測試中,使用單節(jié)點相同核心數(shù),以 Rome 7742 處理器運行時間為基準,在 Milan 7543 上的計算性能提升 14%~27%,而在 Milan-X 7773X 處理器上性能提升 23%~34%。

在 OpenFOAM 基準算例 motorBike 測試中,使用不可壓穩(wěn)態(tài)求解器 simpleFoam 計算模擬摩托車和騎手周圍空氣的運動情況。同樣以 Rome 7742 處理器為基準,OpenFOAM 在 Milan 7543 處理器使用單節(jié)點相同核心測試性能提升 23%~28%,在 Milan-X 7773X 處理器上性能提升 34%~80%。

在本次評測中也對 NF5468A5 有比較細致的介紹,據(jù)浪潮官網(wǎng)顯示 NF5468A5 正在推出“超值機型限免試用”,對該 GPU 服務器感興趣的不妨一試。如下是評測中對于浪潮 NF5468A5 的介紹:

NF5468A5 采用分區(qū)散熱設計,內(nèi)置獨立的 CPU 和 GPU 主板,且分別安裝在不同的平面。從機箱內(nèi)部結(jié)構來看,設計者將發(fā)熱量高的的 GPU 放在了機箱上 3U 空間,CPU 板處于機箱下 1U,內(nèi)置 6 對 12 個 6056 風扇模組配合導風罩,實現(xiàn)機箱內(nèi)風道分流,正是基于這種獨特分層散熱設計,使得送測的 NF5468A5 服務器可以支持 280W 最高功耗的 Milan-X 7773X。系統(tǒng)設計支持 32 條 DDR4 ECC 內(nèi)存,支持 LRDIMM / RDIMM,提供高達 8T 的本地內(nèi)存, 實現(xiàn)與 1536 MB 超大 L3 cache 間的高速數(shù)據(jù)交互。

NF5468A5 采用了 CPU 直連 GPU 架構設計,率先支持 PCI-E 4.0 技術,最大限度提升 CPU 與 GPU 間的帶寬,降低通信延遲,達到最佳效能,為客戶提供極致優(yōu)化的算力。系統(tǒng)提供豐富的 IO 擴展能力,提供 10 個 PCIe 4.0 X16 擴展槽位,支持 8 個全高全長的 GPU 加速卡。提供靈活存儲方案,可選前置 12×3.5 英寸硬盤或 24×2.5 英寸硬盤,提供超大的本地存儲能力,同時最大可支持 8 個熱插拔 NVMe SSD 全閃配置,提供存儲到內(nèi)存到 L3 cache 的高速訪存,可實現(xiàn)十倍于高端企業(yè)級 SATA SSD 的 IOPS 性能,帶來極致 IO 存儲性能飛躍。

(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )