助力教科研智能化建設 超云為“雙一流”高校GPU集群擴容賦能

【算力時代】是超云推出的系列案例分享專欄,旨在聚焦不同行業(yè)成功案例,展現(xiàn)超云研發(fā)成果,“算力”是國家信息化的基礎,“時代”代表承上啟下、繼往開來,把握時代脈搏,為數(shù)字化的發(fā)展、智能化的升級添磚加瓦。

經(jīng)過十余年發(fā)展,超云產(chǎn)品已覆蓋智能計算、信創(chuàng)整機、私有云及云服務等領域,服務于教育、金融、能源、交通、互聯(lián)網(wǎng)、政企、運營商、醫(yī)療等八大行業(yè),為客戶提供安全、可信的軟硬件一體化解決方案,是國內(nèi)專業(yè)的數(shù)據(jù)中心產(chǎn)品及服務提供商。

2023年超云將在打造技術領先、安全可靠的國產(chǎn)品牌道路上砥礪前行,續(xù)寫全新算力時代。

近年來,人工智能領域取得了迅猛發(fā)展,許多高校及科研機構開始利用各自學科的計算分析工具來解析實驗數(shù)據(jù)。無論是計算分析還是人工智能領域的研究,都高度依賴于高質量、大規(guī)模的算力。而這些需求投射至高等院校,往往體現(xiàn)為對高校計算中心或超算中心建設的要求上。

某雙一流大學生命科學學院作為中國乃至全球生命科學領域的知名學府,擁有眾多的教學和科研任務,對高性能計算資源的需求日益增長。在日常科研、實驗等方面的使用中發(fā)現(xiàn),學院GPU集群算力水平已趨于飽和,亟需對現(xiàn)有設備進行擴容,以滿足未來教學實踐的需求,同時也將進一步提升超算中心運行的穩(wěn)定性與安全性。

為了滿足學院師生在基因組學、蛋白質結構預測、藥物篩選等領域的研究需求,學院積極推進GPU集群建設項目,以提供強大的計算能力,支持學院內(nèi)教學和科研任務的開展。經(jīng)過深入了解和對比,學院最終決定通過國家高新技術企業(yè)超云,定制一整套完備的GPU集群擴容方案,以滿足學院的教學研究需要。

針對此次建設方案,學院提出多項需求:

高性能:需要大規(guī)模并行計算能力。

高可靠:深度學習模型訓練不中斷。

高擴展:后續(xù)可根據(jù)科研需求情況進行相應算力資源的擴展。

高利用率:有效調(diào)度GPU資源,減少算力損耗。

響應及時:遇到問題時,廠商能夠快速響應、解決問題。

根據(jù)客戶需求,超云從產(chǎn)品選型、性能規(guī)劃、數(shù)據(jù)規(guī)劃、服務響應這四個方面入手,制定如下GPU集群擴容方案:

產(chǎn)品選型

超云利用多年高校案例部署經(jīng)驗以及完善的GPU服務器產(chǎn)品線作為切入點,提前與客戶深入交流,了解學院科研的業(yè)務環(huán)境,同時考慮學院當前現(xiàn)有資源基礎和未來可能的擴展需求,制定合理的硬件配置方案。最終確定超云R8428 G12作為GPU集群擴容業(yè)務首選。

R8428 G12是超云推出的一款高性能AI服務器,作為人工智能領域旗艦產(chǎn)品,整機支持2顆英特爾®第三代 至強® 可擴展處理器,最高主頻可達3.7 GHz;同時整機最大可支持10個雙寬高性能GPU卡,為行業(yè)客戶提供充裕AI算力。同時卓越的產(chǎn)品設計為其帶來了極致的擴展性,具有高性能、高可靠、易維護的特點,適用于高性能科學計算、AI訓練及推理等應用場景。

超云服務器R8428 G12

性能規(guī)劃

超云推薦每臺服務器搭載兩顆英特爾® 至強® 金牌6338(32C 2.0GHz)處理器,1T DDR4 3200內(nèi)存,同時搭載8塊高性能 GPU卡,可以提供高度并行的計算能力,滿足生命科學研究領域對高性能計算的需求。

數(shù)據(jù)規(guī)劃

本地數(shù)據(jù)存儲在5塊3.84T大容量SSD盤中,加速數(shù)據(jù)的I/O性能,提高研究效率。

服務響應

超云自研全內(nèi)嵌智能管理芯片可實現(xiàn)IPMI2.0遠程系統(tǒng)監(jiān)控、遠程運維,顯著提高數(shù)據(jù)中心的運維水平,同時鈦金級電源可提升能源轉換效率,保障系統(tǒng)穩(wěn)定,整機的多項冗余和保護技術,有效提高設備整體可用性和可維護性。依托超云專業(yè)的售后服務,定期進行產(chǎn)品巡檢、專業(yè)維護、及時響應,消除客戶的后顧之憂。

該解決方案具有以下功能和優(yōu)勢:

超云R8428 G12支持英特爾® 至強® 第三代可擴展處理器,最高支持80個核心和16個內(nèi)存通道,同時候支持 PCIe 4.0 連接,互聯(lián)帶寬可達 64GB/s,可向下兼容 PCIe 3.0 。該解決方案通過雙層結構設計實現(xiàn)了GPU和CPU的分層散熱,同時整機電源、風扇等多部件都采用冗余設計,確保了業(yè)務的穩(wěn)定和連續(xù)。產(chǎn)品支持Ampere 架構 GPU 加速卡,支持 MIG 多實例,稀疏矩陣,NVlink Bridge 連接等領先技術。

借助該方案,客戶GPU集群算力得到顯著提升,可支持適配從消費級到數(shù)據(jù)中心級的GPU顯示核心,以滿足不同算力及應用場景。同時得益于超云服務器產(chǎn)品的高效節(jié)能,客戶在前期采購以及后期運維成本上都有明顯降低。

當前,國家基礎設施數(shù)字化、信息化的建設正在不斷加速,千行百業(yè)都在推進算力升級,以滿足未來業(yè)務發(fā)展的需要。超云十余年來始終專注于數(shù)據(jù)中心產(chǎn)品及服務領域的產(chǎn)業(yè)布局,通過技術升級、產(chǎn)品迭代,解決行業(yè)客戶痛點,為千行百業(yè)提供安全、高效的一體化解決方案。

未來,超云將緊跟時代發(fā)展大方向,堅持自主創(chuàng)新、數(shù)實融合的發(fā)展路線,持續(xù)優(yōu)化解決方案,為推動教育及其他行業(yè)的信息化、智能化建設添磚加瓦。

(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )