【算力時代】是超云推出的系列案例分享專欄,旨在聚焦不同行業(yè)成功案例,展現(xiàn)超云研發(fā)成果,“算力”是國家信息化的基礎(chǔ),“時代”代表承上啟下、繼往開來,把握時代脈搏,為數(shù)字化的發(fā)展、智能化的升級添磚加瓦。
經(jīng)過十余年發(fā)展,超云產(chǎn)品已覆蓋智能計算、信創(chuàng)整機(jī)、私有云及云服務(wù)等領(lǐng)域,服務(wù)于教育、金融、能源、交通、互聯(lián)網(wǎng)、政企、運(yùn)營商、醫(yī)療等八大行業(yè),為客戶提供安全、可信的軟硬件一體化解決方案,是國內(nèi)專業(yè)的數(shù)據(jù)中心產(chǎn)品及服務(wù)提供商。
2023年超云將在打造技術(shù)領(lǐng)先、安全可靠的國產(chǎn)品牌道路上砥礪前行,續(xù)寫全新算力時代。
近年來,人工智能領(lǐng)域取得了迅猛發(fā)展,許多高校及科研機(jī)構(gòu)開始利用各自學(xué)科的計算分析工具來解析實驗數(shù)據(jù)。無論是計算分析還是人工智能領(lǐng)域的研究,都高度依賴于高質(zhì)量、大規(guī)模的算力。而這些需求投射至高等院校,往往體現(xiàn)為對高校計算中心或超算中心建設(shè)的要求上。
某雙一流大學(xué)生命科學(xué)學(xué)院作為中國乃至全球生命科學(xué)領(lǐng)域的知名學(xué)府,擁有眾多的教學(xué)和科研任務(wù),對高性能計算資源的需求日益增長。在日??蒲?、實驗等方面的使用中發(fā)現(xiàn),學(xué)院GPU集群算力水平已趨于飽和,亟需對現(xiàn)有設(shè)備進(jìn)行擴(kuò)容,以滿足未來教學(xué)實踐的需求,同時也將進(jìn)一步提升超算中心運(yùn)行的穩(wěn)定性與安全性。
為了滿足學(xué)院師生在基因組學(xué)、蛋白質(zhì)結(jié)構(gòu)預(yù)測、藥物篩選等領(lǐng)域的研究需求,學(xué)院積極推進(jìn)GPU集群建設(shè)項目,以提供強(qiáng)大的計算能力,支持學(xué)院內(nèi)教學(xué)和科研任務(wù)的開展。經(jīng)過深入了解和對比,學(xué)院最終決定通過國家高新技術(shù)企業(yè)超云,定制一整套完備的GPU集群擴(kuò)容方案,以滿足學(xué)院的教學(xué)研究需要。
針對此次建設(shè)方案,學(xué)院提出多項需求:
高性能:需要大規(guī)模并行計算能力。
高可靠:深度學(xué)習(xí)模型訓(xùn)練不中斷。
高擴(kuò)展:后續(xù)可根據(jù)科研需求情況進(jìn)行相應(yīng)算力資源的擴(kuò)展。
高利用率:有效調(diào)度GPU資源,減少算力損耗。
響應(yīng)及時:遇到問題時,廠商能夠快速響應(yīng)、解決問題。
根據(jù)客戶需求,超云從產(chǎn)品選型、性能規(guī)劃、數(shù)據(jù)規(guī)劃、服務(wù)響應(yīng)這四個方面入手,制定如下GPU集群擴(kuò)容方案:
產(chǎn)品選型
超云利用多年高校案例部署經(jīng)驗以及完善的GPU服務(wù)器產(chǎn)品線作為切入點,提前與客戶深入交流,了解學(xué)院科研的業(yè)務(wù)環(huán)境,同時考慮學(xué)院當(dāng)前現(xiàn)有資源基礎(chǔ)和未來可能的擴(kuò)展需求,制定合理的硬件配置方案。最終確定超云R8428 G12作為GPU集群擴(kuò)容業(yè)務(wù)首選。
R8428 G12是超云推出的一款高性能AI服務(wù)器,作為人工智能領(lǐng)域旗艦產(chǎn)品,整機(jī)支持2顆英特爾®第三代 至強(qiáng)® 可擴(kuò)展處理器,最高主頻可達(dá)3.7 GHz;同時整機(jī)最大可支持10個雙寬高性能GPU卡,為行業(yè)客戶提供充裕AI算力。同時卓越的產(chǎn)品設(shè)計為其帶來了極致的擴(kuò)展性,具有高性能、高可靠、易維護(hù)的特點,適用于高性能科學(xué)計算、AI訓(xùn)練及推理等應(yīng)用場景。
超云服務(wù)器R8428 G12
性能規(guī)劃
超云推薦每臺服務(wù)器搭載兩顆英特爾® 至強(qiáng)® 金牌6338(32C 2.0GHz)處理器,1T DDR4 3200內(nèi)存,同時搭載8塊高性能 GPU卡,可以提供高度并行的計算能力,滿足生命科學(xué)研究領(lǐng)域?qū)Ω咝阅苡嬎愕男枨蟆?/p>
數(shù)據(jù)規(guī)劃
本地數(shù)據(jù)存儲在5塊3.84T大容量SSD盤中,加速數(shù)據(jù)的I/O性能,提高研究效率。
服務(wù)響應(yīng)
超云自研全內(nèi)嵌智能管理芯片可實現(xiàn)IPMI2.0遠(yuǎn)程系統(tǒng)監(jiān)控、遠(yuǎn)程運(yùn)維,顯著提高數(shù)據(jù)中心的運(yùn)維水平,同時鈦金級電源可提升能源轉(zhuǎn)換效率,保障系統(tǒng)穩(wěn)定,整機(jī)的多項冗余和保護(hù)技術(shù),有效提高設(shè)備整體可用性和可維護(hù)性。依托超云專業(yè)的售后服務(wù),定期進(jìn)行產(chǎn)品巡檢、專業(yè)維護(hù)、及時響應(yīng),消除客戶的后顧之憂。
該解決方案具有以下功能和優(yōu)勢:
超云R8428 G12支持英特爾® 至強(qiáng)® 第三代可擴(kuò)展處理器,最高支持80個核心和16個內(nèi)存通道,同時候支持 PCIe 4.0 連接,互聯(lián)帶寬可達(dá) 64GB/s,可向下兼容 PCIe 3.0 。該解決方案通過雙層結(jié)構(gòu)設(shè)計實現(xiàn)了GPU和CPU的分層散熱,同時整機(jī)電源、風(fēng)扇等多部件都采用冗余設(shè)計,確保了業(yè)務(wù)的穩(wěn)定和連續(xù)。產(chǎn)品支持Ampere 架構(gòu) GPU 加速卡,支持 MIG 多實例,稀疏矩陣,NVlink Bridge 連接等領(lǐng)先技術(shù)。
借助該方案,客戶GPU集群算力得到顯著提升,可支持適配從消費(fèi)級到數(shù)據(jù)中心級的GPU顯示核心,以滿足不同算力及應(yīng)用場景。同時得益于超云服務(wù)器產(chǎn)品的高效節(jié)能,客戶在前期采購以及后期運(yùn)維成本上都有明顯降低。
當(dāng)前,國家基礎(chǔ)設(shè)施數(shù)字化、信息化的建設(shè)正在不斷加速,千行百業(yè)都在推進(jìn)算力升級,以滿足未來業(yè)務(wù)發(fā)展的需要。超云十余年來始終專注于數(shù)據(jù)中心產(chǎn)品及服務(wù)領(lǐng)域的產(chǎn)業(yè)布局,通過技術(shù)升級、產(chǎn)品迭代,解決行業(yè)客戶痛點,為千行百業(yè)提供安全、高效的一體化解決方案。
未來,超云將緊跟時代發(fā)展大方向,堅持自主創(chuàng)新、數(shù)實融合的發(fā)展路線,持續(xù)優(yōu)化解決方案,為推動教育及其他行業(yè)的信息化、智能化建設(shè)添磚加瓦。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )