SCOW首次亮相HPC China 2022,以算網(wǎng)融合助力“東數(shù)西算”工程發(fā)展

12月13日,以“新算力 新賦能 新未來”為主題的2022 CCF全國高性能計算學(xué)術(shù)年會(CCF HPC China 2022)在線上正式召開。作為高性能計算領(lǐng)域全球最具影響力的三大超算盛會之一,大會邀請到2021年圖靈獎獲得者Jack Dongarra,中國科學(xué)院院士陳國良、錢德沛,中國工程院院士陳左寧、孫凝暉、王軍成,加拿大工程院院士K. Nandakumar等業(yè)界專家齊聚一堂,暢談數(shù)字經(jīng)濟背景下算力的創(chuàng)新與演進,研討高性能計算的場景化應(yīng)用,探討新一代信息技術(shù)未來的發(fā)展趨勢。

圖形用戶界面, 應(yīng)用程序, PowerPoint描述已自動生成

北京大學(xué)計算與數(shù)字經(jīng)濟研究院算力網(wǎng)絡(luò)研究中心主任樊春應(yīng)邀參加本次大會第七屆高校高性能計算平臺應(yīng)用交流論壇并作《北京大學(xué)高性能計算系統(tǒng)軟件》主題演講。報告分析了目前我國算力中心在使用和管理中存在的痛點,并提出了相應(yīng)的解決方案。會上,由樊春團隊自主研制的開源算力中心門戶和管理平臺——SCOW(Super Computing On Web)首次公開亮相。

當前,全球迎來新一輪科技革命和產(chǎn)業(yè)變革浪潮,算力已成為國家核心競爭力的體現(xiàn),全球主要國家和地區(qū)對于構(gòu)建和發(fā)展算力網(wǎng)絡(luò)已達成共識,并紛紛加快戰(zhàn)略布局進程。我國“東數(shù)西算”工程的全面啟動,為全國一體化算力網(wǎng)絡(luò)建設(shè)按下了加速鍵,但同時我們?nèi)悦媾R算力中心管理運營難、算力資源使用門檻高、算力系統(tǒng)運維部署復(fù)雜等痛點。

城市遠處有山描述已自動生成

北京大學(xué)計算與數(shù)字經(jīng)濟研究院自落戶長沙以來,緊隨時代步伐,聚焦國家戰(zhàn)略需求,成立了算力網(wǎng)絡(luò)研究中心。中心團隊多年深入一線運營,深刻理解用戶需求,積累了豐富的算力中心平臺運行維護經(jīng)驗,具備先進的互聯(lián)網(wǎng)系統(tǒng)開發(fā)技術(shù);通過十余年的研發(fā),成功打造了開源的算力中心門戶和管理平臺——SCOW。該平臺系統(tǒng)通過簡化集群軟件部署流程、統(tǒng)一平臺管理模式、提供圖形化操作界面、降低用戶使用門檻,實現(xiàn)算力中心資源易管理、易使用的目標,提高算力資源使用效率。截至目前,SCOW已完成了在北京大學(xué)超算平臺、國家天文臺超算平臺、中南大學(xué)超算平臺、中科院高能物理所超算平臺、香儂云超算平臺等多個平臺的部署。

在使用上,SCOW系統(tǒng)大幅降低算力中心用戶的使用門檻。用戶無需了解和配置SSH、VNC 等功能,便可通過SCOW的門戶平臺直接在瀏覽器上使用集群算力資源,讓Linux小白用戶也能順利提交作業(yè)。

在管理上,SCOW的管理平臺提供了一套標準化的算力中心管理模式以及用戶賬戶模型(租戶-賬戶-用戶三級模型)和計費收費模型,并且支持多集群管理,可以在一個系統(tǒng)內(nèi)管理算力中心的多個集群,能夠幫助新建的算力中心快速建立管理和運營制度。

在部署上, SCOW提供了簡易的部署功能,項目具備了包括調(diào)度系統(tǒng)、認證系統(tǒng)、共享存儲在內(nèi)的一體化部署能力,可以快速在新建的集群中部署上線。部署幾乎無侵入,可與其他管理平臺共存。

日歷描述已自動生成

SCOW實現(xiàn)的一套標準的平臺接口,為實現(xiàn)跨中心的算力融合打下了基礎(chǔ)。團隊正在SCOW實現(xiàn)的異構(gòu)平臺統(tǒng)一抽象基礎(chǔ)上,進行一體化算力網(wǎng)絡(luò)融合平臺的研制,旨在打通算力網(wǎng)絡(luò)中各算力中心的管理、使用、結(jié)算通道,連通算力孤島,實現(xiàn)算力靈活接入、統(tǒng)一調(diào)度;解決多應(yīng)用靈活接入,復(fù)雜網(wǎng)絡(luò)環(huán)境下低延遲高性能應(yīng)用可視化技術(shù),多中心多集群文件傳輸與管理,算力中心的標準化運營管理,多中心統(tǒng)一結(jié)算等問題。

圖形用戶界面, 網(wǎng)站描述已自動生成

在2022年11月26日召開的數(shù)字生態(tài)指數(shù)2022發(fā)布會上,北京大學(xué)計算與數(shù)字經(jīng)濟研究院聯(lián)合湖南省內(nèi)多家機構(gòu)成立了“湖南算力網(wǎng)絡(luò)融合協(xié)同創(chuàng)新平臺”,共同促進一體化新型算力網(wǎng)絡(luò)體系建設(shè)。本次SCOW系統(tǒng)的發(fā)布,也標志著創(chuàng)新平臺的工作正式啟航。接下來研究院將在國內(nèi)高校、科研機構(gòu)、國家超算、商業(yè)集群中做好SCOW的推廣部署工作,并繼續(xù)研發(fā)面向算力網(wǎng)絡(luò)的新產(chǎn)品,為優(yōu)化我國算力資源使用效率、促進算力網(wǎng)絡(luò)體系建設(shè)貢獻力量。

(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )