AI與科學(xué)共振,浪潮信息以高效算力平臺助力西湖大學(xué)科研創(chuàng)新

基于人工智能從海量數(shù)據(jù)中挖掘數(shù)據(jù)內(nèi)在聯(lián)系的強大學(xué)習(xí)和分析能力,AI for Science在假說的提出、實驗的設(shè)計、數(shù)據(jù)的收集與分析等各個科研環(huán)節(jié),都呈現(xiàn)出越來越重要的價值。目前,AI for Science已經(jīng)成為全球人工智能創(chuàng)新前沿,在生物、數(shù)學(xué)、物理、化學(xué)、天文等學(xué)科中取得了重要成果。

作為一所以“高起點、小而精、研究型”為辦學(xué)特色的新型研究型大學(xué),西湖大學(xué)對AI與科學(xué)之間的理解更進一步,正致力于打造“Science for AI”和“AI for Science”的科研閉環(huán),以基礎(chǔ)科學(xué)探索AI技術(shù)進步,以AI推動科學(xué)發(fā)現(xiàn)和技術(shù)創(chuàng)新。而為了支撐這一新的科研范式閉環(huán),西湖大學(xué)攜手浪潮信息等企業(yè)建設(shè)質(zhì)效兼?zhèn)涞乃懔ζ脚_,滿足各科研領(lǐng)域?qū)τ诖笠?guī)模數(shù)據(jù)處理和大規(guī)模科學(xué)計算的需求。

AI與科學(xué)共振,浪潮信息以高效算力平臺助力西湖大學(xué)科研創(chuàng)新

“AI for Science”的科研范式背后的算力挑戰(zhàn)

在西湖大學(xué),“Science for AI”和“AI for Science”正在建立一種新的科研范式“閉環(huán)”,AI與基礎(chǔ)科學(xué)不僅在深度融合,更在形成共振,極大加速和擴展科學(xué)研究的效率和能力邊界。

生命科學(xué)學(xué)院申恩志實驗室借助AI來加速非編碼RNA(non-coding RNA,簡稱ncRNA)研究,利用計算和AI技術(shù)高效解析復(fù)雜、龐大且高度動態(tài)的轉(zhuǎn)錄組、蛋白質(zhì)組等數(shù)據(jù),分析出其中的調(diào)控關(guān)系,找到調(diào)控規(guī)律;工學(xué)院金耀初團隊利用基礎(chǔ)科學(xué)的原理和方法來啟發(fā)和改進AI技術(shù),采用脈沖神經(jīng)網(wǎng)絡(luò)開發(fā)具有演化發(fā)育功能的具身智能機器人,讓機器人像自然界的生命體一樣演變成長;工學(xué)院的藍振忠團隊研發(fā)的心理咨詢大模型“小天”,追求人工智能不僅要具備IQ(智商),擁有強大知識儲備和學(xué)習(xí)能力,更要具備EQ(情商)……

對于西湖大學(xué)的眾多科學(xué)家來說,算力已經(jīng)成為一種必備的科研要素。比如在預(yù)測ncRNA功能與識別靶點、執(zhí)行復(fù)雜模式識別任務(wù)時,因數(shù)據(jù)更新與增長速度飛快,需要大量的算力資源來訓(xùn)練模型以支撐研究;演化發(fā)育機制與人工智能結(jié)合需要復(fù)雜系統(tǒng)建模理解,對種群和個體狀態(tài)信息、環(huán)境數(shù)據(jù)、歷史記錄等海量數(shù)據(jù)的特征提取和學(xué)習(xí),讓計算量呈指數(shù)級增長且有實時并行的要求,算力挑戰(zhàn)巨大;心理大模型“小天”的開發(fā)依賴于從海量心理咨詢數(shù)據(jù)中訓(xùn)練和推理文本的情感特征,需要AI的自然語言處理技術(shù)與強大算力支撐,以應(yīng)對大規(guī)模數(shù)據(jù)集與復(fù)雜模型架構(gòu)及參數(shù)。

隨著眾多科研項目的不斷推進,西湖大學(xué)原有的算力平臺已無法滿足各團隊的算力需求。同時,算力資源管理的重要性日漸凸顯。

西湖大學(xué)算力平臺面向全校開放,院系多、人員多且角色復(fù)雜,各科研團隊每天提交的計算任務(wù)高達上百個。不少實驗室有大模型訓(xùn)練的需求,需要統(tǒng)一調(diào)度大規(guī)模的計算資源以保障高效訓(xùn)練。但是算力平臺缺乏系統(tǒng)化的用戶管理和資源管理,經(jīng)常出現(xiàn)算力獨占和算力使用不足的情況,造成算力資源的巨大浪費。各實驗室提交計算任務(wù)后,經(jīng)常需要長時間等待才能得到結(jié)果,嚴重影響了科研進度。

如何充分挖掘算力資源的潛力,提高資源利用率、滿足各科研團隊的算力需求,成為西湖大學(xué)亟需解決的問題。

浪潮信息AI服務(wù)器+AIStation實現(xiàn)科研算力平臺的質(zhì)效兼?zhèn)?/strong>

針對西湖大學(xué)實際科研場景中對算力和使用效率的雙重挑戰(zhàn),浪潮信息以AI服務(wù)器打造出高質(zhì)量、高可靠性、高定制化的AI+科學(xué)算力基礎(chǔ)設(shè)施,為西湖大學(xué)提供高效算力支撐。同時,通過部署AIStation人工智能開發(fā)平臺,覆蓋從數(shù)據(jù)處理到模型預(yù)訓(xùn)練、模型微調(diào)和模型推理的AI工程化全流程,實現(xiàn)對多類型算力資源的統(tǒng)一納管以及智能調(diào)度。

AI與科學(xué)共振,浪潮信息以高效算力平臺助力西湖大學(xué)科研創(chuàng)新

西湖大學(xué)各科研團隊可通過AIStation自行按需申請資源,AIStation自動分配GPU資源給用戶使用,滿足生命科學(xué)、人工智能等科研項目的不同算力需求。其GPU共享策略可實現(xiàn)實現(xiàn)多人共用一臺機器、多人共用一張GPU卡,開發(fā)環(huán)境相互隔離互不影響,大大縮短了等待資源的時間。

AIStation支持任務(wù)排隊托管、定義任務(wù)優(yōu)先級,讓西湖大學(xué)各實驗室可以同時提交多個訓(xùn)練任務(wù),資源不足時排隊等待,一個任務(wù)訓(xùn)練結(jié)束后自動釋放資源給排隊等待的任務(wù),從而可以更好地利用夜間、假期執(zhí)行訓(xùn)練任務(wù)。同時可設(shè)置優(yōu)先級,讓重要任務(wù)優(yōu)先執(zhí)行。

針對西湖大學(xué)大模型訓(xùn)練的需求,AIStaiton實現(xiàn)了西湖大學(xué)異構(gòu)算力資源的統(tǒng)一池化管理,通過自研分布式任務(wù)自適應(yīng)系統(tǒng)自動化配置底層計算、存儲、網(wǎng)絡(luò)環(huán)境,并提供自定義修改基本超參數(shù)功能,幫助科研團隊提升分布式訓(xùn)練效率。同時,AIStation具有斷點續(xù)訓(xùn)能力,保障訓(xùn)練任務(wù)中斷后能以最快速度恢復(fù),有效訓(xùn)練時間占比達90%。

借助浪潮信息AIStation,西湖大學(xué)實現(xiàn)了算力資源高效使用,計算資源利用率提升到90%以上,運維人員工作效率提高50%,大大加快了科研創(chuàng)新速度并降低了科研成本。

西湖大學(xué)作為新時代高等教育與科研創(chuàng)新的先鋒力量,以AI+科學(xué)的融合共振,推動科學(xué)研究范式的變革。浪潮信息自2020年以來持續(xù)參與西湖大學(xué)智算中心建設(shè),為西湖大學(xué)提供穩(wěn)定可靠的算力系統(tǒng)和豐富的軟件堆棧,通過高效的算力基礎(chǔ)設(shè)施,加速西湖大學(xué)“AI+科學(xué)”的雙向融合與共振。

(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )