綠色、高效、智能:京東云算力基礎(chǔ)設(shè)施的可持續(xù)發(fā)展之道

在算力需求井噴的今天,數(shù)據(jù)中心作為數(shù)字經(jīng)濟(jì)的基石,其能效與可持續(xù)性成為了行業(yè)關(guān)注的焦點。作為云計算領(lǐng)域的佼佼者,京東云在為廣大用戶提供穩(wěn)定、高性能服務(wù)的同時,也致力于實現(xiàn)智算的綠色、可持續(xù)發(fā)展。近日,京東云通過一場現(xiàn)場探訪直播,全面展示了京東云在算力基礎(chǔ)設(shè)施可持續(xù)發(fā)展方面的獨特優(yōu)勢與創(chuàng)新實踐。

智算基礎(chǔ)設(shè)施挑戰(zhàn)與突破

隨著人工智能、大數(shù)據(jù)、云計算等技術(shù)的飛速發(fā)展,算力需求呈爆炸式增長,也對算力基礎(chǔ)設(shè)施提出了前所未有的挑戰(zhàn)。高負(fù)載、高能效、高可用性,已成為對當(dāng)前智算中心的基礎(chǔ)要求。

“智算中心相對于傳統(tǒng)數(shù)據(jù)中心來說,要滿足集中化、高效化和快速化三個特點。”參加京東云“瘋狂星期四”直播的嘉賓,中國電子工程設(shè)計院數(shù)據(jù)中心事業(yè)部設(shè)備所所長沈曉朋表示,隨著AI大模型的競爭日益激烈,智算中心的建設(shè)需求與日俱增,服務(wù)器功率密度也逐年上升,這不僅要求基礎(chǔ)設(shè)施能夠快速響應(yīng),更要在能效、可靠性等方面達(dá)到新的高度。

圖片1.jpg

京東云阿爾法智能算力模塊

京東云在此次直播中重點展示了其阿爾法算力模塊,該模塊針對高功率服務(wù)器集群量身定制,通過優(yōu)化電力供應(yīng)和散熱系統(tǒng),實現(xiàn)了顯著的能效提升。京東云技術(shù)專家介紹,阿爾法算力模塊通過風(fēng)墻精密空調(diào)、熱通道封閉與京東云智能京維平臺三管齊下,實現(xiàn)了模塊能耗降低30%的目標(biāo)。

快速交付也是阿爾法算力模塊的一大特色。在確保服務(wù)器大幅降低能耗的同時,這種模塊化設(shè)計可以顯著加快部署速度。據(jù)介紹,從需求確認(rèn)起僅需35天,阿爾法算力模塊即可完成在工廠的預(yù)制,并在10天內(nèi)交付給客戶,整體部署可以控制在45天內(nèi)完成。

液冷技術(shù)的綠色革命

隨著算力密度的不斷提高,液冷作為一種更高效、節(jié)能的散熱技術(shù)走入了行業(yè)視野。作為一種新興技術(shù),雖然具備多重優(yōu)勢,但在應(yīng)用普及的過程中,還面臨著用戶的諸多擔(dān)憂。

沈曉朋認(rèn)為,業(yè)內(nèi)對液冷應(yīng)用的擔(dān)憂主要集中在幾個方面:首先是標(biāo)準(zhǔn)不統(tǒng)一帶來的維護(hù)、遷移難題;其二是傳統(tǒng)風(fēng)冷數(shù)據(jù)中心的液冷化改造困難的問題;其三是部分液冷技術(shù)采用的冷卻液泄露后會帶來一定的環(huán)境危害;最后沈曉鵬表示,液冷系統(tǒng)的部署成本和投資回報比,也是當(dāng)前用戶重點關(guān)注的問題之一。

京東云事業(yè)部AIDC業(yè)務(wù)部硬件架構(gòu)專家介紹,針對這些行業(yè)普遍擔(dān)憂的問題,京東云推出了自研液冷服務(wù)器,通過模塊化設(shè)計和高可靠性材料的應(yīng)用,成功解決了傳統(tǒng)液冷方案的諸多痛點。

京東云自研液冷服務(wù)器經(jīng)歷了京東集團(tuán)內(nèi)部各業(yè)務(wù)的嚴(yán)苛考驗,可以實現(xiàn)PUE達(dá)到1.1以下,同時支持不同算力平臺的CPU、GPU核心750瓦以上的散熱需求。另外通過模塊化的設(shè)計,可以直接替換傳統(tǒng)的風(fēng)冷散熱方案。

對于部署成本問題,京東云技術(shù)專家表示:“液冷服務(wù)器在前期硬件投入上略高于傳統(tǒng)風(fēng)冷方案,但通過長期運營中電費、運維成本的節(jié)省,只需要15個月左右就能實現(xiàn)總體成本的平衡,全生命周期可以實現(xiàn)5%左右的成本降低。”

圖片2.jpg

京東云液冷服務(wù)器

京東云還通過現(xiàn)場直播,對自研液冷服務(wù)器進(jìn)行了一場“拆機(jī)秀”,由硬件工程師現(xiàn)場拆解并詳細(xì)展示液冷服務(wù)器的每一處細(xì)節(jié)。采用模塊化設(shè)計的京東云自研液冷服務(wù)器拆卸維護(hù)簡便,包括電源、散熱器、網(wǎng)卡、進(jìn)水、出水管等,均可以通過標(biāo)準(zhǔn)件進(jìn)行直接替換。

服務(wù)賦能智算生態(tài)

除了硬件層面的創(chuàng)新外,在運維服務(wù)方面,京東云也屢做創(chuàng)新,為智算業(yè)務(wù)的發(fā)展提供了強(qiáng)勁動力。為更好地運維智算中心,京東云自研了智能京維平臺,通過引入先進(jìn)的人工智能技術(shù),內(nèi)置多個模塊幫助工程師來管理、維護(hù)系統(tǒng),實現(xiàn)對數(shù)據(jù)中心內(nèi)部數(shù)千設(shè)備的高度自洽管理和自運維。

京東云智能京維平臺內(nèi)置節(jié)能寶模塊,利用大數(shù)據(jù)分析和AI算法,對制冷系統(tǒng)進(jìn)行精細(xì)化管理,優(yōu)化設(shè)備運行邏輯,確保冷機(jī)、水泵等設(shè)備在最高效率下運行。這種智能化的運維方式不僅顯著降低了PUE值,減少了能耗,還提高了數(shù)據(jù)中心的穩(wěn)定性和可靠性。例如,京東云廊坊數(shù)據(jù)中心在節(jié)能寶的助力下,年均PUE降至1.19,實現(xiàn)了能效的大幅提升,為企業(yè)節(jié)省了巨額電費開支。

面向越來越多的智算服務(wù)需求,京東云則推出了基于高性能、低延遲的裸金屬服務(wù)器的MaaS(Model as a Service)服務(wù)。通過容器化的形式,京東云將GPU算力以及預(yù)裝模型、輔助工具等統(tǒng)一提供給客戶,幫助客戶更好的訓(xùn)練自己的大模型。

京東云的裸金屬服務(wù)不僅適用于大型企業(yè)和科研機(jī)構(gòu),還通過靈活的配置和定價策略,滿足中小企業(yè)和個人用戶的多樣化需求。例如,其推出的GCS(GPU Computing Service)產(chǎn)品,以極低的成本提供了高性能的GPU算力服務(wù),讓更多人能夠輕松體驗AI技術(shù)的魅力。

圖片3.jpg

京東云數(shù)據(jù)中心

隨著算力需求的持續(xù)爆發(fā)和技術(shù)的不斷進(jìn)步,算力基礎(chǔ)設(shè)施的重要性日益凸顯。京東云憑借其在高效能算力模塊、綠色液冷技術(shù)和智能運維平臺等方面的創(chuàng)新實踐,正逐步構(gòu)建起一套領(lǐng)先行業(yè)的算力基礎(chǔ)設(shè)施體系。未來,隨著技術(shù)的不斷成熟和市場的持續(xù)拓展,京東云的創(chuàng)新與探索,將推動整個行業(yè)向更高效、更綠色、更智能的方向發(fā)展。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2024-10-10
綠色、高效、智能:京東云算力基礎(chǔ)設(shè)施的可持續(xù)發(fā)展之道
在算力需求井噴的今天,數(shù)據(jù)中心作為數(shù)字經(jīng)濟(jì)的基石,其能效與可持續(xù)性成為了行業(yè)關(guān)注的焦點。作為云計算領(lǐng)域的佼佼者,京東云在為廣大用戶提供穩(wěn)定、高性能服務(wù)的同時,也致力于實現(xiàn)智算的綠色、可持續(xù)發(fā)展。

長按掃碼 閱讀全文