智算中心互聯(lián):算網(wǎng)協(xié)同,構(gòu)筑智算互聯(lián)新底座

1月20日消息(水易)AI時(shí)代已經(jīng)來(lái)臨。大模型等新興AI應(yīng)用需求海量的算力支撐,一座座智算中心拔地而起,規(guī)模龐大的萬(wàn)卡集群逐漸投入商用。如何更好地實(shí)現(xiàn)智算中心互聯(lián),服務(wù)AI應(yīng)用創(chuàng)新發(fā)展,業(yè)界做了大量研究工作。

1月16日,作為“2025中國(guó)光通信高質(zhì)量發(fā)展論壇”的開篇之作,“智算中心互聯(lián):算網(wǎng)協(xié)同,構(gòu)筑智算互聯(lián)新底座”線上研討會(huì)順利召開,邀約產(chǎn)業(yè)鏈專家代表,圍繞智算中心間跨地域、跨層級(jí)、跨主體、高可靠的算力協(xié)同與調(diào)度,以及智算中心互聯(lián)關(guān)鍵技術(shù)等話題展開了深入探討。

智算中心互聯(lián)呼喚網(wǎng)絡(luò)架構(gòu)創(chuàng)新

中國(guó)信息通信研究院技術(shù)與標(biāo)準(zhǔn)研究所所長(zhǎng)張海懿表示AI大模型推動(dòng)智算中心向超萬(wàn)卡及以上集群發(fā)展,智算中心內(nèi)互聯(lián)、智算中心間互聯(lián)、智算應(yīng)用支撐等高質(zhì)互聯(lián)成為關(guān)注熱點(diǎn)。

具體而言,為支撐萬(wàn)億及以上量級(jí)參數(shù)量大模型訓(xùn)練,智算中心內(nèi)互聯(lián)需滿足超大規(guī)模組網(wǎng)、大帶寬、超低時(shí)延、高可用性等需求。為突破電力供應(yīng)、機(jī)房空間等瓶頸,智算中心間互聯(lián)成為重要補(bǔ)充,需要通過(guò)長(zhǎng)距無(wú)損、極低故障率的互聯(lián)能力來(lái)支撐構(gòu)建分布式智算集群。為支撐多場(chǎng)景、多業(yè)務(wù)、大流量入算等智算業(yè)務(wù),需要長(zhǎng)距高可靠、任務(wù)式帶寬、高效流量調(diào)度。

針對(duì)上述需求,產(chǎn)業(yè)界已進(jìn)行了諸多探索。智算中心內(nèi)互聯(lián)方面,相關(guān)片間和組網(wǎng)互聯(lián)協(xié)議技術(shù)競(jìng)相發(fā)展,集合通信庫(kù)異構(gòu)兼容或成未來(lái)競(jìng)爭(zhēng)優(yōu)勢(shì)點(diǎn),大帶寬需求助推高速光模塊迭代加速,線性模塊方案應(yīng)用持續(xù)探索,芯片級(jí)光互聯(lián)提供高密度低能耗互聯(lián)新方案,全光交換組網(wǎng)和連接可靠性成為關(guān)注點(diǎn)。

智算中心間互聯(lián)方面,大帶寬、低時(shí)延和高可靠需求凸顯,智算分布式訓(xùn)練應(yīng)用試驗(yàn)加速探索,干線400G規(guī)模部署,城域800G+逐步試驗(yàn),G.654.E、空芯光纖燈新型光纖加速助力構(gòu)建高質(zhì)量網(wǎng)絡(luò)。

智算業(yè)務(wù)支撐方面,全光接入為用戶提供靈活品質(zhì)入算,端到端協(xié)同管控助力用戶快速入云入算,網(wǎng)絡(luò)大模型成為網(wǎng)絡(luò)自智邁向L4+關(guān)鍵技術(shù)。

在鵬城實(shí)驗(yàn)室云腦研究所副所長(zhǎng)張士勛看來(lái),智能計(jì)算需求的急劇增長(zhǎng)引發(fā)了大規(guī)模算力基礎(chǔ)設(shè)施建設(shè)熱潮,如何構(gòu)建適用于大規(guī)模算力基礎(chǔ)設(shè)施的網(wǎng)絡(luò)架構(gòu)是關(guān)鍵挑戰(zhàn)。當(dāng)前,業(yè)界對(duì)智能計(jì)算網(wǎng)絡(luò)架構(gòu)的探索呈現(xiàn)出多元化的發(fā)展態(tài)勢(shì),而基于原始需求,性能、可擴(kuò)展性、成本、可靠性與可維護(hù)性、以及可演進(jìn)性始終是網(wǎng)絡(luò)架構(gòu)選型的核心考量因素。

方案創(chuàng)新,構(gòu)建高品質(zhì)智算網(wǎng)絡(luò)

中國(guó)移動(dòng)研究院副院長(zhǎng)段曉東表示,如何將分布式部署的智算中心進(jìn)行協(xié)同調(diào)度,充分發(fā)揮算力資源的最大效能,是業(yè)界亟需研究的關(guān)鍵問(wèn)題。為此,中國(guó)移動(dòng)原創(chuàng)提出無(wú)損智算OTN( Hitless intelligent computing OTN,HIC-OTN),從超大帶寬、超高可靠、超低時(shí)延三方面構(gòu)建面向智算中心的新型OTN技術(shù)體系。

據(jù)了解,中國(guó)移動(dòng)在全球運(yùn)營(yíng)商最大單集群智算中心(哈爾濱數(shù)據(jù)中心)基于無(wú)損智算OTN(HIC-OTN)完成首個(gè)104km跨智算集群PP拉遠(yuǎn)訓(xùn)練現(xiàn)網(wǎng)技術(shù)試驗(yàn),探索和驗(yàn)證了百公里級(jí)跨集群PP訓(xùn)練的可行性。

打造高品質(zhì)智算網(wǎng)絡(luò)的過(guò)程中,作為在業(yè)界最早提出“云網(wǎng)融合”理念的運(yùn)營(yíng)商,中國(guó)電信認(rèn)為云網(wǎng)融合下算力和網(wǎng)絡(luò)的發(fā)展途徑也開始有了新的變化,云網(wǎng)融合也隨之邁入云網(wǎng)融合3.0新階段。中國(guó)電信研究院副院長(zhǎng)傅志仁介紹,算力發(fā)展核心逐步變化成構(gòu)建以GPU為核心的智算集群,網(wǎng)絡(luò)的發(fā)展核心逐漸變化成基于智算架構(gòu)的新型網(wǎng)絡(luò),向AI native Network演進(jìn)。

目前,中國(guó)電信圍繞云網(wǎng)融合3.0底座,在運(yùn)力、算力、存力,以及算網(wǎng)融合、存算融合的云網(wǎng)融合底座、數(shù)據(jù)和底座融合、大模型和底座融合、應(yīng)用和底座融合方面進(jìn)行了一系列布局,并實(shí)現(xiàn)智算能力、創(chuàng)新環(huán)境、應(yīng)用場(chǎng)景開放,賦能千行百業(yè),推動(dòng)數(shù)字經(jīng)濟(jì)發(fā)展。

中國(guó)聯(lián)通研究院副院長(zhǎng)/首席科學(xué)家唐雄燕介紹,為了更好地支撐智算互聯(lián)的需要,2024年,中國(guó)聯(lián)通正式發(fā)布算力智聯(lián)網(wǎng)AINet,通過(guò)IP+光融合打造新質(zhì)運(yùn)力,實(shí)現(xiàn)算力服務(wù)與網(wǎng)絡(luò)服務(wù)協(xié)同,構(gòu)建算力互聯(lián)網(wǎng)的新底座。

AINet具備三個(gè)重要特征,即“三高”核心能力,分別是高通量、高性能、高智能。唐雄燕表示,光網(wǎng)絡(luò)是構(gòu)建AINet“三高”能力的關(guān)鍵底座。AINet部署了雙平面立體組網(wǎng)的400G ROADM全光智算網(wǎng)絡(luò),同時(shí)部署了智算網(wǎng)關(guān),實(shí)現(xiàn)網(wǎng)絡(luò)與智算的高效連接。

騰訊光網(wǎng)絡(luò)架構(gòu)師李方超表示,隨著算力網(wǎng)絡(luò)的規(guī)?;l(fā)展,大模型訓(xùn)練與推理應(yīng)用的持續(xù)增長(zhǎng)與園區(qū)物理資源擴(kuò)展受限的矛盾愈發(fā)顯著,在此背景下騰訊協(xié)同多家用戶與合作伙伴一起推動(dòng)Mega Scale Out項(xiàng)目,目標(biāo)是解決園區(qū)內(nèi)和跨園區(qū)擴(kuò)展兩個(gè)層面的關(guān)鍵問(wèn)題與核心能力。

產(chǎn)業(yè)引領(lǐng),助推智算互聯(lián)高質(zhì)量發(fā)展

AI大模型的算力增長(zhǎng)以每年10倍的速度持續(xù)擴(kuò)張,對(duì)芯片間的光互聯(lián)帶寬提出了極為苛刻的要求。在眾多光芯片技術(shù)中,硅光芯片憑借其獨(dú)特的優(yōu)勢(shì)脫穎而出,承載著數(shù)據(jù)中心高速光互聯(lián)的技術(shù)優(yōu)勢(shì)。

蘇州海光芯創(chuàng)光電科技股份有限公司首席科學(xué)家陳曉剛介紹,硅光產(chǎn)業(yè)鏈條中封測(cè)產(chǎn)能是關(guān)鍵瓶頸,為推動(dòng)硅光芯片量產(chǎn)化發(fā)展,F(xiàn)abless 2.0 在封測(cè)段提出Standard(標(biāo)準(zhǔn)化),Simplified(簡(jiǎn)單化)、Scalable(規(guī)模化)、Shared(多平臺(tái)共享)四項(xiàng)需求。

也是隨著AI智算中心高速光互聯(lián)速率的提升,光模塊功耗不斷增加。東莞立訊技術(shù)有限公司產(chǎn)品經(jīng)理周小丹介紹,在200G到800G時(shí)代,采用PAM4調(diào)制,功耗就從4W增加到16W;來(lái)到1.6T時(shí)代,功耗約是在30W。同時(shí),光模塊功耗的持續(xù)上升,也給系統(tǒng)散熱能力帶來(lái)了挑戰(zhàn)。

針對(duì)這一挑戰(zhàn),立訊技術(shù)提供了包括DPO、LRO和LPO等多種AI低功耗的解決方案。周小丹透露,立訊科技推出的多款低功耗AI光互聯(lián)解決方案,已經(jīng)和業(yè)內(nèi)頭部的交換機(jī)和服務(wù)器廠商進(jìn)行了小批量驗(yàn)證,無(wú)論是帶寬速率、功耗、誤碼率還是兼容性等方面,都完全滿足最終用戶需求。

“2025中國(guó)光通信高質(zhì)量發(fā)展論壇”是由CIOE中國(guó)光博會(huì)與C114通信網(wǎng)聯(lián)合推出的大型研討會(huì)系列活動(dòng),通過(guò)多場(chǎng)專題論壇、線上研討會(huì)、閉門研討會(huì)等形式,聚焦產(chǎn)業(yè)鏈薄弱環(huán)節(jié),瞄準(zhǔn)技術(shù)未來(lái)演進(jìn)方向,發(fā)掘熱點(diǎn)應(yīng)用場(chǎng)景,群策群力,貢獻(xiàn)行業(yè)價(jià)值,進(jìn)一步助力我國(guó)光通信產(chǎn)業(yè)高質(zhì)量發(fā)展。

下一場(chǎng)論壇將于2月27日上線,主題為“FTTR-B:賦能垂直行業(yè)數(shù)字化轉(zhuǎn)型”,探討FTTR如何在政企領(lǐng)域?qū)崿F(xiàn)數(shù)字化轉(zhuǎn)型,如何在中小微企業(yè)全光內(nèi)部組網(wǎng)靈活部署,如何解決傳統(tǒng)網(wǎng)絡(luò)架構(gòu)的帶寬瓶頸和覆蓋難題。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2025-01-20
智算中心互聯(lián):算網(wǎng)協(xié)同,構(gòu)筑智算互聯(lián)新底座
智算中心互聯(lián):算網(wǎng)協(xié)同,構(gòu)筑智算互聯(lián)新底座,C114訊 1月20日消息(水易)AI時(shí)代已經(jīng)來(lái)臨。大模型等新興AI應(yīng)用需求海量的算力支撐,一座座智

長(zhǎng)按掃碼 閱讀全文