人工智能,不許網(wǎng)絡(luò)再丟包

在丟包率為0.1%的傳統(tǒng)以太網(wǎng)中,我們生活安然,并無不適。而現(xiàn)在,人工智能(AI)帶來的數(shù)據(jù)量激增改變了這一切。

那些以太網(wǎng)曾經(jīng)看來微不足道的“茍且”開始變得如鯁在喉,它讓人們越來越無法忍受。至少對于那些以AI為生的公司和個人而言,情勢正變得越來越緊迫:

根據(jù)華為GIV 2025(Global Industry Vision)的預(yù)測,企業(yè)對AI的采用率將從2015年的16%達到2025年86%,彼時,新增數(shù)據(jù)量達到180ZB,95%的非結(jié)構(gòu)化數(shù)據(jù)(語音/視頻等)依賴AI處理,越來越多的企業(yè)將利用AI輔助決策、重塑商業(yè)模式與生態(tài)系統(tǒng),并重建客戶體驗。

一項實測支持的業(yè)務(wù)觀察顯示,因為AI業(yè)務(wù)帶動的數(shù)據(jù)量高速增長,0.1%的以太網(wǎng)丟包率會導(dǎo)致AI的計算力損失約50%——面向AI,在計算和存儲領(lǐng)域已經(jīng)取得突破之后,這一現(xiàn)實讓網(wǎng)絡(luò)設(shè)備供應(yīng)商感受到了前所未有的壓力。

為提升AI運行效率,過去數(shù)年間,閃存已經(jīng)大范圍進入存儲領(lǐng)域,它讓數(shù)據(jù)存儲的時延降低超過了100倍;在計算領(lǐng)域,GPU等主要服務(wù)于AI的芯片也將數(shù)據(jù)處理能力提升了100倍以上。

在ICT領(lǐng)域,AI的短板眼下只剩下一塊——網(wǎng)絡(luò)設(shè)備。針對這一問題,華為網(wǎng)絡(luò)產(chǎn)品線總裁胡克文認為,面向AI的未來,網(wǎng)絡(luò)設(shè)備應(yīng)該做到“強制性”的零丟包。

每家ICT廠商都是努力做著同一件事情,生產(chǎn)出這類適應(yīng)AI需求的網(wǎng)絡(luò)設(shè)備,全球范圍概莫能外。它意味著巨大的挑戰(zhàn)與創(chuàng)新,也意味著可見的、巨大的市場回報。

7天的訓(xùn)練,4天完成

如今,圍繞這塊短板,華為再次領(lǐng)先了。在上周的春季新品發(fā)布會上,它推出了植入高能效AI芯片的新款交換機CloudEngine 16800。

CloudEngine 16800發(fā)布現(xiàn)場

這款業(yè)界首款面向AI時代的計算中心交換機,可以借助其實時學(xué)習(xí)訓(xùn)練能力和獨創(chuàng)的iLossLess智能無損交換算法,在以太網(wǎng)中實現(xiàn)零丟包機制,并實現(xiàn)流量模型的自適應(yīng)自優(yōu)化。

2018年,華為輪值董事長徐直軍宣布,華為將AI定位為新的通用技術(shù),并發(fā)布了AI發(fā)展戰(zhàn)略,全面將AI技術(shù)引入到智能終端、云和網(wǎng)絡(luò)等各個領(lǐng)域。

CloudEngine 16800能通過AI技術(shù)的應(yīng)用實現(xiàn)突破,顯然直接受惠于此戰(zhàn)略的執(zhí)行?;贏I技術(shù),該款產(chǎn)品在網(wǎng)絡(luò)調(diào)優(yōu)上實現(xiàn)了智能化:一個是單流局部調(diào)優(yōu),另一個是整網(wǎng)全局調(diào)優(yōu)。

如果將網(wǎng)絡(luò)視作一個城市的交通網(wǎng),前者實現(xiàn)了在一個十字路口智能調(diào)整紅綠燈時間的功能;而后者,則實現(xiàn)了動態(tài)關(guān)聯(lián)調(diào)整全市紅綠燈時間的功能。

據(jù)測算,這一系列AI技術(shù)的應(yīng)用,不止在用戶端將AI算力從50%提升到100%,同時還將數(shù)據(jù)存儲IOPS的性能提升了30%.

一家互聯(lián)網(wǎng)巨頭已經(jīng)對這款新品進行了測試,業(yè)務(wù)內(nèi)容則是當(dāng)下方興未艾的無人駕駛AI訓(xùn)練。

訓(xùn)練的效果讓人們大吃一驚——以往1天運行的數(shù)據(jù)需要訓(xùn)練7天才能完成,而現(xiàn)在,這家公司只用了4天。對于高速的商業(yè)競爭而言,這幾乎是直接為用戶提供了一種接近核心的競爭力。

做一臺AI時代的交換機

華為也因此將“內(nèi)嵌AI芯片”定義成了AI時代數(shù)據(jù)中心交換機的三大特征之一。在其最新定義中,另外兩項特征則分別是“單槽48 x 400GE高密端口”,和“能夠向自動駕駛網(wǎng)絡(luò)演進的能力”。

“如果這三大特征,你不符合的話,你可能就不是面向AI時代的數(shù)據(jù)中心交換機?!焙宋恼f。

2012年華為發(fā)布了100GE的正交架構(gòu)產(chǎn)品CloudEngine12800數(shù)據(jù)中心交換機,并在此后一路高歌猛進。從2016年起,華為的數(shù)據(jù)中心交換機已連續(xù)三年蟬聯(lián)市場份額第一。2018年,在標志最高應(yīng)用標準的金融行業(yè),華為數(shù)據(jù)中心交換機也坐上了頭把交椅。

新品特性應(yīng)對AI時代的3大挑戰(zhàn)

華為在技術(shù)創(chuàng)新上的投入一直為外界稱道,并被視為華為企業(yè)基因式的存在。但這種基因以何種形式在機體中發(fā)揮作用,外界通常知之甚少。在這一點上,CloudEngine 16800為實現(xiàn)跨越式硬件平臺升級所做的技術(shù)準備,則可以清晰地顯現(xiàn)出這一基因的“運作”方式。

為滿足AI時代流量倍增的需求,CloudEngine 16800單槽位提供了業(yè)界最高密度48端口400GE線卡,單機則提供業(yè)界最大的768端口400GE交換容量,這一交換能力是業(yè)界平均的5倍。

其中,針對400GE接口的標準化工作,華為早在2015年便已經(jīng)啟動——考慮到企業(yè)AI等新型業(yè)務(wù)驅(qū)動了數(shù)據(jù)中服務(wù)器從10G到25G甚至100G的切換,華為判斷行業(yè)必然要求交換機支持400G接口,400GE接口標準化工作于2015年啟動,并針對數(shù)據(jù)中心應(yīng)用完成了標準化。

此外,在新材料新工藝、能效和散熱等領(lǐng)域,CloudEngine 16800的創(chuàng)新林林總總,不勝枚舉。例如,在用戶直接可見的節(jié)能方面,與業(yè)界相比,新品可將平均每bit數(shù)據(jù)的功耗降低50%,這相當(dāng)于每臺每年節(jié)省32萬度電,約合電費26萬元。

自動駕駛從秒級識別開始

另一項用戶可以直接感受到的革新,同樣來自于AI技術(shù)的應(yīng)用。這種用戶可感知的能力被稱為“能夠向自動駕駛網(wǎng)絡(luò)演進的能力”。

在傳統(tǒng)數(shù)據(jù)中心,在接到故障告警后,技術(shù)人員必須依靠人工排查的運維手段定位故障,如果不夠幸運,一項故障排查通常需要數(shù)小時,甚至更長的時間。這在業(yè)務(wù)部門看來,顯然是無法接受的——它無法面向一個充滿挑戰(zhàn)的AI時代。

和解決丟包問題一樣,華為將問題“交還”給了AI,期待自動駕駛網(wǎng)絡(luò)能夠徹底改變運維人員面對的窘境。

現(xiàn)實中,汽車領(lǐng)域的自動駕駛技術(shù)正經(jīng)歷著高速的演進,要在網(wǎng)絡(luò)世界實現(xiàn)自動駕駛,進程同樣存在,一步到位并不現(xiàn)實。在這一點上,胡克文相當(dāng)樂觀:只要有夢想和追求,未來就一定能實現(xiàn)。

“首先,能不能做到在秒級(時長)中把故障識別出來?(那樣,IT人員的)壓力就會小很多?!彼f。

要實現(xiàn)自動駕駛網(wǎng)絡(luò),供應(yīng)商至少要在算法、數(shù)據(jù)和本地推理與執(zhí)行等領(lǐng)域同步推進,并在軟硬件技術(shù)端實現(xiàn)AI的閉環(huán)。

據(jù)胡克文透露,目前華為相關(guān)的iNetOps智能運維算法已經(jīng)可以支持72大類典型故障,在盲測中,它支持的故障定位準確率超過了90%.

結(jié)合這些軟實力,以及內(nèi)置AI芯片提供的硬支持,華為最終在CloudEngine 16800中大幅度提升了“網(wǎng)絡(luò)邊緣”即設(shè)備級的智能化水平,使得交換機具備了本地推理和實時快速決策的能力。通過本地智能和集中的FabricInsight網(wǎng)絡(luò)分析器,CloudEngine 16800構(gòu)建了一個分布式AI運維架構(gòu),并最終實現(xiàn)了秒級故障識別和分鐘級故障自動定位。

這一系列的努力,最終讓CloudEngine 16800在AI時代背景下展現(xiàn)出了它與眾不同的一面。

在同一背景下,數(shù)據(jù)中心已經(jīng)成為了AI的“孵化工廠”;現(xiàn)在,要讓這個AI在企業(yè)數(shù)字化轉(zhuǎn)型中扮演更為重要的角色,“孵化工廠”的升級也已進入了時間的節(jié)點。

或許,就像華為所努力的方向一樣,“孵化工廠們”也是時候考慮如何建設(shè)一個自動駕駛的高性能網(wǎng)絡(luò)來提升AI算力,并最終實現(xiàn)AI業(yè)務(wù)的加速了。畢竟,AI時代的網(wǎng)絡(luò),斷然不會接受“茍且”。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2019-01-16
人工智能,不許網(wǎng)絡(luò)再丟包
在丟包率為0.1%的傳統(tǒng)以太網(wǎng)中,我們生活安然,并無不適。而現(xiàn)在,人工智能(AI)帶來的數(shù)據(jù)量激增改變了這一切。那些以太網(wǎng)曾經(jīng)看來微不足道的“茍且”開始變得如鯁在喉,它讓人們越來越無法忍受。

長按掃碼 閱讀全文