面向微服務(wù)創(chuàng)新,IPU正成為未來數(shù)據(jù)中心里起舞的精靈

原標題:面向微服務(wù)創(chuàng)新,IPU正成為未來數(shù)據(jù)中心里起舞的精靈

日耳曼神話中,有一種名叫戈蘭林(Gremlin)的小精靈。傳說這種精靈熟悉各種工具和機械,可以幫助能工巧匠完成種種工作,還可以提升工匠的技術(shù),啟迪他們的發(fā)明精神。很多時候,工匠們的傳統(tǒng)方式方法到達一定瓶頸,就會祈禱小精靈出現(xiàn),能夠幫助他們解決難題。

在我們這個時代,數(shù)據(jù)中心就是偉大的工匠,肩負著為千行百業(yè)打造計算、智能基礎(chǔ)設(shè)施的重任。當數(shù)據(jù)重心遇到了工作瓶頸,可能也需要精靈加入他們的工作中。

近日,英特爾攜手百度智能云,發(fā)布了《為基礎(chǔ)設(shè)施提供加速引擎 助力塑造未來數(shù)據(jù)中心》英特爾IPU平臺解決方案白皮書,主要解析了英特爾IPU架構(gòu)的功能和應(yīng)用,以及如何與百度智能云通力合作打造其全新DPU架構(gòu),幫助云數(shù)據(jù)中心充分釋放算力,全面賦能云服務(wù)創(chuàng)新。

AI與大數(shù)據(jù)時代,云數(shù)據(jù)中心走向計算架構(gòu)變革成為當務(wù)之急。英特爾IPU的發(fā)布與實踐,可以保持基礎(chǔ)設(shè)施高性能、高利用率的同時,實現(xiàn)更靈活地資源調(diào)配,并使云服務(wù)提供商能更快地轉(zhuǎn)向完全虛擬化存儲和網(wǎng)絡(luò)架構(gòu),從而極大滿足云數(shù)據(jù)中心的升級需求。

在白皮書當中,我們可以通過云計算中心的發(fā)展與挑戰(zhàn)-IPU的架構(gòu)與技術(shù)優(yōu)勢解析-英特爾與百度智能云攜手進行的實踐,三個維度來審視IPU的發(fā)展藍圖與價值期待。

數(shù)據(jù)中心里,小精靈正待起舞。

云數(shù)智變革:數(shù)據(jù)中心的壓力與瓶頸

云時代正在蓬勃發(fā)展,全新的技術(shù)與產(chǎn)業(yè)變革正醞釀在云計算產(chǎn)業(yè)中。對于云服務(wù)商來說,企業(yè)創(chuàng)新應(yīng)用對云數(shù)據(jù)中心既有能力提出更高需求。隨著 5G、AI、邊緣計算等前沿技術(shù)在更多行業(yè)獲得落地應(yīng)用,企業(yè)級云服務(wù)出現(xiàn)了許多新的變化與趨勢。比如說——

更呈分布式的云服務(wù)部署:邊緣計算等技術(shù)的發(fā)展推動著云服務(wù)由傳統(tǒng)的中心云逐漸向“云邊端”協(xié)同演進,更多云服務(wù)被部署在貼近應(yīng)用的邊緣端。

更為廣泛的云服務(wù)應(yīng)用場景:云服務(wù)正成為更多行業(yè)的 IT 基礎(chǔ)設(shè)施之一,在智能制造、智慧零售、云游戲等新業(yè)態(tài)中作為主力,支撐企業(yè)的數(shù)字化、智能化創(chuàng)新。

在這些變化的推動,云數(shù)據(jù)中心服務(wù)器在管理與應(yīng)用上面臨更多挑戰(zhàn)。

例如更多虛擬機(Virtual Machine,VM)的部署使虛擬機管理等管理任務(wù)變得更加復(fù)雜。同時,其能力輸出也逐漸從傳統(tǒng)單體式應(yīng)用向微服務(wù)化發(fā)展,這也進一步提高了云數(shù)據(jù)中心管理任務(wù)的復(fù)雜程度,進而占用大量處理器資源。

既要對虛擬機、微服務(wù)等開展高效管理,又要對相關(guān)的云數(shù)據(jù)中心的網(wǎng)絡(luò)、存儲等基礎(chǔ)設(shè)施實現(xiàn)加速,其中的復(fù)雜性和資源開銷水平不斷增加,傳統(tǒng)基礎(chǔ)架構(gòu)已經(jīng)很難滿足未來數(shù)據(jù)中心要求。

隨著微服務(wù)模型越來越多地用于云數(shù)據(jù)中心的應(yīng)用、存儲和網(wǎng)絡(luò)工作負載??梢灶A(yù)測的是,

未來數(shù)據(jù)中心需要進行以下方面的轉(zhuǎn)型和升級:

1.云原生應(yīng)用的出現(xiàn)和快速增長推高了對專用基礎(chǔ)設(shè)施的需求,并大幅提高云服務(wù)的敏捷

性以及云數(shù)據(jù)中心的效率。

2.云服務(wù)的微服務(wù)化,推動了分布式異構(gòu)計算環(huán)境的發(fā)展,而每個微服務(wù)都應(yīng)在更適合其

的加速節(jié)點上運行。

3.微服務(wù)模型的廣泛采用也催生出數(shù)據(jù)中心編排系統(tǒng),使各異構(gòu)計算服務(wù)器之間實現(xiàn)微服務(wù)分發(fā)的自動化及管理。

4.使用微服務(wù)、虛擬機、容器以及容器編排的場景不斷增加,推動了服務(wù)網(wǎng)格的開發(fā)。服務(wù)網(wǎng)格能夠簡化微服務(wù)到微服務(wù)的通信,并使其更加高效。服務(wù)網(wǎng)格已經(jīng)成為云原生堆棧的標準組成部分。

因此,未來數(shù)據(jù)中心的架構(gòu)將更多地面向于微服務(wù)且日益分散的應(yīng)用環(huán)境而設(shè)計,以此來更好利用異構(gòu)計算帶來的加速處理能力。整體而言,未來數(shù)據(jù)中心架構(gòu)需要面向微服務(wù)與分散應(yīng)用環(huán)境設(shè)計,通過異構(gòu)計算的方式來使數(shù)據(jù)中心算力設(shè)施各司其職,適應(yīng)分布式部署的特點和需求,以此來應(yīng)對云時代的產(chǎn)業(yè)升級壓力。

這種情況下,IPU的誕生與發(fā)展就成了順理成章的事情。

精靈起舞:IPU為數(shù)據(jù)中心獻上時代之變

數(shù)據(jù)中心在目前階段必須要完成新的升級與演變,尤其要有新的計算機構(gòu)出現(xiàn)。未來的數(shù)據(jù)中心,需要實現(xiàn)大規(guī)模分布式異構(gòu)計算協(xié)同工作、無縫連接。尤其是處理基礎(chǔ)設(shè)施加速的計算單元可以有效負載分擔CPU的工作,對于數(shù)據(jù)中心效率提升至關(guān)重要。

2021年,英特爾推出了基礎(chǔ)設(shè)施處理器(IPU)。作為一種可編程網(wǎng)絡(luò)設(shè)備,英特爾IPU能夠助力云和通信服務(wù)提供商以及企業(yè)提高安全性、節(jié)約開銷并充分釋放中央處理器(CPU)的性能。借助英特爾IPU平臺,數(shù)據(jù)中心可以通過安全、穩(wěn)定、可編程的解決方案更好地釋放計算資源,并實現(xiàn)更高的安全性和隔離性。IPU這個幫助數(shù)據(jù)中心釋放算力的小精靈,可以為云數(shù)據(jù)中心的微服務(wù)創(chuàng)新帶來多項優(yōu)勢。

作為全新的產(chǎn)品形態(tài)。英特爾IPU在涵蓋智能網(wǎng)卡功能的同時,更能為未來云數(shù)據(jù)中心帶來更高級別的安全性和控制力。其優(yōu)勢包括:

1.減少了主機側(cè)處理器中虛擬機管理程序和基礎(chǔ)設(shè)施堆棧的開銷,使更多的處理器資源可用于應(yīng)用和租戶工作負載。

2.從主機側(cè)處理器中卸載了存儲堆棧,從而為應(yīng)用和租戶工作負載釋放更多處理器資源。

3.卸載了高密集的基礎(chǔ)設(shè)施任務(wù),如加密和解密以及數(shù)據(jù)包處理。

4.在極端情況下,英特爾IPU可以卸載整個虛擬機管理程序,釋放 處理器所有內(nèi)核為應(yīng)用和微服務(wù)提供支持,這對于裸金屬服務(wù)產(chǎn)品來說至關(guān)重要。

5.為裸金屬和云主機統(tǒng)一云管控創(chuàng)造了可能。

從技術(shù)架構(gòu)角度思考, 英特爾IPU能夠為云數(shù)據(jù)中心帶來一系列發(fā)展優(yōu)勢,是因為數(shù)據(jù)中心能夠有效地將網(wǎng)絡(luò)、存儲、安全以及基礎(chǔ)設(shè)施管理等多種能力從處理器卸載到 英特爾IPU,從而實現(xiàn)算力釋放,并加速多種基礎(chǔ)設(shè)施能力。這些能力包括——

1.網(wǎng)絡(luò)加速:將承載網(wǎng)絡(luò) I/O、數(shù)據(jù)轉(zhuǎn)發(fā)等功能的虛擬交換機軟件,如 OVS 等從主機側(cè)處理器卸載到 IPU,提升網(wǎng)絡(luò)吞吐量,減少網(wǎng)絡(luò)處理時延。

2.存儲加速:將 virtio-blk、NVMe-oF 等存儲接口、協(xié)議棧從主機側(cè)處理器轉(zhuǎn)移到 IPU,提高存儲彈性和靈活性,并降低系統(tǒng)復(fù)雜性和開銷。

3.安全加速:從主機側(cè)處理器卸載大量加密/解密、壓縮和其他安全功能。

4.基礎(chǔ)設(shè)施處理: 將云服務(wù)管理功能從主機側(cè)處理器卸載到英特爾 IPU,使虛擬機、容器或裸金屬服務(wù)的分配和管理更為高效。

除了引入性能更強、且具備靈活可編程特性的硬件來面向特定功能進行優(yōu)化加速,釋放更多

寶貴算力之外,英特爾也賦予了 IPU 產(chǎn)品豐富的軟件生態(tài)。目前,英特爾正以加速開發(fā)平臺(Acceleration Development Platform,ADP)為抓手,通過更優(yōu)生態(tài)系統(tǒng)的構(gòu)建,助力合作伙伴實現(xiàn)云數(shù)據(jù)中心性能加速解決方案的快速開發(fā)和部署。在規(guī)劃中,ADP 平臺將為用戶提供通過英特爾開放式 FPGA 堆棧(英特爾OFS)實現(xiàn)的板卡硬件設(shè)計、軟件、驅(qū)動程序以及技術(shù)設(shè)計支持。用戶可以利用這些軟件工具與技術(shù)支持,加速 IPU 相關(guān)產(chǎn)品的開發(fā),并迅速將產(chǎn)品推向市場。

此外,需要注意的是處理器是數(shù)據(jù)中心的心臟。將英特爾IPU納入云數(shù)據(jù)中心架構(gòu),可以有效發(fā)揮其與處理器之間的系統(tǒng)能力與平臺化價值。通過對接英特爾至強可擴展處理器,英特爾IPU能夠有效提升云數(shù)據(jù)中心算力,充分釋放異構(gòu)算力。

在英特爾為用戶提供的高效能云數(shù)據(jù)中心生態(tài)方案中,不僅可以通過 IPU 開展能力卸載,對基礎(chǔ)設(shè)施進行性能加速,也可以引入英特爾至強可擴展處理器來進一步加強算力。通過對算力的“開源節(jié)流”,實現(xiàn)更快的數(shù)據(jù)處理速度、更大的帶寬接入能力以及更低的網(wǎng)絡(luò)時延。

第三代英特爾至強可擴展處理器能夠為服務(wù)器帶來的性能增強包括:

1.更多的內(nèi)核、更優(yōu)的架構(gòu)帶來算力性能的大幅提升,可有效應(yīng)對高密度計算所需;

2.支持更多內(nèi)存,支持 PCIe-Gen4,可實現(xiàn)更高的每核 I/O 帶寬;

3.多項內(nèi)置加速技術(shù),如英特爾深度學(xué)習(xí)加速技術(shù)(英特爾DL Boost)等可在人工智能等場景提供強大加速能力。

在算力架構(gòu)中引入英特爾至強可擴展處理器的另一個優(yōu)勢是能夠有效提升能力卸載的效率和平滑性。由于主機側(cè)和 IPU 都采用基于英特爾架構(gòu)的處理器,就能夠非常方便地將主機側(cè)運行應(yīng)用遷移到 IPU ,甚至無需編譯即可遷移,大幅提升開發(fā)、部署和測試的效率。

在基于IPU帶來的一系列價值之下,云數(shù)據(jù)中心可以持續(xù)邁向微服務(wù)創(chuàng)新時代,打通未來數(shù)據(jù)中心之路。

助力巧匠:百度智能云的先驅(qū)探索

在白皮書中,我們可以看到英特爾IPU與百度智能云的合作案例與行業(yè)示范價值。從雙方合作中可以看出,百度智能云成功實現(xiàn)了提升服務(wù)器效率,提升安全水平,降低算力綜合成本等價值。

在云與AI帶來的數(shù)智化大潮中,云服務(wù)持續(xù)向各個領(lǐng)域延伸,并承載越來越多核心業(yè)務(wù)能力。這也導(dǎo)致云計算服務(wù)商正面臨著需要更強算力資源、更大帶寬接入和更低網(wǎng)絡(luò)時延的挑戰(zhàn)。與此同時,云服務(wù)品牌也需要從計算架構(gòu)革新中獲得價值,來確保自身的競爭優(yōu)勢。為此,百度智能云提出云智一體戰(zhàn)略,大力發(fā)展AI云業(yè)務(wù)。而AI云服務(wù)帶來的算力需求指數(shù)級提升。面向未來的元宇宙等需求,算力釋放還將面臨更多挑戰(zhàn)。

在這一進程中,百度智能云借助英特爾FPGA 與英特爾至強D處理器帶來的高效軟硬件可編程的加速,首次推出了自研 DPU 設(shè)備——百度太行 DPU1.0。其支持太行彈性裸金屬服務(wù),包括網(wǎng)絡(luò)卸載、PCIe 設(shè)備熱插拔等功能,讓云計算的虛擬化開銷很大程度沉淀在網(wǎng)卡上,使云產(chǎn)品的性能大大提升。目前,太行 DPU1.0 產(chǎn)品已在太行彈性裸金屬等多種云服務(wù)場景中開展應(yīng)用,并獲得了用戶的良好評價。實踐證明,百度自主研發(fā)的百度太行 DPU1.0 可以有效解決云數(shù)據(jù)中心管理及虛擬化的局限性。

百度太行 DPU1.0 產(chǎn)品配備了 2 個 25G 帶寬的光口,并引入英特爾的FPGA 與英特爾至強D處理器作為算力核心,來實現(xiàn)了各項虛擬化功能的卸載,在為用戶提供彈性網(wǎng)卡、彈性存儲能力之余,還支持 1024 個設(shè)備的熱插拔。同時,通過將云管控平面卸載到百度太行DPU1.0 中,實現(xiàn)虛擬云主機和裸金屬共池,即裸金屬可與虛擬云主機被統(tǒng)一靈活調(diào)度。來自百度智能云的測試驗證表明,百度太行DPU1.0 產(chǎn)品能夠為用戶提供 1000 萬 PPS 的轉(zhuǎn)發(fā)率以及 20 萬 IOPS 的存儲性能。

面向未來,DPU 產(chǎn)品也將成為智能云服務(wù)的核心組件,助力IaaS資源的統(tǒng)一彈性底座,進而為用戶依托百度智能云開展各類業(yè)務(wù)創(chuàng)新、實施產(chǎn)業(yè)智能化轉(zhuǎn)型提供可靠保證。

IPU帶來的架構(gòu)革新,可以從基座層確保算力最大化釋放,釋放數(shù)據(jù)中心的核心競爭優(yōu)勢。從2016年開始,“互聯(lián)網(wǎng)下半場”開始成為被廣泛討論的命題。如今,在規(guī)?;偁庍M入收尾階段,技術(shù)創(chuàng)新與精細化服務(wù)成為主要競爭點的階段,“云計算下半場”似乎也已經(jīng)到來。

在這一產(chǎn)業(yè)周期,云計算服務(wù)商的競爭力不僅在于基礎(chǔ)設(shè)施性價比,而是要面向客戶提供服務(wù)創(chuàng)新、技術(shù)創(chuàng)新以及綜合價值。這種情況下,云計算數(shù)據(jù)中心的基礎(chǔ)架構(gòu)創(chuàng)新變得至關(guān)重要。它既是算力集約化的保障,也是業(yè)務(wù)創(chuàng)新的基石。

隨著英特爾 IPU 以及基于其參考設(shè)計研發(fā)的相關(guān)產(chǎn)品,在云數(shù)據(jù)中心的基礎(chǔ)架構(gòu)革新中展現(xiàn)出顯著性能優(yōu)勢和市場價值,并逐步形成可持續(xù)發(fā)展的生態(tài)鏈,英特爾與百度智能云等深度合作伙伴也正圍繞云服務(wù)的未來發(fā)展方向,從軟硬件層面開拓更多優(yōu)化方案。例如通過新的英特爾IPU 平臺提供更大網(wǎng)絡(luò)吞吐量,實現(xiàn)對硬件資源的全面解耦,以及以極低時延實

現(xiàn)端到端的加速等。

面向未來,英特爾計劃在 IPU 產(chǎn)品體系上持續(xù)發(fā)力。英特爾在 2022 年推出兩款第二代 200G 的可編程 IPU, 代號分別為“Oak Springs Canyon”和“Mount Evans”。其中Oak SpringsCanyon 搭載了英特爾至強D 處理器與英特爾Agilex? FPGA 芯片。而Mount Evans 則是英特爾首款基于ASIC 芯片的IPU產(chǎn)品。這兩款產(chǎn)品都將具有卸載 200 G工作負載所需的基礎(chǔ)設(shè)施加速能力,且都可與英特爾至強可擴展處理器協(xié)同工作。未來兩到三年內(nèi),英特爾將推出支持 400 G的 IPU產(chǎn)品,并且在2025年或晚些時候,推出新一代基于 FPGA 芯片和 ASIC芯片的 800G IPU 產(chǎn)品。

與此同時,英特爾也正進一步背靠豐富的開源軟件(如基礎(chǔ)架構(gòu)編程人員開發(fā)套件(International Package and Development Kit ,IPDK)、SPDK、DPDK 等),致力于通過開放的生態(tài)系統(tǒng)、多方位的行業(yè)協(xié)作以及積極的社區(qū)互動,讓百度等云服務(wù)提供商、云服務(wù)最終用戶以及其他合作伙伴能加速 IPU 相關(guān)解決方案的構(gòu)建,從云數(shù)據(jù)中心基礎(chǔ)架構(gòu)的持續(xù)革新中擷取更大價值。

未來數(shù)據(jù)中心正在加速到來,而IPU正在成為其中翩然起舞的精靈。

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2022-09-22
面向微服務(wù)創(chuàng)新,IPU正成為未來數(shù)據(jù)中心里起舞的精靈
隨著英特爾 IPU 以及基于其參考設(shè)計研發(fā)的相關(guān)產(chǎn)品,在云數(shù)據(jù)中心的基礎(chǔ)架構(gòu)革新中展現(xiàn)出顯著性能優(yōu)勢和市場價值,并逐步形成可持續(xù)發(fā)展的生態(tài)鏈,英特爾與百度智能云等深度合作伙伴也正圍繞云服務(wù)的未來發(fā)展

長按掃碼 閱讀全文