6月25日,OCP China Day(開放計(jì)算中國日)在北京舉行,大會(huì)由OCP基金會(huì)和OCP鉑金成員浪潮聯(lián)合主辦,近1000名工程師和數(shù)據(jù)中心從業(yè)者參加了此次大會(huì)。
OCP China Day開放計(jì)算中國日現(xiàn)場
OCP是全球的最大硬件開放社區(qū),核心會(huì)員超過200家,包括Google、微軟、Intel、IBM、浪潮等,超過7000家企業(yè)曾參與社區(qū)的活動(dòng)。2011年Facebook發(fā)起成立了該社區(qū),旨在重構(gòu)數(shù)據(jù)中心硬件設(shè)計(jì),通過開放開源的方式,構(gòu)筑創(chuàng)新技術(shù)生態(tài)。社區(qū)成立后,發(fā)展速度超出了所有人預(yù)料,2018年,OCP非董事會(huì)成員采購額同比增長率超過120%,達(dá)到25.6億美元,到2022年預(yù)計(jì)將超過107億美元。
目前,所有的云計(jì)算數(shù)據(jù)中心都全部或者部分采用了OCP的開放技術(shù),整機(jī)柜服務(wù)器、存儲(chǔ)服務(wù)器、機(jī)架式高密度服務(wù)器等一大批云計(jì)算時(shí)代的創(chuàng)新技術(shù)和產(chǎn)品都是在OCP社區(qū)的直接推動(dòng)下發(fā)展起來的。OCP的發(fā)展歷程也是整個(gè)數(shù)據(jù)中心產(chǎn)業(yè)的云計(jì)算變革過程。
5G催生云數(shù)據(jù)中心2.0
本次OCP China Day活動(dòng)主要聚焦于邊緣計(jì)算、AI以及云數(shù)據(jù)中心三大議題。隨著5G 的應(yīng)用,此前以云計(jì)算、移動(dòng)互聯(lián)、大數(shù)據(jù)為代表的信息技術(shù)變革開始迎來新起點(diǎn),5G時(shí)代不僅是AI、邊緣計(jì)算的時(shí)代,也是物聯(lián)網(wǎng)的時(shí)代,也是更大帶寬、更大規(guī)?;ヂ?lián)的時(shí)代,云數(shù)據(jù)中心需要承載更大規(guī)模的訪問量和數(shù)據(jù)量,從而進(jìn)一步加快規(guī)模化、現(xiàn)代化升級(jí)。
如果說現(xiàn)在的云數(shù)據(jù)中心是1.0版本,那么5G時(shí)代的云數(shù)據(jù)中心則是2.0版本。通過水冷、48V供電,克服物理限制,進(jìn)一步提高數(shù)據(jù)中心功率密度;軟件定義技術(shù)全面應(yīng)用,硬件標(biāo)準(zhǔn)化,固件開源統(tǒng)一化,IT基礎(chǔ)架構(gòu)實(shí)現(xiàn)真正的統(tǒng)一、融合、開放;Redfish新管理架構(gòu)替代當(dāng)前的IPMI,同時(shí)與openBMC相結(jié)合,形成新一代的數(shù)據(jù)中心管理技術(shù)生態(tài)。
從OpenRack3.0看下一代整機(jī)柜服務(wù)器
截止至2019年1月,全球超大規(guī)模數(shù)據(jù)中心的數(shù)量已經(jīng)達(dá)到430個(gè),同比增長11%,預(yù)計(jì)年底可以達(dá)到500個(gè)。按照每個(gè)數(shù)據(jù)中心 10萬臺(tái)的容量計(jì)算,已建成超大規(guī)模數(shù)據(jù)中心可容納4300萬臺(tái)服務(wù)器,而根據(jù)IDC數(shù)據(jù),2018年全球服務(wù)器總出貨量僅為1175萬臺(tái)。
這些大規(guī)模和超大規(guī)模數(shù)據(jù)中心一直在不斷的提高設(shè)備密度,直接導(dǎo)致以整機(jī)柜為主的不同形態(tài)的多節(jié)點(diǎn)服務(wù)器,在過去的10年中,全球市場的出貨量份額從0起步上升至20%。OCP的OpenRack2.0和ODCC的天蝎2.5是目前整機(jī)柜服務(wù)器的兩個(gè)主要的公開技術(shù)標(biāo)準(zhǔn),已經(jīng)部署的服務(wù)器大多遵循上述兩個(gè)標(biāo)準(zhǔn)。但是這兩個(gè)標(biāo)準(zhǔn)在供電和散熱方面遇到了物理限制的硬墻,難以繼續(xù)提高密度。所以,OCP和ODCC都在開發(fā)下一代標(biāo)準(zhǔn)3.0,這一代標(biāo)準(zhǔn)普遍實(shí)現(xiàn)了12-48V高壓供電、15-33KW高功率支持以及液冷散熱的支持。
大會(huì)上,Facebook技術(shù)負(fù)責(zé)人Steve Mills系統(tǒng)講解了最新的OpenRack 3.0整機(jī)柜服務(wù)器規(guī)范,新規(guī)范在供電、散熱等方面提升以外,還將高度從41OU增加到44OU,最大重量從1400Kg提高到1600kg;支持21英寸和19英寸兩種規(guī)格的節(jié)點(diǎn),節(jié)點(diǎn)高度單位同時(shí)支持OU和標(biāo)準(zhǔn)U;內(nèi)部結(jié)構(gòu)也進(jìn)行了調(diào)整,可以讓用戶部署專門異構(gòu)加速器、存儲(chǔ)等擴(kuò)展模塊,由于該規(guī)范涉及到液冷和48V供電等尚未規(guī)模應(yīng)用的技術(shù),很多細(xì)節(jié)仍然待定,所以,該標(biāo)準(zhǔn)仍未正式發(fā)布,處于公開征詢意見的階段。
Steve Mills, Facebook Technical Lead
OpenRack 3.0以外的努力
OCP的開放標(biāo)準(zhǔn)往往來源于成熟的應(yīng)用實(shí)踐,成員企業(yè)的領(lǐng)先實(shí)踐經(jīng)過一系列復(fù)雜、嚴(yán)謹(jǐn)和完全透明公開的流程后,才會(huì)成為社區(qū)標(biāo)準(zhǔn),這樣的嚴(yán)格流程保證了OCP標(biāo)準(zhǔn)的實(shí)用性和權(quán)威性,也帶來了一個(gè)問題——OCP的標(biāo)準(zhǔn)滯后于實(shí)際應(yīng)用的發(fā)展,比如異構(gòu)加速器的標(biāo)準(zhǔn)OAM今年才發(fā)布,而英偉達(dá)的GPU技術(shù)在十幾年前就出現(xiàn)了,GPU用于AI領(lǐng)域也有快10年時(shí)間。
OCP、ODCC社區(qū)成員在技術(shù)和方案層面的快速創(chuàng)新,彌補(bǔ)了標(biāo)準(zhǔn)升級(jí)緩慢帶來的問題。OCP成員的創(chuàng)新IP或者技術(shù)規(guī)范只要經(jīng)過被社區(qū)接受,就可以在社區(qū)平臺(tái)上發(fā)布。本次活動(dòng)上,騰訊聯(lián)合浪潮將T-flex2.0規(guī)范貢獻(xiàn)給了OCP社區(qū),該規(guī)范此前已經(jīng)被ODCC社區(qū)所接受,基于I/O池化技術(shù),通過服務(wù)器不同模塊的解耦重組,實(shí)現(xiàn)服務(wù)器的模塊化迭代和靈活組合,可以實(shí)現(xiàn)異構(gòu)加速、冷存儲(chǔ)、HPC集群等各類不同的應(yīng)用方案,也就是超大規(guī)模數(shù)據(jù)中心可以基于該規(guī)范對(duì)統(tǒng)一服務(wù)器架構(gòu),降低采購運(yùn)維的復(fù)雜度,降低整體成本。
數(shù)據(jù)中心的效率不僅要依靠硬件層面的創(chuàng)新,也要依靠管理技術(shù)的提高。Intel在大會(huì)上介紹了兩項(xiàng)數(shù)據(jù)中心管理技術(shù)。大部分云平臺(tái)一旦進(jìn)入管理的廣播模式(也就是管理節(jié)點(diǎn)向資源節(jié)點(diǎn)發(fā)送各種調(diào)度指令),所有資源節(jié)點(diǎn)都會(huì)將管理命令優(yōu)先處理,從而導(dǎo)致當(dāng)前排隊(duì)的的業(yè)務(wù)進(jìn)程停止,業(yè)務(wù)會(huì)出現(xiàn)短暫的中斷,Intel將管理中斷功能放到了PRM層面,這樣可以有效的縮短業(yè)務(wù)中斷時(shí)間。另外,數(shù)據(jù)中心的冷卻系統(tǒng)會(huì)根據(jù)負(fù)載水平進(jìn)行調(diào)節(jié),但是大規(guī)模數(shù)據(jù)中心的反饋復(fù)雜、延時(shí)非常高,導(dǎo)致冷卻調(diào)節(jié)明顯慢于負(fù)載的變化,Intel在管理系統(tǒng)中加入了AI支持的預(yù)測窗口,冷卻系統(tǒng)調(diào)節(jié)不必依賴反饋,冷卻策略更為精準(zhǔn)。
IT基礎(chǔ)架構(gòu)的開放重構(gòu)
微軟SONiC是近幾年來最成功的數(shù)據(jù)中心開源項(xiàng)目,Mellanox、DELTA等公司的400G以太交換機(jī)都支持SONiC,中國ODCC社區(qū)的鳳凰項(xiàng)目也完全采用了SONiC,微軟已經(jīng)構(gòu)建起了開源交換機(jī)操作系統(tǒng)SONiC、白盒交換機(jī)融為一體的產(chǎn)業(yè)生態(tài)。
阿里巴巴在活動(dòng)上分享了SONiC的應(yīng)用實(shí)踐,阿里巴巴采用了SONiC搭建了一個(gè)超大規(guī)模的生產(chǎn)網(wǎng)絡(luò),連接數(shù)十萬服務(wù)器,數(shù)百萬虛擬機(jī)和數(shù)千萬終端,實(shí)現(xiàn)了高帶寬和低延遲,讓阿里巴巴具備了承受“雙十一”網(wǎng)絡(luò)狂潮的能力,而且阿里巴巴基于SONiC做了大量的個(gè)性化開發(fā),很好的推動(dòng)了阿里巴巴實(shí)際業(yè)務(wù)的創(chuàng)新。
阿里巴巴高級(jí)專家劉永鋒
SONiC等SDN技術(shù)重構(gòu)了數(shù)據(jù)中心網(wǎng)絡(luò),Ceph等SDS技術(shù)重構(gòu)數(shù)據(jù)中心存儲(chǔ),OpenStack等云計(jì)算技術(shù)重構(gòu)了數(shù)據(jù)中心服務(wù)器,開源的定義軟件與標(biāo)準(zhǔn)化的硬件正在成為新一代IT基礎(chǔ)架構(gòu)的標(biāo)準(zhǔn)化選擇。
Open Firmware,固件層面的開放
OCP另一個(gè)社區(qū)項(xiàng)目Open Firmware近年來發(fā)展很快,該社區(qū)的宗旨是發(fā)展敏捷、開放、標(biāo)準(zhǔn)的固件設(shè)計(jì)規(guī)范來適應(yīng)新一代云計(jì)算基礎(chǔ)架構(gòu)發(fā)展需求。固件是指設(shè)備內(nèi)部保存的設(shè)備底層代碼,類似于“驅(qū)動(dòng)程序”,操作系統(tǒng)必須通過固件才能驅(qū)動(dòng)服務(wù)器的部件運(yùn)行。通過固件的開放化,數(shù)據(jù)中心可以開發(fā)深度的數(shù)據(jù)中心統(tǒng)一管理方案,實(shí)現(xiàn)固件的遠(yuǎn)程統(tǒng)一升級(jí)等高級(jí)操作,從而簡化數(shù)據(jù)中心的運(yùn)維復(fù)雜度,甚至實(shí)現(xiàn)數(shù)據(jù)中心的自治。
項(xiàng)目組正在開發(fā)開源套件,這些套件僅包括最基本的平臺(tái)代碼來識(shí)別白盒硬件,同時(shí)也在聯(lián)合社區(qū)成員發(fā)展可構(gòu)建和引導(dǎo)的白盒硬件系統(tǒng),形成軟硬一體化的Open Firmware生態(tài)。
OpenRMC,完成下一代管理技術(shù)的框架
社區(qū)的另一個(gè)由浪潮牽頭成立的項(xiàng)目組OpenRMC,正在致力于OpenBMC與Redfish的融合,形成下一代數(shù)據(jù)中心管理的統(tǒng)一框架,這是一個(gè)Linux、DMTF與OCP三個(gè)社區(qū)的聯(lián)合項(xiàng)目。
浪潮高級(jí)技術(shù)總監(jiān)郭洪昌
BMC(Baseboard Management Controller)是監(jiān)控服務(wù)器狀態(tài)并提供帶外管理服務(wù)的嵌入式管理單元,各主要服務(wù)器供應(yīng)商BMC軟件棧均是閉源的,彼此兼容性差,影響了數(shù)據(jù)中心設(shè)備的統(tǒng)一管理。因此,2015年,Facebook發(fā)起了OpenBMC開源項(xiàng)目,此后該項(xiàng)目轉(zhuǎn)入Linux基金會(huì)。
RedFish是下一代數(shù)據(jù)中心管理標(biāo)準(zhǔn),由OMTF標(biāo)準(zhǔn)組織制定,來替代當(dāng)前的IPMI。IPMI功能較少,擴(kuò)展性差,只適用于中小規(guī)模的數(shù)據(jù)中心管理。Redfish擴(kuò)展性好,功能豐富,針對(duì)不同供應(yīng)商的種類多樣的基礎(chǔ)設(shè)施提供規(guī)范化易集成的管理接口,除了服務(wù)器外,Redfish也在逐漸擴(kuò)展對(duì)存儲(chǔ)、網(wǎng)絡(luò)方面的支持,可以滿足超大規(guī)模數(shù)據(jù)中心的高級(jí)管理需求。
OCP的OpenRMC小組已經(jīng)開發(fā)了業(yè)內(nèi)第一個(gè)符合Redfish規(guī)范的OpenBMC版本,進(jìn)一步提升了OpenBMC的模塊化、規(guī)范化程度,并且在加快推出正式的社區(qū)標(biāo)準(zhǔn)。未來OpenRMC有望與Open Firmware融合,形成一整套深入固件層的數(shù)據(jù)中心管理架構(gòu)規(guī)范。
統(tǒng)一、開放、融合,是技術(shù)也是產(chǎn)業(yè)
此次OCP China Day活動(dòng)展示技術(shù)內(nèi)容,構(gòu)成了一個(gè)完整的下一代云數(shù)據(jù)中心技術(shù)框架——新升級(jí)的新形態(tài)Open Rack 3.0,從固件到數(shù)據(jù)中心多個(gè)層面的開放融合、更豐富的管理。這些技術(shù)會(huì)隨著5G、AI的應(yīng)用,而逐步替代原來的技術(shù),完成整個(gè)技術(shù)生態(tài)的升級(jí)換代。
另外,值得一提的是,OCP、ODCC以及其他軟硬件開放社區(qū),正在實(shí)際需求的帶動(dòng)下,深度交流合作,甚至于模糊邊界。在此次大會(huì)上,主題演講的內(nèi)容不僅來自O(shè)CP各個(gè)技術(shù)組,也來自O(shè)DCC社區(qū),百度分享了天蝎服務(wù)器的實(shí)踐經(jīng)驗(yàn)。
- 小米召回SU7標(biāo)準(zhǔn)版車型,春運(yùn)低價(jià)票來襲,12306客服回應(yīng),你怎么看?
- 智譜管理層變動(dòng)引關(guān)注:兩名高管離職,公司未來走向成謎
- 特斯拉召回超120萬輛汽車:安全隱患不容忽視
- 小米召回SU7標(biāo)準(zhǔn)版車型:OTA升級(jí)解決,這次為何小米首度召回?
- Anthropic推出全新API:AI信息驗(yàn)證之戰(zhàn)再掀波瀾
- 未來解碼:英偉達(dá)引領(lǐng)機(jī)器人技術(shù)產(chǎn)業(yè)融合,智造新篇章
- 網(wǎng)易云下架SM娛樂版權(quán)歌曲:數(shù)百萬用戶將受影響,版權(quán)之爭再起波瀾
- 百川智能全新模型Baichuan-M1:顛覆醫(yī)療循證模式,三大推理能力引領(lǐng)全場景深度思考
- 武漢阿里巴巴總部即將亮相,共繪數(shù)字產(chǎn)業(yè)新藍(lán)圖
- iPhone 16在禁令后苦盡甘來:蘋果即將與印尼達(dá)成協(xié)議,解禁在望
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。