如何贏在混合云與計(jì)算時(shí)代?解讀英特爾再度回歸芯“智”向

如何贏在混合云與計(jì)算時(shí)代?解讀英特爾再度回歸芯“智”向

自從2021年2月履新英特爾公司的第八任CEO,帕特·基爾格(Pat Gelsinger)就從混合云與計(jì)算軟件CEO轉(zhuǎn)而成為世界上最大的“芯公司”CEO。作為全球第一大芯片設(shè)計(jì)與制造商,英特爾自從1993年推出奔騰處理器以來(lái),就一直占據(jù)了全球PC與服務(wù)器芯片市場(chǎng)的第一大市場(chǎng)份額,近年來(lái)還向通信、物聯(lián)網(wǎng)、網(wǎng)絡(luò)、人工智能、5G、自動(dòng)駕駛等領(lǐng)域進(jìn)行持續(xù)的創(chuàng)新。然而,與微軟一樣錯(cuò)過(guò)了移動(dòng)時(shí)代的英特爾,能否在云計(jì)算時(shí)代乘“云”破浪?

如何贏在混合云與計(jì)算時(shí)代?解讀英特爾再度回歸芯“智”向

在由阿里云主辦的2021杭州云棲大會(huì)上,英特爾公司全面展示了自基爾格成為英特爾CEO以來(lái)的重大創(chuàng)新,以及與阿里云等超大規(guī)模云服務(wù)商的深度合作成果??梢哉f(shuō),令人眼前一亮的“芯”成果,讓業(yè)界對(duì)“智”在混合云與計(jì)算時(shí)代的英特爾又充滿(mǎn)了期待和信心!從混合計(jì)算到未來(lái)數(shù)據(jù)中心再到邊緣計(jì)算等硬件創(chuàng)新,以及AI、視覺(jué)、混合云等軟件創(chuàng)新,可以看到基辛格給英特爾帶來(lái)的顯著變化,英特爾再次展示了從“芯”出發(fā)的“智”向與決心。

面向數(shù)字化的硬核創(chuàng)新

在2021杭州云棲大會(huì)·“智在此芯 全棧賦能”英特爾論壇上,英特爾市場(chǎng)營(yíng)銷(xiāo)集團(tuán)副總裁中國(guó)區(qū)數(shù)據(jù)中心銷(xiāo)售總經(jīng)理陳葆立,全面展示了全棧賦能混合云與計(jì)算的英特爾創(chuàng)新架構(gòu)與產(chǎn)品。所謂“全棧賦能”,就是從芯片架構(gòu)基礎(chǔ)層面,對(duì)于混合云與計(jì)算的各種場(chǎng)景進(jìn)行全面的性能提升,甚至是新場(chǎng)景賦能。

如何贏在混合云與計(jì)算時(shí)代?解讀英特爾再度回歸芯“智”向

芯片架構(gòu)決定了軟硬件體系,英特爾的芯片架構(gòu)每年都會(huì)有更新,但今年的力度非常之大,堪稱(chēng)一代芯片架構(gòu)的大遷移。眾所周知,英特爾公司創(chuàng)始人戈登·摩爾在1965年提出了摩爾定律,在50多年后的混合云與計(jì)算時(shí)代,業(yè)界普遍認(rèn)為摩爾定律走到了天花板,但英特爾公司不這么認(rèn)為。陳葆立強(qiáng)調(diào),摩爾定律并不是一個(gè)物理定律,而是戈登·摩爾在最開(kāi)始對(duì)英特爾和整個(gè)芯片制造業(yè)提出的一個(gè)目標(biāo),即相信以先進(jìn)的制造技術(shù)可以達(dá)每18個(gè)月將集成電路上晶體管的數(shù)量翻一倍,相應(yīng)提升處理器的性能每?jī)赡攴槐丁,F(xiàn)在,英特爾公司的架構(gòu)師在不停的思考和探索,通過(guò)不同的維度看芯片設(shè)計(jì)、提升芯片效率。

當(dāng)今面向混合云與計(jì)算時(shí)代層出不窮的新應(yīng)用,18個(gè)月算力翻兩倍的速度,已經(jīng)無(wú)法跟上新應(yīng)用的步伐。因此,英特爾從制程、連接、內(nèi)存、軟件、架構(gòu)等五個(gè)維度思考和探索,推動(dòng)每個(gè)維度在未來(lái)三到四年之內(nèi)將算力翻四倍,那么五個(gè)維度就是4的5次方也就是1000倍性能的提升。這就是英特爾給自己設(shè)定新目標(biāo),即通過(guò)多維度推進(jìn),制造出更多算力,支撐未來(lái)各種新應(yīng)用。

如何贏在混合云與計(jì)算時(shí)代?解讀英特爾再度回歸芯“智”向

如何實(shí)現(xiàn)未來(lái)三到四年算力提升千倍?這就是混合計(jì)算架構(gòu)。英特爾從傳統(tǒng)CPU的Scalar張量計(jì)算引擎,到今天AI所需要的Matrix矩陣計(jì)算引擎以及更多計(jì)算類(lèi)型所需要的Vector向量計(jì)算引擎和Spatial空間架構(gòu)計(jì)算引擎等,形成了異構(gòu)計(jì)算引擎架構(gòu),再搭配不同的制程、封裝技術(shù),以及針對(duì)不同的計(jì)算工作負(fù)載搭配合適的緩存、內(nèi)存以及連接,就可以在混合架構(gòu)下形成許多種不同類(lèi)型的計(jì)算產(chǎn)品,滿(mǎn)足各種需求。而當(dāng)把單個(gè)計(jì)算核拼接在一起形成多核CPU時(shí),每個(gè)計(jì)算核又可以承擔(dān)不同的功能,這就是全新的混合計(jì)算設(shè)計(jì)理念。

如何贏在混合云與計(jì)算時(shí)代?解讀英特爾再度回歸芯“智”向

在全新的混合計(jì)算架構(gòu)設(shè)計(jì)理念下,英特爾對(duì)大家所熟知的X86芯片,英特爾又稱(chēng)之為Performance Core,進(jìn)行了大幅改進(jìn)和性能提升,特別是新增了針對(duì)通用AI計(jì)算的New Matrix Engine,可勝任常見(jiàn)的人工智能推理計(jì)算,例如在幾萬(wàn)張圖中找到想要查找的圖片就可以用全新的Performance Core在秒級(jí)實(shí)現(xiàn)。而Efficient Core是針對(duì)多線(xiàn)程和多核心計(jì)算而優(yōu)化的高效高性能核,可以針對(duì)云計(jì)算環(huán)境中的輕量級(jí)并行多任務(wù)計(jì)算例如云備份中的多文檔上傳,提供更高的效率與效能。Alder Lake就是結(jié)合了Performance Core和Efficient Core、面向下一代PC的產(chǎn)品,將在今年下半年市。

在面向下一代數(shù)據(jù)中心方面,IPU(基礎(chǔ)設(shè)施處理器)是英特爾最新提出的處理器,用于幫助云服務(wù)商降低成本、提高CPU性能。簡(jiǎn)單理解,IPU就是將云服務(wù)商的基礎(chǔ)設(shè)施功能都轉(zhuǎn)移到IPU上,從而釋放CPU的最大算力。IPU還能促進(jìn)基礎(chǔ)資源的池化,讓CPU、GPU、內(nèi)存等都在IPU的調(diào)度下池化,從而最大程度提高云服務(wù)商的服務(wù)能力與降低成本,Mount Evants就是英特爾首款A(yù)SIC IPU產(chǎn)品,也是與一家頂級(jí)云服務(wù)商合作的結(jié)果。

Ponte Vecchio是英特爾面向高性能和人工智能工作負(fù)載的新款GPU,該款GPU包含1000萬(wàn)億個(gè)晶體管,現(xiàn)有的工程芯片可達(dá)到每秒45萬(wàn)億次的浮點(diǎn)計(jì)算,這已經(jīng)是業(yè)界的天花板了。英特爾也推出了適用于數(shù)據(jù)中心的下一代英特爾至強(qiáng)可擴(kuò)展處理器——Sapphire Rapids,首次采用多拼接連接方式,帶來(lái)更多的內(nèi)核,增加了很多加速引擎,包括人工智能加速引擎指令集AMX以及數(shù)據(jù)流Streaming指令集DSA等,DSA可以幫助云服務(wù)商更高效的管理所有CPU內(nèi)核、提高利用率。Sapphire Rapids還集成了很多創(chuàng)新的技術(shù),為數(shù)據(jù)中心帶來(lái)更多的創(chuàng)新、更強(qiáng)的算力和更大的突破。

與超大規(guī)模云的硬核合作

在重新思考摩爾定律的時(shí)候,英特爾也在回歸芯片的本質(zhì)——用硬件工程化的方式解決算力和普惠計(jì)算問(wèn)題。因此,與最終客戶(hù)在一起,共同思考最具普遍需求的計(jì)算問(wèn)題,是進(jìn)行創(chuàng)新的重要方式。英特爾就與阿里云這樣的超大規(guī)模公有云合作,通過(guò)研究超大規(guī)模的計(jì)算問(wèn)題,回歸創(chuàng)新本質(zhì)、再造“芯”方向。

如何贏在混合云與計(jì)算時(shí)代?解讀英特爾再度回歸芯“智”向

英特爾傲騰持久內(nèi)存就是為了解決數(shù)據(jù)中心的計(jì)算速度與持久存儲(chǔ)而誕生的新物種。英特爾傲騰持久內(nèi)存具備大容量、經(jīng)濟(jì)性和持久性等特色,能為多種數(shù)據(jù)中心計(jì)算場(chǎng)景帶來(lái)全新的改進(jìn),包括分析、數(shù)據(jù)庫(kù)和內(nèi)存數(shù)據(jù)庫(kù)、人工智能、容器等。英特爾中國(guó)傲騰卓越創(chuàng)新中心工程部經(jīng)理吳國(guó)安與阿里云彈性計(jì)算產(chǎn)品專(zhuān)家唐湘華在2021杭州云棲大會(huì)英特爾論壇上介紹了雙方合作用英特爾傲騰持久內(nèi)存推動(dòng)云基礎(chǔ)設(shè)施和云應(yīng)用創(chuàng)新的共同努力。

英特爾傲騰持久內(nèi)存可以作為云上基礎(chǔ)設(shè)施,服務(wù)于所有云上客戶(hù)的應(yīng)用創(chuàng)新,例如利用持久內(nèi)存在虛機(jī)或容器中擴(kuò)展內(nèi)存容量或加速存儲(chǔ)。吳國(guó)安從兩個(gè)方向介紹了傲騰持久內(nèi)存用于云上創(chuàng)新。首先是針對(duì)計(jì)算或者額外開(kāi)銷(xiāo)特別大的場(chǎng)景,例如網(wǎng)絡(luò)開(kāi)銷(xiāo)等,可以使用傲騰持久內(nèi)存取代內(nèi)存,這樣在性能上面并沒(méi)有明顯損失,但TCO卻下降很多。第二個(gè)方向是IO占比非常大、也就是存儲(chǔ)占比大的場(chǎng)景,因?yàn)榘硫v持久內(nèi)存的基礎(chǔ)性能是SSD性能的幾十倍,因此可以用傲騰持久內(nèi)存進(jìn)行IO加速,從而大幅提升整體性能。

如何贏在混合云與計(jì)算時(shí)代?解讀英特爾再度回歸芯“智”向

對(duì)于第一個(gè)方向,利用傲騰持久內(nèi)存加速Redis數(shù)據(jù)庫(kù)是一個(gè)典型的場(chǎng)景。Redis被評(píng)為2021年Top 1的Non-SQL內(nèi)存數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)在很多客戶(hù)中有大量應(yīng)用。用傲騰持久內(nèi)存取代內(nèi)存,可以在Redis性能幾乎沒(méi)有損失的前提下,大幅降低TCO。當(dāng)然,也可以不用傲騰持久內(nèi)存完全取代DRAM內(nèi)存,而是根據(jù)不同的業(yè)務(wù)場(chǎng)景進(jìn)行一定的配比,對(duì)數(shù)據(jù)進(jìn)行分層處理,例如對(duì)MemKeyDB進(jìn)行分層處理。另外,阿里巴巴自研的分布式緩存系統(tǒng)Tair,也采用了傲騰持久內(nèi)存,從而有效降低成本、擴(kuò)展內(nèi)存。

對(duì)于第二個(gè)方向,用傲騰持久內(nèi)存加速KV存儲(chǔ)是一個(gè)典型的場(chǎng)景。KV存儲(chǔ)是云上很多應(yīng)用的基礎(chǔ),例如阿里DeepRec推薦系統(tǒng)的參數(shù)就采用了基于傲騰持久內(nèi)存的KV存儲(chǔ),實(shí)現(xiàn)存儲(chǔ)加速。其它還有由英特爾支持的開(kāi)源PMEMKV存儲(chǔ)、KVDK開(kāi)發(fā)工具,以及由Facebook開(kāi)源的RocksDB等。

唐湘華從產(chǎn)品落地層面,介紹了阿里云基于持久內(nèi)存的云上創(chuàng)新實(shí)踐。阿里云在很早之前就已經(jīng)開(kāi)始投入探索研究持久內(nèi)存,阿里云是全球第一家基于持久內(nèi)存推出云服務(wù)器的廠商,早在去年10月份就發(fā)布了第一款的持久內(nèi)存實(shí)例。經(jīng)過(guò)去年一年的沉淀和打磨以及底層硬件架構(gòu)的迭代,阿里云在今年對(duì)持久內(nèi)存實(shí)例進(jìn)行了全面的升級(jí)迭代——最新持久內(nèi)存實(shí)例基于阿里云第三代神龍架構(gòu)以及英特爾最新第二代持久內(nèi)存BPS,相比上代產(chǎn)品的IO能力實(shí)現(xiàn)了翻倍、算力提升40%以上。

在產(chǎn)品層面,阿里云在今年進(jìn)行了大膽創(chuàng)新,基于持久內(nèi)存推出了高端本地盤(pán)實(shí)例產(chǎn)品i4p,相對(duì)于傳統(tǒng)的NVME本地盤(pán)實(shí)例,實(shí)現(xiàn)了根本性的性能提升,特別是高端本地盤(pán)的讀寫(xiě)延時(shí)可以低至170納秒級(jí)別,而傳統(tǒng)NVME在10-30微秒左右,因此性能提升將近100倍以上。此外,高端本地盤(pán)的單盤(pán)IOPS高達(dá)140萬(wàn)以上、單盤(pán)吞吐高達(dá)9GB/s,相對(duì)NVMe也有數(shù)倍的提升。由于高端本地盤(pán)在性能上的絕對(duì)領(lǐng)先,對(duì)于重IO的客戶(hù)應(yīng)用場(chǎng)景來(lái)說(shuō),是極大的福音——傳統(tǒng)因?yàn)镹VMe SSD性能不足帶來(lái)的性能瓶頸問(wèn)題,在高端本地盤(pán)上得到了有效的解決,例如RocksDB數(shù)據(jù)庫(kù)性能提升2.5倍、Click House數(shù)據(jù)庫(kù)性能提升2倍、NSQ消息中間件業(yè)務(wù)恢復(fù)時(shí)間提升2-3倍、重IO應(yīng)用延時(shí)和抖動(dòng)得到有效抑制等。

如何贏在混合云與計(jì)算時(shí)代?解讀英特爾再度回歸芯“智”向

此外,阿里云還持續(xù)挖掘持久內(nèi)存在內(nèi)存方面的特性,與i4p同步推出了基于持久內(nèi)存的內(nèi)存型實(shí)例r7p和re7p。對(duì)于需要消耗大量?jī)?nèi)存的客戶(hù)來(lái)說(shuō),用持續(xù)內(nèi)存取代內(nèi)存就可以馬上獲得成本的收益。因?yàn)榇笕萘績(jī)?nèi)容非常貴,而且目前業(yè)界沒(méi)有其它云服務(wù)商可以提供小規(guī)格大容量配比的實(shí)例,因此無(wú)法無(wú)限擴(kuò)充內(nèi)存,而只能在性能與成本之間進(jìn)行折中。阿里云看到持久內(nèi)存可以解決這個(gè)問(wèn)題,特別是一些應(yīng)用經(jīng)過(guò)了特定的改造,可以在性能幾乎無(wú)損的前提下,讓客戶(hù)獲得純成本收益,例如redis、Parameter Server等應(yīng)用都可以達(dá)50%以上性?xún)r(jià)比提升而且應(yīng)用部署非常簡(jiǎn)單,目前已經(jīng)有很多阿里云客戶(hù)的應(yīng)用跑在了持久內(nèi)存上。

面對(duì)云上層出不窮的應(yīng)用,英特爾持久內(nèi)存也不斷創(chuàng)新:第三代產(chǎn)品正在開(kāi)發(fā)過(guò)程中,將有性能方面的極大提升;第四代產(chǎn)品采用了CXL接口,可以直接插在PCI-E總線(xiàn)上,與內(nèi)存一起進(jìn)行擴(kuò)展。對(duì)于處理器核心數(shù)目的不斷增長(zhǎng),大內(nèi)存需求將得到充分釋放;而網(wǎng)絡(luò)性能的增長(zhǎng)則要求更高性能、更高壽命的存儲(chǔ)——這些都是持久內(nèi)存發(fā)揮重要作用的創(chuàng)新場(chǎng)景。英特爾為了推廣持久內(nèi)存,還推出了相應(yīng)的應(yīng)用開(kāi)發(fā)編程書(shū)籍,幫助更多開(kāi)發(fā)者利用持久內(nèi)存進(jìn)行創(chuàng)新。

智在此芯、軟硬兼施

DeepRec大規(guī)模稀疏模型訓(xùn)練引擎是英特爾與阿里巴巴合作的領(lǐng)先AI工程化系統(tǒng),這是一個(gè)基于TensorFlow的推薦引擎。眾所周知,在阿里巴巴的業(yè)務(wù)場(chǎng)景中有大量的推薦系統(tǒng),而推薦系統(tǒng)的特征值十分稀疏,特別適合英特爾技術(shù)。DeepRec作為阿里巴巴集團(tuán)稀疏場(chǎng)景的統(tǒng)一訓(xùn)練引擎,由集團(tuán)多個(gè)團(tuán)隊(duì)合作共建,從2016年深耕至今已經(jīng)支持了淘寶搜索、推薦、廣告等核心業(yè)務(wù),同時(shí)也為阿里云客戶(hù)的推薦業(yè)務(wù)提供服務(wù)。

如何贏在混合云與計(jì)算時(shí)代?解讀英特爾再度回歸芯“智”向

由于阿里巴巴推薦系統(tǒng)的特征值往往十分巨大,動(dòng)輒達(dá)到百億、千億、萬(wàn)億甚至十萬(wàn)億的超大規(guī)模,那么如何基于阿里機(jī)器學(xué)習(xí)平臺(tái)PAI和英特爾技術(shù),實(shí)現(xiàn)業(yè)務(wù)的高效落地,就成為雙方要共同解決的挑戰(zhàn)。英特爾中國(guó)區(qū)超大云計(jì)算軟件架構(gòu)總監(jiān)魏彬與阿里云智能高級(jí)產(chǎn)品專(zhuān)家黃博遠(yuǎn)在2021杭州云棲大會(huì)英特爾論壇上,介紹了雙方圍繞DeepRec引擎所做的努力。

黃博遠(yuǎn)介紹,推薦系統(tǒng)具有極大的商業(yè)價(jià)值,但推薦系統(tǒng)的深度學(xué)習(xí)模型面臨著幾大挑戰(zhàn):首先是模型特征值的處理,由于推薦模型特征值的變化非???,需要?jiǎng)討B(tài)處理而無(wú)法像傳統(tǒng)深度學(xué)習(xí)訓(xùn)練那樣等一周或一個(gè)月才能訓(xùn)練出一個(gè)模型;此外,由于超大規(guī)模的模型,在訓(xùn)練過(guò)程中會(huì)遇到構(gòu)建分布式框架、Runtime和編譯的優(yōu)化、圖優(yōu)化、算子優(yōu)化等一系列的問(wèn)題,而這一切優(yōu)化都需要上層軟件與底層硬件以及硬件廠商提供的算子庫(kù)進(jìn)行深度合作,因此PAI平臺(tái)選擇與英特爾合作對(duì)DeepRec進(jìn)行優(yōu)化。

如何贏在混合云與計(jì)算時(shí)代?解讀英特爾再度回歸芯“智”向

魏彬介紹,英特爾與阿里巴巴PAI機(jī)器學(xué)習(xí)平臺(tái)團(tuán)隊(duì)合作,為DeepRec完成了大量的優(yōu)化,包括沉淀了大量算子優(yōu)化、圖優(yōu)化、Runtime優(yōu)化、編譯優(yōu)化,并基于硬件實(shí)現(xiàn)了深度定制優(yōu)化,支持高性能分布式訓(xùn)練,在稀疏模型的訓(xùn)練方面有著優(yōu)異的性能。例如:在算子優(yōu)化方面,針對(duì)稀疏模型的典型算子優(yōu)化,充分利用AVX512、BF16指令加速,還將大矩陣進(jìn)行分塊,提升cache命中率,減少訪(fǎng)存開(kāi)銷(xiāo),實(shí)現(xiàn)算子加速2-6倍;在框架及庫(kù)優(yōu)化方面,整合了最新的英特爾oneDNN加速庫(kù),實(shí)現(xiàn)線(xiàn)程池調(diào)度優(yōu)化,獲取最佳性能,還基于PEME持久內(nèi)存進(jìn)行優(yōu)化等等。

目前,英特爾正與阿里巴巴合作,推動(dòng)DeepRec的開(kāi)源,從而造福整個(gè)生態(tài),讓更多的客戶(hù)可以獲得與阿里巴巴同樣性能的推薦系統(tǒng),進(jìn)而在發(fā)展數(shù)字化業(yè)務(wù)中占得先機(jī)。

【全文總結(jié)】從2021杭州云棲大會(huì)英特爾論壇,可以看出英特爾面向未來(lái)數(shù)字化場(chǎng)景進(jìn)行底層硬件和芯片級(jí)創(chuàng)新的決心和能力。英特爾通過(guò)與阿里云這樣的世界頂級(jí)云服務(wù)商合作,打開(kāi)了從“芯”創(chuàng)新的思路與方向,同時(shí)在實(shí)際的超大規(guī)模業(yè)務(wù)打磨中,錘煉了從底層芯片到上層應(yīng)用軟件的一體化創(chuàng)新與優(yōu)化能力,找到了制勝混合云與計(jì)算時(shí)代的路徑。因此,混合云與計(jì)算時(shí)代,英特爾可期!

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )