引領異構時代,英特爾發(fā)布重大架構創(chuàng)新

引領異構時代,英特爾發(fā)布重大架構創(chuàng)新

英特爾公司高級副總裁兼加速計算系統(tǒng)和圖形事業(yè)部總經理 Raja M. Koduri

英特爾推出兩大x86 CPU內核、兩大數(shù)據中心SoC、兩款獨立GPU,以及變革性的客戶端多核性能混合架構

架構是硬件和軟件的“煉金術”。它融合特定計算引擎所需的先進晶體管,通過領先的封裝技術將它們連接,集成高帶寬和低功耗緩存,在封裝中為混合計算集群配備高容量、高帶寬內存和低時延、可擴展互連,并確保所有軟件無縫地加速。披露面向新產品的架構創(chuàng)新,是英特爾架構師在每年架構日上的期許,今年舉辦的第三屆英特爾架構日令人十分興奮。

今天,英特爾公布了英特爾®架構在近年來重大的改變和創(chuàng)新。 這包括:第一次深入介紹了英特爾首個性能混合架構Alder Lake,其搭載兩款新一代x86內核以及智能英特爾®硬件線程調度器;英特爾全新引領行業(yè)標準的數(shù)據中心架構Sapphire Rapids,其搭載全新的性能核以及多種加速器引擎;英特爾全新的獨立游戲圖形處理器(GPU)架構;英特爾全新的基礎設施處理器(IPU)以及超凡的數(shù)據中心GPU架構Ponte Vecchio,其具備英特爾迄今為止最高的計算密度。

架構突破為英特爾的下一波領先產品奠定基礎,率先推出的是Alder Lake。隨著從臺式機到數(shù)據中心的工作負載愈發(fā)龐大、愈發(fā)復雜、愈發(fā)多樣,英特爾在架構日上展示的突破展現(xiàn)了架構將如何滿足對更高計算性能的需求。

架構師們奮力而行,結合英特爾獨特、豐富的標量、矢量、矩陣和空間計算引擎,打造混合計算架構,為客戶的高需求工作負載提供非線性處理能力。

能效核:一個高度可擴展的x86微架構,它能滿足客戶從低功耗移動應用到多核微服務的全方位計算需求。對比英特爾迄今為止最多產的CPU微架構——Skylake,能效核可在相同功耗下提升40%的單線程性能,或者在提供同樣性能時,功耗僅為Skylake的40%不到。1就吞吐量性能而言,與運行四個線程的兩個Skylake內核相比,四個能效核在性能提升80%的同時功耗更低,或者在提供相同吞吐量性能時,功耗降低80%。1

性能核:它不僅是英特爾迄今為止性能最高的CPU內核,而且在CPU架構性能方面實現(xiàn)階梯式提升,推動未來十年的計算發(fā)展。它是一個更寬、更深、更智能的架構,展現(xiàn)出更高的并行性,提高執(zhí)行并行性,降低時延,提升通用性能。它還幫助支持大數(shù)據集和大型代碼體積的應用程序。與第11代酷睿架構(Cypress Cove內核)相比,相同頻率下,性能核在一系列工作負載上平均提升了約19%。1

針對數(shù)據中心處理器和機器學習的發(fā)展趨勢,性能核提供了專用硬件,包括新的英特爾高級矩陣擴展(AMX)來執(zhí)行矩陣乘法運算,以獲得數(shù)量級的性能——AI加速提升約8倍。這是為軟件易用性而設計,利用了x86編程模型。

英特爾硬件線程調度器:這是英特爾開發(fā)的獨特調度方法,旨在確保將能效核和性能核無縫銜接在一起,從開始就動態(tài)、智能地分配工作負載,從而優(yōu)化系統(tǒng)以在真實場景中實現(xiàn)更高的性能和效率。智能直接置于內核,英特爾硬件線程調度器與操作系統(tǒng)無縫配合,在合適的時間把合適的線程分配給合適的內核。

Alder Lake它重構了多核架構,是英特爾首個搭載全新英特爾硬件線程調度器的性能混合架構。它是英特爾最智能的客戶端SoC架構,結合了能效核和性能核,適用于從移動端到臺式機的產品,并通過多種業(yè)界領先的I/O和內存而引領行業(yè)變革?;贏lder Lake的產品將在今年開始出貨。

XeHPG和Alchemist SoC:一款全新的獨立顯卡微架構,專為游戲和創(chuàng)作工作負載提供發(fā)燒友級別的性能。XeHPG微架構采用新的Xe內核,聚焦計算、可編程、可擴展,并全面支持DirectX 12 Ultimate。Xe內核中的全新矩陣引擎(XeMatrix eXtensions,XMX)能夠加速AI工作負載,比如XeSS,是一項全新升頻技術(upscaling technology),可以實現(xiàn)高性能、高保真游戲體驗?;赬eHPG的Alchemist SoC(之前代號為DG2)將于2022年第一季度上市,并采用新的品牌名英特爾®銳炫™。

Sapphire Rapids:它結合了英特爾的性能核與全新加速器引擎,樹立了下一代數(shù)據中心處理器的標準。Sapphire Rapids的核心是一個模塊化的分區(qū)SoC架構,得益于英特爾的EMIB多晶片互連封裝技術和先進網格架構,它具有顯著的可擴展性,同時仍保持單晶片CPU接口的優(yōu)勢。

基礎設施處理器(IPU:Mount Evans是英特爾首款專用ASIC IPU,以及全新的基于FPGA的IPU參考平臺——Oak Springs Canyon。通過基于英特爾IPU的架構,云服務提供商(CSPs)可以通過把基礎設施任務從CPU轉移到IPU,從而讓數(shù)據中心收益更大化。把基礎設施任務轉移到IPU,能夠讓云服務提供商(CSPs)可以把所有的服務器CPU租給客戶。

XeHPC, Ponte Vecchio:Ponte Vecchio是英特爾迄今為止最復雜的SoC,也是英特爾踐行IDM 2.0戰(zhàn)略的絕佳示例,它采用多種先進的半導體制程工藝、英特爾變革性的EMIB技術以及Foveros 3D封裝技術。這是英特爾實現(xiàn)堪比登月難度創(chuàng)新后的一款產品,它包含1000億個晶體管,提供業(yè)界領先的浮點運算和計算密度,以加速人工智能、高性能計算和高級分析工作負載。在架構日上,英特爾展示了早期的Ponte Vecchio芯片就已經顯示出領先的性能,在一個流行的AI基準測試上創(chuàng)造了推理和訓練吞吐量的行業(yè)紀錄。1英特爾的A0芯片已經實現(xiàn)了超過每秒45萬億次浮點運算的FP32吞吐量,超過5 TBps的持續(xù)內存結構帶寬以及超過 2 TBps的連接帶寬。如Xe架構一樣,Ponte Vecchio將由oneAPI支持,后者是英特爾一個開放、基于標準、跨架構、跨供應商的統(tǒng)一軟件堆棧。

回望過去一年,科技處于所有人如何溝通、工作、娛樂和應對新冠肺炎疫情的核心。事實證明,強大的計算能力至關重要。展望未來,我們面臨龐大的算力需求,預計到2025年將是1000x(千倍級)的提升,而四年內增加1,000倍相當于摩爾定律的5次方。

英特爾CEO帕特·基辛格也是一位架構師,他說:“我們面臨艱巨的計算挑戰(zhàn),一定要通過變革性的架構和平臺來解決……正是英特爾才華橫溢的架構師和工程師們,讓這些技術‘魔法’得以成真。”

世界正依賴架構師和工程師來解決艱巨無比的計算問題,以造福人類。這就是為什么英特爾的戰(zhàn)略和執(zhí)行不斷加速以滿足所需,疾步前行。

(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )