服務(wù)全球百萬用戶的最佳實踐:硬件創(chuàng)新經(jīng)驗沒有壓縮算法!

硬件創(chuàng)新有沒有經(jīng)驗可循?從亞馬遜云科技服務(wù)全球百萬用戶的最佳實踐來看,硬件創(chuàng)新經(jīng)驗沒有壓縮算法,只有從用戶中來到用戶中去。

作為特別接地氣的技術(shù)實用主義公司,亞馬遜云科技在云計算方面的創(chuàng)新一直沒有停止,而創(chuàng)新的動力源泉就是客戶的需求,其 90% 以上的創(chuàng)新都來自于客戶的需求反饋,剩下 10% 是和用戶交流過程中亞馬遜云科技自己的思考。在今年的亞馬遜云科技 re:Invent 全球大會主題演講上,亞馬遜云科技 CEO Adam Selipsky 表示: “16 年來,亞馬遜云科技一直在優(yōu)化和創(chuàng)新計算、存儲和網(wǎng)絡(luò)基礎(chǔ)設(shè)施服務(wù),以支持您的所有工作負載。目前亞馬遜云科技已有 600 多種不同的計算實例類型,因此您可以找到適合您的所有應(yīng)用需求的正確資源組合?!?/p>

“從客戶中來,到客戶中去”不只是一句簡單的口號,而是亞馬遜云科技的持續(xù)積累和創(chuàng)新實踐。通過硬件創(chuàng)新,不斷擴展云計算的邊界,用更豐富的云計算服務(wù),賦能客戶的上云業(yè)務(wù)場景。亞馬遜云科技為所有客戶業(yè)務(wù)負載,提供全方位的計算能力支持。

服務(wù)全球百萬用戶,依靠亞馬遜云科技全球布局的“下一代云基礎(chǔ)架構(gòu)”,將技術(shù)積累和技術(shù)創(chuàng)新不斷轉(zhuǎn)化為云計算底層能力,賦能全球客戶。所以,亞馬遜云科技在硬件上的創(chuàng)新,才更受萬眾矚目。

加速硬件創(chuàng)新,滿足客戶多樣性需求

目前亞馬遜云科技已經(jīng)在 Nitro 系統(tǒng)的加持下,有超過 600 款計算實例,幾乎可以滿足一切云上負載的需求。如今每天有超過 6000 萬個新的 EC2 實例在亞馬遜云科技上被創(chuàng)建。

自 2013 年推出 Amazon Nitro 系統(tǒng)以來,亞馬遜云科技已經(jīng)開發(fā)了多個自研芯片,包括五代 Nitro 系統(tǒng)、致力于為各種工作負載提升性能和優(yōu)化成本的三代 Amazon Graviton 芯片、用于加速機器學(xué)習(xí)推理的兩代 Amazon Inferentia 芯片,以及用于加速機器學(xué)習(xí)訓(xùn)練的 Amazon Trainium 芯片。

亞馬遜云科技在芯片設(shè)計和驗證的敏捷開發(fā)周期中使用基于云的電子設(shè)計自動化,這使團隊能夠更快地創(chuàng)新,更快地將芯片提供給客戶。實踐證明,亞馬遜云科技更現(xiàn)代化、更節(jié)能的半導(dǎo)體處理確保了芯片的快速迭代及交付。每推出一款新的芯片,亞馬遜云科技都進一步提升了這些芯片支持的 Amazon EC2 實例的性能、效率以及更優(yōu)化的成本,為客戶提供了更多的芯片和實例組合選擇,針對他們獨特的工作負載進行了優(yōu)化。

2022 年 11 月 30 日,亞馬遜云科技在 2022 re:Invent 全球大會上宣布,推出新的自研芯片支持的 Amazon Elastic Compute Cloud(Amazon EC2)實例,為客戶廣泛的工作負載提供更高性價比。

高性能計算方面,硬件產(chǎn)品持續(xù)升級

亞馬遜云科技在大會上推出了 Amazon EC2 Hpc7g 實例,采用最新款的 Amazon Graviton3E 處理器,為高性能計算工作負載提供極佳的性價比。新的 HPC7g 實例類型具有 最多 64 個 vCPU 和 128 GB 內(nèi)存,主要適用于天氣預(yù)報、生命科學(xué)、工程計算等高性能計算場景。與當(dāng)前一代 C6gn 實例相比浮點性能提高了 2 倍,與當(dāng)前一代 Hpc6a 實例相比性能提高了 20%,為亞馬遜云科技上的高性能計算工作負載提供了超高性價比。

此次發(fā)布的 Amazon EC2 C7gn 由 Amazon Graviton3E 處理器提供支持。配備了新一代 Amazon Nitro的 C7gn 實例,具有增強的網(wǎng)絡(luò)處理能力,是目前 Amazon EC2 網(wǎng)絡(luò)優(yōu)化型實例中,提供最高網(wǎng)絡(luò)帶寬和數(shù)據(jù)包轉(zhuǎn)發(fā)性能的實例。新推出的 C7gn 實例相比于 C7g,為網(wǎng)絡(luò)密集型工作負載而設(shè)計,如數(shù)據(jù)分析、集群計算作業(yè)場景,以及網(wǎng)絡(luò)虛擬設(shè)備等,將支持 200 Gbps 的網(wǎng)絡(luò)帶寬,提高 50% 的數(shù)據(jù)包處理性能。

機器學(xué)習(xí),實例創(chuàng)新從未停止

在機器學(xué)習(xí)方面,此次也有不少實例創(chuàng)新。在 re:Invent 2021 中,Amazon EC2 P4de instance 全新升級,客戶可以將它們部署在大的集群中進行機器學(xué)習(xí)訓(xùn)練。此次發(fā)布了Amazon EC2 Inf2實例,采用最新款的Amazon Inferentia2 機器學(xué)習(xí)加速推理芯片,是專門為運行多達 1,750 億個參數(shù)的大型深度學(xué)習(xí)模型而構(gòu)建的,與當(dāng)前一代 Inf1 實例相比可提供高達 4 倍的吞吐量,降低多達 10 倍的延遲。

同時,亞馬遜云科技還發(fā)布了專門用于訓(xùn)練機器學(xué)習(xí)模型的定制芯片 Amazon Trainium,并于 2021 年發(fā)布了對應(yīng)的 Trn1 實例。Amazon Trainium 支持 TensorFlow、 PyTorch 和 MXNet。Trn1 實例支持最多 16 顆 Trainium 加速芯片。在 Trn1 上運行 Hugging Face BERT 大模型,其性能對比 GPU 實例有 42% 的提升,成本則降低了 54%。Trn1 第一次把實例的網(wǎng)絡(luò)帶寬提高到了 800GB。在 2022 re:Invent上,面向新的 AI 訓(xùn)練需求,亞馬遜云科技推出了基于 Trainium 的 Trn1n 訓(xùn)練芯片,針對網(wǎng)絡(luò)通信進行優(yōu)化,增加了 1600Gbps EFA 網(wǎng)絡(luò)功能,使其能夠更快地處理超大規(guī)模分布式模型訓(xùn)練場景。

基于 Intel 芯片,加速優(yōu)化升級

面對高性能計算場景,亞馬遜云科技還基于英特爾芯片做了持續(xù)創(chuàng)新,推出 Amazon EC2 R7iz 的預(yù)覽版,該實例采用第四代英特爾至強可擴展處理器,更好地實現(xiàn)內(nèi)存優(yōu)化。第四代至強處理器為 EC2?R7iz 實例提供最大 3.9GHz 的全核睿頻頻率,與其他高頻率 EC2 實例相比,該實例的性能提高 20%。R7iz 實例基于第四代英特爾可擴展處理器和 Amazon?Nitro 系統(tǒng),提供包含專用硬件和輕量級虛擬機管理軟件的結(jié)合,在性能和安全性上有顯著提高。

以 HPC 客戶的需求為例,亞馬遜云科技正式發(fā)布了用于高性能計算(HPC)的新亞馬遜彈性計算云 Amazon EC2 Hpc6id instance,基于 Amazon Nitro 系統(tǒng)構(gòu)建的 EC2 Hpc6id 實例提供 200Gbps 彈性結(jié)構(gòu)適配器網(wǎng)絡(luò),用于高吞吐量節(jié)點間通信,使客戶 HPC 工作負載能夠大規(guī)模運行,實現(xiàn)成本優(yōu)化。Adam表示:“Hpc6id 實例旨在為數(shù)據(jù)、內(nèi)存密集型 HPC 工作負載、更高的內(nèi)存帶寬、更快的本地 SSD 存儲和彈性結(jié)構(gòu)適配器增強的網(wǎng)絡(luò)提供領(lǐng)先的性價比。使用 EC2 Hpc6id 實例,可以降低 HPC 工作負載的成本,同時利用亞馬遜云科技的彈性和可擴展性?!?/p>

亞馬遜云科技 Amazon EC2 副總裁 David Brown 表示:“從 Graviton 到Trainium、Inferentia 再到 Nitro,亞馬遜云科技每一代自研芯片都為客戶的各種工作負載提供更高的性能、更優(yōu)化的成本和更高的能效。我們不斷推陳出新讓客戶獲得卓越的性價比,這也一直驅(qū)動著我們的持續(xù)創(chuàng)新。我們今天推出的 Amazon EC2 實例為高性能計算、網(wǎng)絡(luò)密集型工作負載和機器學(xué)習(xí)推理工作負載提供了顯著的性能提升,客戶有了更多的實例選擇來滿足他們的特定需求。”

Graviton 全球和中國最佳實踐

現(xiàn)在,亞馬遜云科技已經(jīng)在全球百萬用戶的基礎(chǔ)上,汲取了千行百業(yè)的客戶需求和最佳實踐,每一個實例背后都有一個客戶應(yīng)用場景。

Mobiuspace 大宇無限是一家提供先進的基于 AI 的內(nèi)容發(fā)現(xiàn)和娛樂平臺 公司。最近,Mobiuspace 在新的基于 Amazon Graviton2 的 Amazon EC2 M6g 實例上,測試了其基于 Java 的容器化后端服務(wù),與 M5 實例相比,性能提高了 40%。由于這種性能改進和 Amazon EC2 M6g 實例價格降低 20%,Mobiuspace 公司期待著采用它們。

Epic Games 成立于 1991 年,締造了《堡壘之夜》、《虛幻》、《戰(zhàn)爭機器》、《暗影情結(jié)》和《無盡之劍》等系列游戲。Epic 的虛幻引擎技術(shù)為 PC、游戲機、移動設(shè)備、AR、VR 和 Web 提供高保真的交互體驗?!罢雇磥恚覀兤诖秊橥婕掖蛟旄由砼R其境、引人入勝的體驗,并且很高興能夠使用基于 Amazon Graviton3 的 EC2 C7g 實例。我們的測試表明,它們甚至適用于最苛刻的延遲敏感型工作負載,同時能提供顯著的性價比優(yōu)勢,并擴展了《堡壘之夜》內(nèi)的可能性和任何虛幻引擎營造的體驗?!?Mark Imbriaco,Epic Games 高級工程總監(jiān)說到。

Formula1(F1)賽車始于 1950 年,是世界上最負盛名的賽車比賽,也是世界上最受歡迎的年度體育系列?!盎?Graviton2 的 C6gn 實例為我們的一些 CFD 工作負載提供了最佳性價比。我們現(xiàn)在發(fā)現(xiàn),在相同的模擬中,Graviton3 C7g 實例比 Graviton2 C6gn 實例快 40%。我們很高興 EFA 將成為此實例類型的標(biāo)準(zhǔn),并鑒于性價比的大幅提升,我們預(yù)計基于 Graviton3 的實例將成為運行我們所有 CFD 工作負載的最佳選擇?!盤atSymonds,F(xiàn)ormula1Management 的首席技術(shù)官說道。

開啟增長飛輪,引發(fā)更多云計算思考

從 2006 年起,亞馬遜云科技宣布降價 115 次。表面的是價格的降低,但更多的是亞馬遜云科技將規(guī)模與技術(shù)的紅利反饋給客戶。這是亞馬遜云科技無法模仿的增長飛輪,而跟隨者的飛輪需要額外推力才能保持運轉(zhuǎn)。

亞馬遜云科技從不在高性能、高安全性和低成本這三方面進行妥協(xié),在選擇悖論中,亞馬遜云科技給出的答案是:通過自身技術(shù)的不斷演進和創(chuàng)新,讓云計算可以兼顧高性能、高安全性和低成本。

作為全球排名第一的云計算平臺,亞馬遜云科技通過支持豐富的客戶應(yīng)用場景的經(jīng)驗反饋,更推進了亞馬遜云科技的芯片創(chuàng)新之路,這是無法比擬的,同時資源的投入,及用戶規(guī)模的增長,亞馬遜云科技的云計算之路已越走越快,越走越寬。

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2022-12-05
服務(wù)全球百萬用戶的最佳實踐:硬件創(chuàng)新經(jīng)驗沒有壓縮算法!
服務(wù)全球百萬用戶的最佳實踐:硬件創(chuàng)新經(jīng)驗沒有壓縮算法!

長按掃碼 閱讀全文