科技云報道原創(chuàng)。
近年來,以AI機器學習、大規(guī)模視頻處理、大規(guī)模數(shù)據(jù)處理等為首的高負載云計算應用日益增多,其場景運算強度大、高并發(fā)、應用復雜,對云計算廠商的服務質量提出了前所未有的極高要求,并倒逼服務器芯片加速發(fā)展。
尤其是在“云原生”的概念提出后,傳統(tǒng)IT時代的云計算更多是為了適配當前的IT架構,進而適配各類應用。
可在云原生時代里,很多應用本身就是生于云、長于云。
如何根據(jù)這些云原生應用的需求打造更適宜其生長的土壤,成了云廠商技術變革的頭等大事。
“云土壤”的改造既涉及軟件、架構、操作系統(tǒng),又涉及網(wǎng)絡、服務器、計算板卡,更會涉及最為核心的算力來源——芯片。
巨頭廠商扎堆云計算芯片
中國信息通信研究院發(fā)布的《云計算白皮書(2022年)》指出,隨著經(jīng)濟回暖,全球云計算市場所受影響逐步減弱,至2021年已基本恢復到疫情前的增長水平。
2021年,中國云計算總體處于快速發(fā)展階段,市場規(guī)模達3229億元,同比增長54.4%。
其中,公有云市場繼續(xù)保持較快發(fā)展,同比增長70.8%,達到2181億元,成為未來幾年中國云計算市場增長的主要動力;私有云市場突破千億元大關,同比增長28.7%,增至1048億元。
云計算逐漸出現(xiàn)虹吸效應,并在安全性、網(wǎng)邊端形成新的服務方式。JP Morgan報告認為,到2025年,數(shù)據(jù)中心的芯片市場價值將近180億美元。
隨著國家“十四五”規(guī)劃的推進以及新基建的投資,未來五年,中國服務器市場將保持健康穩(wěn)定的增長。
2021-2025年,中國服務器市場規(guī)模將由257.31億美元升至410.29億美元,保持12.5%的年復合增長率,服務器芯片也將迎來廣闊市場。
當然,云計算中涉及的芯片種類繁多,各家側重點也有所不同。
比如,阿里的含光800、谷歌的TPU、以及芯片廠商英特爾的Habana Gaudi 2、英偉達的H100等,都是側重于人工智能應用的計算芯片。
此外,近年間還有DPU、IPU、CIPU等新型數(shù)據(jù)中心處理器。
云計算芯片市場的老玩家——CPU自然也不會缺席。
目前,全球服務器芯片的架構仍然以x86獨大,ARM與其他架構份額較小。
根據(jù)JP Morgan的數(shù)據(jù)顯示,目前還沒有明顯跡象表明大量的數(shù)據(jù)中心開始從x86架構轉移到ARM架構。
預計到2025年,x86仍會是數(shù)據(jù)中心主要架構,預計仍會有90%市占率。
CPU架構設計難度大、生態(tài)壁壘高,一直是芯片產(chǎn)業(yè)的集大成之作。然而,哪里有壟斷,哪里就有挑戰(zhàn)者。
從2008年開始,ARM就持續(xù)對服務器芯片市場發(fā)動了進攻,惠普、AMD、博通、高通等芯片設計公司都曾陸續(xù)推出相關產(chǎn)品,可惜大多折戟。
然而,市場并未因一時的失利而失去信心。
2018年,ARM發(fā)布ARM Neoverse計算平臺,瞄準了云計算服務器、HPC、AI與機器學習加速這幾大場景。
隨后幾年里,AWS推出Graviton系列服務器CPU;Ampere Computing推出80核Ampere Altra和128核Ampere Altra Max服務器CPU;國內廠商飛騰推出多款服務器CPU。
話語權不足引各廠商自研芯片
由于晶圓代工及封測成本大增,AMD的EPYC服務器芯片或將漲價10%—30%,屆時服務器芯片的戰(zhàn)況將更趨白熱化。
無論是英特爾芯片的延遲發(fā)布,還是AMD可能的漲價,種種行為都在某種程度上剝奪著云服務廠商等下游企業(yè)的話語權和自身的發(fā)展節(jié)奏。
云廠商自研服務器芯片可以減輕對第三方供應的依賴;另一方面是自研芯片可以降低成本,自研芯片能夠讓云服務商在每個業(yè)務流程中做到效率與成本的最優(yōu)化。
此外,自己的芯片更適合他們的某些需求,與英特爾、AMD等廠商提供的現(xiàn)成芯片相比,具有成本和性能優(yōu)勢。
構建自家的芯片能夠在各種層次上進行更快的創(chuàng)新,提高安全性和靈活性,并提供更多價值。自研芯片可以控制項目的開始、進度和交付的進程;可以將硬件和軟件并行開發(fā),并使用大規(guī)模的云來進行構建芯片所需的所有模擬。
在云服務上,自研芯片帶來的成本降低是巨大的。云服務頭部廠商基本定型之后,價格戰(zhàn)就成了拉攏新客戶留住老用戶的必經(jīng)之路,Arm服務器芯片帶來的高功效意味著他們可以推出定價更低的實例。
但設計能力、設計成本等多因素的取舍使得不少服務器芯片廠商開始選擇不同的技術路線,有的緊跟Arm Neoverse核心,有的則選擇了自研。
誠然是芯片獨立的需求,另一方面也來自用戶和技術。
定制自研芯片的核心目的并不是為了與傳統(tǒng)芯片廠商進行競爭,而是來自用戶自下而上的需求:性能和成本。
目前,對于計算場景的應用復雜程度已經(jīng)倒逼芯片處理性能的提升。多重負載,尤其是在機器學習方面,芯片性能直接制約了算法的應用。
非常規(guī)芯片正成為算力不斷變化和競爭壓力下的選擇,通用的CPU和GPU難以滿足。
因此不少云廠商選擇在與芯片廠商合作的同時,開始根據(jù)自己特定的需求自研芯片,以達到最高程度的適配,從而提升整體的競爭實力。
自研云計算芯片成下一個爆發(fā)點
過去的十年間,信息的生成、處理和存儲方式發(fā)生了根本性的轉變。
面對互聯(lián)網(wǎng)高速發(fā)展的業(yè)務,急劇增長的用戶,脈沖流量讓傳統(tǒng)的IOE(IBM小型機、Oracle數(shù)據(jù)庫、EMC存儲)技術架構捉襟見肘,解決算力不足的問題幾乎只能靠擴大采購規(guī)模,搭建一套全新的技術架構才是最優(yōu)解。
十多年前的云計算公司,最重要的任務是擴大數(shù)據(jù)中心的規(guī)模,自研芯片有些遙不可及。
但有遠見和抱負的云計算公司,那時起就邁上了通過自研解決問題的長路,從自己擅長的操作系統(tǒng)起步。
如今,云計算巨頭們的核心目標已經(jīng)不再是業(yè)務擴張的速度,深入底層技術,提高更具性價比和滿足差異化的需求成為新的目標。
此時,AWS、阿里云等全球領先的云計算巨頭們又不約而同地將目光投向了能夠提升云計算性價比的云原生CPU。
在2022杭州云棲大會上,阿里巴巴公布了自研算力體系新進展,其自研CPU倚天710已經(jīng)在數(shù)據(jù)中心大規(guī)模部署,并以云的形式服務阿里巴巴和多家互聯(lián)網(wǎng)科技公司,算力性價比提升超30%,單位算力功耗降低60%,成為中國首個云上大規(guī)模應用的自研CPU,實現(xiàn)算力攻堅重大突破。
未來2年,阿里云20%的新增算力將使用自研CPU。
從芯片架構來看,倚天710基于最新的ARMv9架構,內含128核CPU,主頻最高達到3.2GHz,能夠同時兼顧性能和功耗。
基于倚天710的云計算實例在數(shù)據(jù)庫、大數(shù)據(jù)、視頻編解碼、AI推理等核心場景中的性價比提升30%以上,單位算力功耗(耗電量)降低了60%以上。
百度Apollo在近日舉行的Apollo Day技術開放日上,推出了新一代自研的云端通用芯片——昆侖芯二代AI芯片。
據(jù)了解,這顆芯片基于7nm工藝打造,配備GDDR6高速顯存,內存帶寬可達512GB/s,采用新一代昆侖芯 XPU-R 架構,通用性和性能顯著提升。
目前,該芯片已完成無人駕駛場景端到端適配。
在2018年,亞馬遜云科技發(fā)布了Arm架構的Amazon Graviton處理器。
這是亞馬遜云科技自研、為云計算而設計開發(fā)的芯片。
2020年Graviton2發(fā)布,性能比第一代提升了 7 倍;2021年推出了第三代,性能比二代提升四分之一,浮點計算性能提高了兩倍。
今年,在re:Invent 2022大會上,亞馬遜云科技發(fā)布了Graviton3E。
這是針對高性能計算優(yōu)化的版本,面向機器學習浮點和矢量數(shù)學計算做了優(yōu)化,在 HPL 基線測試中,工作負載的性能提高35%。
基于Graviton3E芯片,亞馬遜云科技推出了面向高性能計算的HPC7g,適用于天氣預報、生命科學、工程計算等高性能計算場景,最多可以提供64個vCPU和128GiB內存。
亞馬遜云科技是云廠商自研芯片的重要代表,大型云服務商為了實現(xiàn)差異化基礎設施服務,都在向上游延伸。
該公司還推出新一代Nitro網(wǎng)絡芯片和Inferentia2機器學習加速推理芯片,均為專用芯片:Nitro網(wǎng)絡芯片用途接近近年流行的“DPU(數(shù)據(jù)處理器)”,用于處理海量數(shù)據(jù);Inferentia2用于運行大型深度學習模型,滿足AI計算需求。
當算力作為新生產(chǎn)力的確定性被不斷驗證,以阿里云、AWS為代表的云計算企業(yè),正努力將對算力的主動性,牢牢掌握在自己手中。
因為他們深知,隨著新一輪科技變革的深入發(fā)展,只有掌握了核心技術,才能抓住未來技術的定義權。
來源:科技云報道
免責聲明:此文內容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關。文章僅供讀者參考,并請自行核實相關內容。投訴郵箱:editor@fromgeek.com。
免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產(chǎn)權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。