中國AI長卷(一):大國重算

編者按:“中國AI到底發(fā)展得怎么樣了?”在各種社交平臺上,我們經常會看到這樣的問題,也會看到各種各樣的答案,但這些答案有著普遍的缺陷。它們往往只抽取一兩個片段或案例,用非常取巧,甚至有點抖機靈的方式,極端唱好或者唱衰中國AI

事實上,所謂的中國AI產業(yè)覆蓋面非常廣泛。每個領域有各自的發(fā)展特點,產業(yè)優(yōu)勢以及產業(yè)局限性,很難用過分簡單的方式,來概括事實上非常復雜的AI產業(yè)。

或許,復雜的問題就應該有詳細的答案。就像一幅小畫,畫不盡中國廣袤的山水。

想要探尋中國AI的底色,需要梳理來龍去脈,需要回看一步一景,需要去畫一幅長卷。

今天我們都知道,驅動AI算法工作的“燃油”是AI算力。尤其當深度學習算法發(fā)展到了預訓練大模型階段,AI算力已經成為整個AI領域的最大成本開銷。根據相關數據,算力成本要占到大模型訓練成本的70%左右,在大模型推理階段則高達95%。

如果說,AI產業(yè)是一間工廠,那么AI算力就是工廠所需的煤和石油。更為致命的是,這些“煤和石油”的供應處在一種半壟斷狀態(tài)。在這次AI復興當中,英偉達用GPU占據全球AI算力市場的主導地位。英偉達的高端AI算力不僅成本高昂,供不應求,但對于蓬勃發(fā)展的中國AI產業(yè)來說,能否確保其供應穩(wěn)定都要打上大大的問號。

在算力貴且不穩(wěn)的前提下,中國AI產業(yè)卻涌現出了巨大的AI算力需求。根據相關數據預測,2030年全球AI算力的需求將達到2020年的500倍。其中,中國AI算力的增長是主要驅動力。目前階段,中美之間的AI算力差不多是1比1.5。種種跡象顯示,未來兩國間的AI算力需求將拉平,甚至中國反超。

成本高昂、供應不穩(wěn),需求激增,這三點勾勒出了中國AI算力的整體發(fā)展背景。

AI算力就是生產力。在種種令人不安的局面下,中國AI開始了聚沙成塔般的算力突圍。

2017年,是人工智能第三次興起的第一年。在這一年里,AlphaGO實現了對人類棋手的全面勝利,自動駕駛被廣泛看好,深度學習算法四處開花。而這一切算法表現的背后,都離不開AI算力的支持。

這一年,英偉達拉開了股價飆升,AI算力產品頻繁迭代的大幕。谷歌開始在云上布局TPU等自研算力。全球半導體產業(yè)開始看到AI算力這個極具想象力的新方向。

而與此前歷次半導體風口不同的是,這次中國的從業(yè)者們沒有后知后覺,待產業(yè)成熟后再加油追趕,他們選擇了搶跑。

在2017年10月,海思打造了麒麟970,把端側AI算力帶到了華為手機。11月,中國科學院和寒武紀共同發(fā)布了新一代產品,其中包括面向手機與云端的AI處理器。這在當時被稱為全球首個深度學習專用處理器芯片。

如果說,這些芯片還更多集中在端側場景,不能直接對標英偉達提供的高端AI算力,尤其是AI訓練算力,那么到了2018年,情況就正式發(fā)生了改變。

2018年10月,華為正式發(fā)布了全棧全場景AI解決方案。構成全站全場景AI主體的,是兩款華為自研的AI芯片,也就是當年發(fā)布了用于推理的昇騰310,以及預告中的昇騰910,伴隨著昇騰這個名字的出現,華為在AI基礎設施領域的一系列布局開始浮現出來。

彼時,中美之間的貿易摩擦還沒有開始。中國科技界不會料想到科技封鎖的大棒即將迎面而來,更不會料想到AI算力這個還非常新穎、前沿的概念,居然會在幾年后成為美國反復操縱,極力打擊的中國科技“命門”所在。

如果沒有華為對AI機遇的預判,昇騰在AI算力上的搶跑,或許后面的故事,就會是另一個走向。

2019年到2022年,中國AI算力發(fā)展進入第二階段。簡要概述這個階段的發(fā)展目標,就是把AI芯片變成了AI算力。

提及AI計算,很多朋友會有種疑惑,一方面國產AI芯片似乎非常多,時不時就能看到相關報道,但另一方面卻又都說AI算力卡脖子。其中的問題,就在于芯片和算力是有區(qū)別的。

芯片需要能夠量產,能夠變成板卡、服務器、小站等計算產品,還需要具備全套的軟件生態(tài)來幫助用戶進行調用、開發(fā),需要與各個應用場景進行適配,證明可用性。在這一系列問題都得到解決之后,還需要形成足夠大的市場規(guī)模。

要頂著性能沒有英偉達好,成本、生態(tài)、商業(yè)信任全都沒有優(yōu)勢的逆境走向市場,國產AI算力這條路非常艱難。這也是為什么絕大多數國產AI芯片都只能停留在研制成功的新聞通稿里。

萬幸的是,在中美貿易摩擦的背景下,這一階段重要科技領域的自主可控成為各界共識,而AI算力在其中首當其沖。所以,國產AI算力沒有像此前的算力國產化議題那樣,反復被質疑是否有必要自研,全球化采購是否成本更優(yōu)。因為理智的科技從業(yè)者都知道,AI算力被當作美國的棋子只不過是早晚的問題。

在政策形勢、市場需求,以及頭部科技企業(yè)的帶動下,國產AI芯片的算力轉化雖然沒有百花齊放,但也順利完成了階段性的目標升級。

2019年8月,可用于AI訓練,能直接對標英偉達高端產品的昇騰910芯片正式發(fā)布。其整數精度(INT8)算力可以達到640TOPS,整體性能接近了英偉達的A100。這標志著,中國AI算力的“拳頭產品”來到了全球一線水平。

隨后,昇騰生態(tài)的建設全面加速。深圳鵬城實驗室基于昇騰910搭建了“鵬城云腦Ⅱ”,實現了中國首個自主可控的E級智能算力平臺,可以提供不低于1000Pops的整機AI計算能力和64PB的高速并行可擴展存儲。在武漢等25個城市,搭建了基于?昇騰AI集群的人工智能計算中心,借助“東數西算”熱潮,開啟了云端AI算力這一新型基礎設施的建設。

其他科技公司,同樣也在這一階段推動著AI芯片走向AI算力。百度在2020年量產了?昆侖芯1代AI芯片,?隨后在百度搜索引擎、?小度等業(yè)務中進行了部署。隨后,基于百度自身業(yè)務與百度智能云龐大的AI算力需求,昆侖芯片達成了一定的量產規(guī)模。

先后布局AI芯片的,有華為這樣的全產業(yè)鏈科技公司,也有阿里、百度等基于云計算業(yè)務拓展的AI芯片布局,同時還有寒武紀、海光信息、燧原科技、天數智芯、壁仞科技、摩爾線程、龍芯中科等半導體企業(yè)。中國AI算力的產業(yè)縱深,在一定程度上被拉開,IT市場的國產化AI算力選擇也開始多樣了起來。

時間來到2022年,一個關鍵性指標開始浮出。根據IDC發(fā)布數據,2022年中國AI加速卡出貨量約為109萬張,其中英偉達市場份額約為85%,昇騰市場占有率10%,百度昆侖為2%,寒武紀和燧原科技均為1%。

這意味著,中國AI計算市場上的國產化占比已經超過了10%。雖然這個規(guī)模看上去依舊不夠大,但它意味著國產AI算力已經獲得了穩(wěn)定的市場基數,成為除了英偉達之外,中國AI計算具有可行性的第二選擇。

這是用極限速度跑出來的10%,也成為中國AI產業(yè)的壓艙石。

記得2018年,我與一些AI開發(fā)者、AI公司的創(chuàng)始人聊過GPU供應問題。在問到他們是否認為英偉達GPU會走向斷供的問題時,大家普遍覺得不用擔心,一方面是因為中國市場足夠大,且增長足夠快,英偉達不可能放棄,另一方面中美之間的AI技術差距還很明顯,美國政府沒有必要在這個領域出手干預。

然而事實證明,達摩克里斯之劍終會落下,我們永遠不能樂觀地認為科技鐵幕上能打開一扇小窗。

2022年國產AI算力能夠走向規(guī)?;逃玫牧硪恢赝苿恿?,是因為英偉達高端GPU的禁售風波開始了。在此之前,英偉達雄踞了中國AI芯片市場超過90%的份額。但在2022年10月,美國商務部以擔心軍用轉化為借口,對出口中國的AI芯片啟動管制。其中,英偉達的H100和A100等高端GPU成為主要管制對象。

對于這個荒謬的新規(guī),英偉達也并非沒有尋找出路。作為禁令的對策,英偉達馬上開發(fā)了兩款專為中國市場設計的“平替”,也就是A800和H800。這兩款GPU性能都低于美國制裁措施規(guī)定的閾值,但在性能降低的同時,價格卻進行了上漲。

然而即使這樣的替代方案,也在一年后被宣告“此路不通”。美國商務部在2023年10月宣布禁止英偉達向中國供應A800和H800,而且新的禁售令不僅影響英偉達,還將AMD和英特爾的芯片覆蓋在內,并且影響了大量芯片設備廠商。這種做法,可謂是堵上了中國獲取中高端AI算力供應的全部大門,甚至計劃對使用亞馬遜云、微軟云等美國云計算平臺來獲取云端AI算力的中國企業(yè)進行限制。鐵閘落下,空余無奈。

當然,英偉達也并沒停下試試看的腳步。英偉達又一次設計了三款面向中國的“特供版”。其中,能夠用于AI訓練的H20在理論上只有H100的20%綜合性能,縮水之嚴重令人驚嘆。

至此我們或許可以說,依靠進口的中國AI算力之路已經被堵得水泄不通,接下來,只能路自己修,步自己走。

幸運的是,修出來的路還不止一條。在今天,國產AI算力已經可以通過多種方式供應市場。它們支撐著百模大戰(zhàn)的繁榮,實現了英偉達禁令甚至沒有激起太大的水花。當然,這些方式互有交疊,用戶可以有多樣化的搭配與選擇。但整體而言,今天中國AI算力的來源有三條途徑:

第一種,全國算力網絡與云端AI算力。

在科技自立自強的大背景下,幾年來中國極大程度上加強了AI算力設施的基礎建設。作為“東數西算”的核心組成部分,中國興建了大量智算中心,預計在2025年將提供超過105EFLOPS的AI算力,組成了一張龐大的AI算力網絡。

而作為與國家AI算力基礎設施結合相對緊密的運營商,也正在加緊提升對算力網絡的利用與挖掘。在目前階段,運營商紛紛加碼云計算與AI大模型,逐漸形成了云端AI算力在技術上的成熟與長期成本上的優(yōu)勢。

與此同時,各大云計算廠商也加強了AI算力的投入。一方面趕在禁令之前,大量囤積英偉達高端顯卡,另一方面也在探索自研AI芯片的使用,以及對其他國產AI算力的引入。

綜合來看,全國一體化的AI算力網絡,正在成為中國智能化的主要算力基石。

第二種,昇騰生態(tài)。

經過多年的發(fā)展,華為已經將昇騰建設為國內最為成熟,且完全沒有英偉達GPU參與的AI計算生態(tài)??拼笥嶏w創(chuàng)始人劉慶峰曾經表示,華為的昇騰AI芯片可以達到與英偉達A100相當的性能。

相對來說,昇騰的優(yōu)勢在于軟硬件體系較為齊備,可以廣泛使用華為自研的技術進行支持;可以和同樣由華為打造的鯤鵬生態(tài)結合,實現多元計算;整體產業(yè)生態(tài)較為繁榮,硬件、軟件合作商豐富。弱勢之處則在于,外界對昇騰芯片還是有性能不足與價格過高的質疑,并且昇騰生態(tài)相對封閉,與其他廠商的AI算力生態(tài)基本不打通。

今天,中國已經有一半的大模型由昇騰來支撐,并且華為云已經將昇騰算力帶到了云端,推出了昇騰AI云服務??梢哉f,昇騰的出現和成長,讓中國有了可以對標英偉達生態(tài)的AI算力選擇。

第三種,異構智算。

昇騰之外,大多數AI芯片廠商還無法實現規(guī)模化出貨,更多是以參與混合型算力的方式,加入數據中心、企業(yè)AI集群的建設當中。目前情況下,大多數企業(yè)與數據中心還是會選擇英偉達來構建AI算力的主體,同時通過加入海光、寒武紀等國產芯片以及加速卡來構建AI算力,或者采取使用英偉達GPU進行訓練,使用國產AI算力進行推理的模式。比如說,百度在文心一言訓練中使用的是英偉達GPU,推理側則使用自主研發(fā)的昆侖芯2代。

類似策略,可以逐漸降低對英偉達的依賴度,并且發(fā)揮出多元化的AI芯片優(yōu)勢。由此,異構智算開始成為企業(yè)和數據中心新的需求。面向這種需求,IT廠商也正在捕捉機會。比如聯想推出了完全異構智算平臺,來幫助實現異構化AI算力的管理與調配;新華三推出了面向異構智算的網絡解決方案,解決異構智算帶來的丟包與負載等問題。

這三根“足”,給中國AI算力帶來了某種穩(wěn)定性。經過極限情況下的多年經營與發(fā)展,今天中國AI算力談不上充沛與廉價,至少有了可以遮風擋雨的穩(wěn)固。

至少我們可以看到,中小企業(yè)應用AI算力的綜合門檻正在降低,AI算力的選擇在增多,異構協同能力在加強,并且熟悉了昇騰與海光DCU這樣能夠直接替代英偉達GPU的存在。中國AI是否會因為算力而陷入生存僵局,已經不再是個問題。

總結一下,在AI算力層面,我們有辦法,但辦法不夠好,其實也不夠多。

然而換個角度想想,幸好我們有方法,否則麻煩就大了。

依靠精準的預判搶跑,在多重助力下超高速發(fā)展,在外部壓力下極限成型。

智算,終成國之重器。

免責聲明:此文內容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網無關。文章僅供讀者參考,并請自行核實相關內容。投訴郵箱:editor@fromgeek.com。

極客網企業(yè)會員

免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2024-07-23
中國AI長卷(一):大國重算
中國AI長卷(一):大國重算

長按掃碼 閱讀全文