中國工程院院士,浪潮集團(tuán)執(zhí)行總裁、首席科學(xué)家王恩東15日在浪潮數(shù)據(jù)中心合作伙伴大會上表示,智慧時代,計算需求呈指數(shù)級增長,計算技術(shù)、產(chǎn)品與產(chǎn)業(yè)面臨著多元化、巨量化和生態(tài)化的新挑戰(zhàn)。計算產(chǎn)業(yè)迎來由計算到智算、多元算力融合、算力供給基建化的新格局。
當(dāng)天,“浪潮數(shù)據(jù)中心合作伙伴大會(IPF)2021”在蘇州舉行,王恩東在出席大會時作如上表述。
智慧計算無處不在,重塑著世界的方方面面,為第一、二、三產(chǎn)業(yè)發(fā)揮重要價值——無人農(nóng)場、智能農(nóng)機、智慧農(nóng)業(yè)正在改變延續(xù)了上千年的農(nóng)業(yè)生產(chǎn)方式;智能工廠讓生產(chǎn)效率顯著提升;醫(yī)療機器人在抗擊新冠疫情中大顯身手,無接觸送貨、無人機送餐也已成為智慧物流的亮點。智慧計算已經(jīng)滲透進(jìn)各個行業(yè),讓智慧時代充滿希望。
十四五,數(shù)字經(jīng)濟(jì)推動智慧算力加速普及和升級,智慧時代,計算能力需求將出現(xiàn)巨大的飛躍。王恩東說:“面對指數(shù)級增長的計算需求,計算技術(shù)、產(chǎn)品與產(chǎn)業(yè)也面臨著三大挑戰(zhàn)。計算場景愈加復(fù)雜、計算架構(gòu)更加多元;巨量模型、巨量數(shù)據(jù)、巨量算力及巨量應(yīng)用挑戰(zhàn)著現(xiàn)有計算機體系結(jié)構(gòu),以及如何用開放包容地最大化生態(tài)效能。”
王恩東表示:“以創(chuàng)新應(yīng)答挑戰(zhàn),浪潮通過創(chuàng)新智算體系結(jié)構(gòu)、構(gòu)建智算產(chǎn)品體系、推動智算中心落地、建設(shè)元腦產(chǎn)業(yè)鏈生態(tài)引領(lǐng)智算發(fā)展。智慧計算,未來可期。”
以下是演講全文:
歡迎大家來到太湖之濱,蒞臨“智算·向新”浪潮數(shù)據(jù)中心合作伙伴大會,正是由于在座各位的大力支持,浪潮在過去的一年又取得了高速的發(fā)展,繼續(xù)保持服務(wù)器全球第三,中國第一,并且成為全球人工智能計算的領(lǐng)導(dǎo)者。在此,感謝大家一年來對浪潮的支持和幫助,謝謝大家!
過去的一年,應(yīng)該說是極不平凡的一年,全球新冠病毒肆虐,徹底改變了人類的生活方式,“綠水青山枉自多,全球無奈病毒何”,全球經(jīng)濟(jì)出現(xiàn)大幅的下滑,美國發(fā)起的貿(mào)易戰(zhàn)愈演愈烈,對全球經(jīng)濟(jì)雪上加霜,中國率先控制住了疫情,率先實現(xiàn)了經(jīng)濟(jì)恢復(fù)和增長,完勝脫貧攻堅戰(zhàn),制定了激動人心的“十四五”規(guī)劃,宣告中國進(jìn)入了新的發(fā)展階段,將構(gòu)建以國內(nèi)大循環(huán)為主體、國內(nèi)國際雙循環(huán)相互促進(jìn)的新發(fā)展格局。
在過去一年,大家聽到最多的一個詞就是創(chuàng)新,創(chuàng)新在新發(fā)展理念中的核心地位深入人心,創(chuàng)新驅(qū)動發(fā)展也是“十四五”規(guī)劃的關(guān)鍵詞。總書記講,創(chuàng)新就是生產(chǎn)力,企業(yè)賴之以強、國家賴之以盛。創(chuàng)新也是浪潮的核心價值觀之一,創(chuàng)新、誠信、共贏更是浪潮堅持發(fā)展合作伙伴、建設(shè)生態(tài)體系的初心。
立足新的發(fā)展階段,我們應(yīng)當(dāng)如何貫徹新發(fā)展理念、構(gòu)建新的計算產(chǎn)業(yè)發(fā)展格局?帶著這樣的問題,今天我要報告的題目是《創(chuàng)新驅(qū)動 共建計算新格局》。
和大家分享一下,面向經(jīng)濟(jì)主戰(zhàn)場數(shù)字化轉(zhuǎn)型的重大機遇,浪潮對于計算向智算發(fā)展、多元融合新格局的洞察與思考,以及通過技術(shù)架構(gòu)和產(chǎn)品體系的創(chuàng)新、算力供給模式的創(chuàng)新和生態(tài)平臺建設(shè)等幾個方面進(jìn)行的布局和規(guī)劃。
既然是思考,我們不妨把時間的維度放大一點,在百萬年以前,我們?nèi)祟惖淖嫦茸叱錾?,走向草原,逐步形成了人類智能,?jīng)歷了漁獵采集時代、農(nóng)業(yè)時代、工業(yè)時代、信息時代,創(chuàng)造了光輝燦爛的文明和科技。
隨著以人工智能為代表的新一代信息技術(shù)的進(jìn)步,人類社會正在加速度進(jìn)入智慧時代,這是對終點的沖刺,還是新的百萬年的開始?我想這可能是值得思考的問題。為什么這么說呢?
我們來看一些關(guān)于人類大腦和未來的人工智能的大腦,或者說硅基大腦和碳基大腦發(fā)展的情況。
類腦計算是全球的研究熱點,清華的施路平教授在去年曾經(jīng)說:“碳基上能夠?qū)崿F(xiàn)的,硅基上一定能夠?qū)崿F(xiàn)”,而實際情況也顯示,碳基生物大腦同硅基系統(tǒng)的結(jié)合已經(jīng)不再是科幻小說或者科幻電影,而是逐步在形成科學(xué)和技術(shù)上的突破。比如就在最近,埃隆·馬斯克公布了一項“腦機接口”的最近實驗,科學(xué)家在獼猴的大腦皮層當(dāng)中植入了兩顆芯片,捕捉大腦活動的信號,實現(xiàn)將大腦信號翻譯成游戲的動作。如此以來猴子動動腦子便玩打乒乓球的游戲了。
腦機接口技術(shù)延展了生物大腦,在中國2020年人工智能學(xué)會推選出的自然科學(xué)類五個應(yīng)用獎當(dāng)中,有兩個就是關(guān)于類腦計算和腦機接口。所以最近一個時期,腦機接口技術(shù)獲得了比較顯著的進(jìn)展。
我們已經(jīng)肯定,人工智能技術(shù)大的爆發(fā),站在人類歷史這樣更大的時空維度上,我想這一切應(yīng)當(dāng)是剛剛開始?,F(xiàn)在,我們創(chuàng)造了無數(shù)的智慧大腦,城市大腦、交通大腦、企業(yè)大腦等等,這一些都在改變著我們世界的方方面面。
在第一產(chǎn)業(yè),無人農(nóng)場、智能農(nóng)機、智慧農(nóng)業(yè)正在改變幾千年的農(nóng)業(yè)生產(chǎn)模式。在黑龍江,浪潮與北大荒集團(tuán)合作建設(shè)智慧農(nóng)業(yè),開拓了全球最大面積的無人農(nóng)場,智能農(nóng)機覆蓋了農(nóng)業(yè)生產(chǎn)的耕、種、管、收全流程。
2020年中國農(nóng)業(yè)無人機的銷量超過了1.5萬架,一架無人機一天農(nóng)業(yè)噴散面積達(dá)到300畝是人工的20倍。無人機裝載了病蟲害的識別系統(tǒng),能夠及時發(fā)現(xiàn)受病蟲害侵蝕的葉子,實現(xiàn)農(nóng)藥的精準(zhǔn)噴散,減少了農(nóng)藥的使用量。通過噴灑催熟劑可以實現(xiàn)農(nóng)作物成熟周期的同步,實現(xiàn)規(guī)?;呐渴崭?,成本大大降低,利潤率大幅提升。
在第二產(chǎn)業(yè),2020年中國制造業(yè)增加值達(dá)到26萬億,繼續(xù)保持世界第一制造大國的地位。智能制造是數(shù)字經(jīng)濟(jì)的皇冠,正在成為各個國家搶占數(shù)字經(jīng)濟(jì)制高點的主戰(zhàn)場。作為雙循環(huán)的基礎(chǔ)發(fā)力點,智能制造將成為提升我國整體制造業(yè)水平的關(guān)鍵增長引擎。中國智能制造裝備產(chǎn)值在2020年已經(jīng)超過了2萬億。就在蘇州,浪潮建設(shè)了一座PCBA智慧工廠,整個生產(chǎn)制造過程彈性透明、可追溯,智能技術(shù)貫穿了設(shè)計、生產(chǎn)、配送和檢測的全部流程,生產(chǎn)效率提升60%以上。
智能計算更是對第三產(chǎn)業(yè)形成了深刻的改變,在突如其來的新冠疫情面前發(fā)生了巨大的作用,各種功能的醫(yī)療機器人等人工智能設(shè)備也服務(wù)在各地防疫前線,無接觸送貨、無人機送餐成為智慧物流的亮點。
浪潮也與中國工商銀行合作,形成了智慧金融解決方案,幫助更多的人實現(xiàn)了創(chuàng)業(yè)夢想。在上海奉賢生態(tài)谷基于浪潮計算平臺建設(shè)了一條無人駕駛實驗公路,在北京天壇醫(yī)院浪潮建設(shè)的智慧醫(yī)療平臺幫助醫(yī)生實現(xiàn)更快速、更精準(zhǔn)的病理分析。
同時,智慧計算也已經(jīng)成為守護(hù)大自然的好幫手,在云南,浪潮協(xié)助西雙版納國家自然保護(hù)區(qū)建設(shè)了亞洲象活動軌跡采集活動,在雨林中可以實時的收集亞洲象的行動數(shù)據(jù)和活動軌跡。
基于人工智能技術(shù),實現(xiàn)毫秒級的精準(zhǔn)識別,準(zhǔn)確率達(dá)到99%,即使在光線不足的夜晚也可以根據(jù)一個尾巴和背影識別出亞洲象,通過對野生大象長期的追蹤和觀測,為洞察大象物種的習(xí)性,種群的遷移軌跡提供了幫助。從而也能夠?qū)侠淼拈_展亞洲象國家公園的規(guī)劃,為棲息地改造,食源地優(yōu)化等保護(hù)措施提供科學(xué)的依據(jù)。
通過上面的例子可以看到,智慧計算時代的序幕已經(jīng)拉開,人工智能已經(jīng)開始滲透到經(jīng)濟(jì)社會的方方面面,深刻影響著工作和生活。在這個過程中浪潮也一直在發(fā)揮著很重要的作用。
智慧時代是充滿希望的,我們看到全球主要的經(jīng)濟(jì)體都在積極投入到人工智能的技術(shù)研究和產(chǎn)業(yè)發(fā)展當(dāng)中,像中國、美國、歐盟等等都發(fā)布了多個重要的支持政策,投入了巨量研發(fā)基金。根據(jù)IDC的數(shù)據(jù),2020年全球?qū)θ斯ぶ悄艿耐顿Y總額達(dá)到了500億美元,預(yù)計到2024年投資總額將超過1100億美元,投入值非常大,回報也將是非常豐厚的。根據(jù)普華永道的預(yù)測,到2030年人工智能技術(shù)將為全球GDP帶來14%的提升,大約16萬億美元。
進(jìn)入智慧時代,相比以往傳統(tǒng)信息化的應(yīng)用對計算能力的需求將是非常大的飛躍,傳統(tǒng)信息化應(yīng)用是以基于數(shù)據(jù)庫事物處理的業(yè)務(wù)為主,像辦公系統(tǒng)、ERP、郵件等,計算量隨著業(yè)務(wù)量的增加呈線性增長,但是智慧計算對于計算力的需求是指數(shù)級增長的,在2020年以GPU為代表的AI加速芯片所交付的計算力已經(jīng)超過了同類CPU,預(yù)計到2025年加速芯片所提供的計算力可能在整個計算力交付當(dāng)中超過80%。
所以,從計算到智算,智慧計算將成為智慧時代的核心動力。另外,智慧時代生產(chǎn)力的三要素也發(fā)生了相應(yīng)的改變,勞動者從人轉(zhuǎn)向了“人+AI”,勞動效率顯著提升,勞動工具從傳統(tǒng)的機械設(shè)備變成了智能裝備就像前面看到的智能農(nóng)機。而勞動對象從礦石農(nóng)產(chǎn)品等變成了大數(shù)據(jù),數(shù)據(jù)作為重要的生產(chǎn)要素應(yīng)當(dāng)說蘊含著巨大的價值。
面對指數(shù)級增長的計算需求,計算的技術(shù)、產(chǎn)品、產(chǎn)業(yè)也面臨著巨大的挑戰(zhàn),具體來說體現(xiàn)在以下三個方面:
第一,多元化的挑戰(zhàn)。計算場景的復(fù)雜、計算架構(gòu)的多元。
第二,巨量化的挑戰(zhàn)。由巨量模型、巨量數(shù)據(jù)、巨量算力、巨量應(yīng)用所引發(fā)對現(xiàn)有計算及體系結(jié)構(gòu)的挑戰(zhàn)。
第三,生態(tài)化的挑戰(zhàn)?,F(xiàn)在的智算正處于群雄并起的階段,自成體系,生態(tài)離散,產(chǎn)業(yè)鏈上下游脫節(jié)。
第一個挑戰(zhàn)是多元化。計算的關(guān)鍵任務(wù)是支撐業(yè)務(wù)的發(fā)展,不同的業(yè)務(wù)類型勢必要求不同的計算系統(tǒng)完成,比如針對傳統(tǒng)的地震波模擬的科學(xué)計算,對于數(shù)值精度要求很高,而AI訓(xùn)練則可以適用數(shù)值范圍大、精度相對低的16位附件類型。對于AI推理,由于推理要求的速度快、能耗少,則可以更低的數(shù)值精度下處理,像4位、2位甚至1位的整數(shù)類型。
也就是說,AI應(yīng)用引入了新的計算類型,從推理到訓(xùn)練跨度大,同時數(shù)據(jù)量也從GB到TB、PB不斷提升,數(shù)據(jù)類型從結(jié)構(gòu)化到半結(jié)構(gòu)化、非結(jié)構(gòu)化更加復(fù)雜多樣。不同數(shù)值精度的計算類型對計算芯片的指令集、架構(gòu)等要求也是不一樣的,這樣就導(dǎo)致之前一直使用的通用CPU沒有辦法滿足多元計算場景的要求,應(yīng)當(dāng)說這也是計算芯片種類越來越多的重要原因。
芯片種類多的另一個原因就是芯片代工模式的普及。現(xiàn)在芯片設(shè)計、制造等關(guān)鍵環(huán)節(jié)都有開源開放的軟件、工具,包括代工企業(yè)都可以使用。但是芯片從造出來到大規(guī)模用起來往往還隔著一個巨大的生態(tài)鴻溝,芯片應(yīng)用一般都面臨著開發(fā)者學(xué)習(xí)成本高、用戶應(yīng)用遷移難、芯片制造公司難以上規(guī)模的困難和挑戰(zhàn)。
人工智能芯片出來之后,大部分都面臨著面向開發(fā)者的幫助文檔、調(diào)試工具、交流回答問題的社區(qū)建設(shè)不足,開發(fā)者學(xué)習(xí)的時間長、難度大,如果學(xué)習(xí)多個芯片,那這種難更大時間就更不夠,所以開發(fā)者的學(xué)習(xí)積極性就會下降。
對于芯片的最終使用者來說,由于芯片的指令集或者芯片架構(gòu)的差異,導(dǎo)致編程庫、編程模型、算法框架無法有效的橫向拉通,這是大量的應(yīng)用遷移困難,可能只是百分之一億的對原來的編程環(huán)境小小的依賴就會導(dǎo)致對新芯片的適配工作前功盡棄。
芯片供應(yīng)商如果想解決開發(fā)者的問題或者是使用者的問題,往往需要投入比芯片的研發(fā)成本高數(shù)十倍的投入。我們往往認(rèn)為Intel是一個硬件公司,其實在Intel內(nèi)部有超過1萬人在圍繞芯片的配套支撐、應(yīng)用適配、優(yōu)化調(diào)優(yōu)做工作。
英偉達(dá)公司的CUDA軟件環(huán)境更是通過長期的大規(guī)模的投入才打造了支撐GPU在HPC和AI方面的霸主地位。
第二,巨量化。首先表現(xiàn)在模型參數(shù)多,訓(xùn)練數(shù)據(jù)量大。以自然語言處理為例,基于此訓(xùn)練模型興起之后,模型精度隨著模型尺寸及訓(xùn)練數(shù)據(jù)的增加顯著提升,在2020年GPT-3模型的參數(shù)量首次突破了千億大關(guān),達(dá)到了1750億。
按照當(dāng)前的發(fā)展趨勢預(yù)測,到2023年模型的參數(shù)量會突破百萬億,也就是基本達(dá)到人腦神經(jīng)突觸數(shù)量,人腦的神經(jīng)突觸數(shù)量約125萬億。
巨量模型就需要巨量內(nèi)存,當(dāng)前1顆GPU板載高速內(nèi)存容量大概是40GB,對于包含百萬億參數(shù)的巨量模型,僅是將這些參數(shù)分配到每個GPU內(nèi)存當(dāng)中就需要1萬塊GPU才能裝得下,考慮到訓(xùn)練當(dāng)中還需要額外的存儲,實際上就需要2萬塊GPU才能夠啟動百萬億參數(shù)模型的訓(xùn)練。現(xiàn)有AI芯片的架構(gòu)已經(jīng)不足以支撐巨量模型的參數(shù)存儲需求。
同時,巨量模型依賴海量數(shù)據(jù)的喂養(yǎng)。目前AI算法本質(zhì)上還是依賴量變的質(zhì)變,很難從一個質(zhì)變跳躍到另一個質(zhì)變。例如最新的巨量模型需要萬億級的詞量數(shù)據(jù)。海量數(shù)據(jù)需要海量存儲,在超大規(guī)模集群中同時滿足幾萬塊AI芯片的高性能讀取,對存儲系統(tǒng)是個極大的挑戰(zhàn)。
第二個表現(xiàn)就是計算力需求的指數(shù)級增長,深度學(xué)習(xí)從2011年興起到今天,對于算力的需求一直是指數(shù)級增長的,每隔3.4個月算力需求翻一倍。左圖中縱軸Petaflops乘以day,代表著1P每秒的算力計算一天所需用的浮點計算量,共計8.6千億次浮點運算。就像我們用千瓦時來度量用電量,在天文學(xué)里面,我們以光年為單位度量距離,在這里我們用Petaflops-day簡稱為PD來度量算力,去年巨量模型需要巨大的算力,2020年GPT-3的算力就需要3640個PD。
到2023年,巨量也就是百萬億參數(shù)的這種巨量模型的算力需要百萬PD,現(xiàn)在世界上最快的超算是日本的富岳,在這上面完成百萬PD的計算所需要的時間需要兩年,在不同的領(lǐng)域需要不同類型的巨量的模型。
GPT-3是以處理英文理解任務(wù)為主的,為了滿足不同的語言、不同的場景的精度要求也需要訓(xùn)練不同的巨量模型。如此龐大的計算力需求給計算技術(shù)和產(chǎn)業(yè)帶來了機遇和巨大的挑戰(zhàn)。解決這樣的挑戰(zhàn)需要從體系結(jié)構(gòu)、系統(tǒng)軟件各個方面開展創(chuàng)新。
巨量化第三個表現(xiàn)是模型應(yīng)用規(guī)模大,AI的應(yīng)用已經(jīng)滲透到各個行業(yè),以互聯(lián)網(wǎng)頭部企業(yè)為例,他們基于自身的已有的AI技術(shù)搭建了開放平臺,在這上面承載著各類AI的基礎(chǔ)能力(語言識別、圖像識別、自然語言處理)等等。
這些開放平臺已經(jīng)吸引了超百萬的AI開發(fā)者,開發(fā)了各種AI應(yīng)用和服務(wù),繁榮了AI的應(yīng)用生態(tài)也加速了AI相同符合產(chǎn)業(yè)的落地。目前,這些AI開放平臺每天承載著數(shù)萬億次的調(diào)用量,數(shù)百萬小時的語音識別,超過百億張圖像識別,超過萬億句自然語言理解,如此巨量的調(diào)用對算力中心的應(yīng)用支撐能力產(chǎn)生了極大的挑戰(zhàn)。
第三,生態(tài)化。AI技術(shù)鏈條和產(chǎn)業(yè)鏈條現(xiàn)在還是脫節(jié)的。很多人可能會問一個問題或者有這樣的疑問,大家都說人工智能好,但是這個東西跟現(xiàn)在的業(yè)務(wù)、跟客戶的應(yīng)用場景怎么結(jié)合起來,我想用AI技術(shù)做智能化轉(zhuǎn)型和升級,但是我發(fā)現(xiàn)我沒有人懂算法和模型,也缺少好的AI開發(fā)平臺,同時那么多的算法、模型如何找到不同的算法在應(yīng)用當(dāng)中的最優(yōu)組合。現(xiàn)在懂這些的人往往是集中在科研機構(gòu)或者頭部企業(yè),這些地方集中了最優(yōu)秀的AI人才,但缺少對傳統(tǒng)行業(yè)的需求場景、業(yè)務(wù)規(guī)律的深入理解,也拿不到最關(guān)鍵的業(yè)務(wù)數(shù)據(jù)對模型進(jìn)行訓(xùn)練,這就導(dǎo)致技術(shù)無用武之地。
埃森哲等咨詢機構(gòu)的調(diào)查報告也表明了這個問題,70%以上有技術(shù)的研究機構(gòu)和科技公司缺少需求場景、領(lǐng)域知識和數(shù)據(jù),70%以上的行業(yè)用戶則缺少技術(shù)人才、AI平臺和實踐能力。
計算技術(shù)與產(chǎn)業(yè)生態(tài)是離散化,這與我們講的多元化的挑戰(zhàn)是相呼應(yīng)的,芯片架構(gòu)五花八門,指令集不同無法兼容,而面向芯片的編程庫等等又跟芯片緊密綁定,靈活性差。小公司只做了一個環(huán)節(jié),這就造成生態(tài)的縱向不通;大公司則希望構(gòu)建封閉系統(tǒng),就造成了生態(tài)橫向不通。這些都嚴(yán)重制約了AI技術(shù)的應(yīng)用和發(fā)展。
通過上面的分析我們可以看到,一方面智算需求蓬勃發(fā)展是重大的機遇,另一方面是多元化、巨量化、生態(tài)化的挑戰(zhàn)和困難亟需解決,面向新的需求機遇,迎接新的挑戰(zhàn),應(yīng)該說計算技術(shù)和產(chǎn)業(yè)需要構(gòu)建一個新的發(fā)展格局。
我想簡單概括起來可以描述為計算逐步向智算轉(zhuǎn)型,多元算力融合和算力供給方式的基建化,面對計算新格局,作為全球領(lǐng)先的人工智能計算企業(yè),浪潮啟動了新的五年計劃,確定了新的發(fā)展目標(biāo)和策略。
我們將從技術(shù)、產(chǎn)品、方案和生態(tài)四個方面不斷創(chuàng)新,來引領(lǐng)智算的發(fā)展,具體來講的話,包括創(chuàng)新智算體系結(jié)構(gòu),構(gòu)建智算產(chǎn)品體系推動智算中心落地,建設(shè)元腦產(chǎn)業(yè)鏈生態(tài)。
首先來講,創(chuàng)新智算體系結(jié)構(gòu),我們在2014年就提出了融合架構(gòu)以及融合架構(gòu)三步走的技術(shù)路線,指明了數(shù)據(jù)中心體系結(jié)構(gòu)的發(fā)展方向,目前已經(jīng)從1.0走到了2.0,以IO方式實現(xiàn)了存儲資源和FPGA、GPU各種PU的加速設(shè)備池化,正在逐步進(jìn)入到如何架構(gòu)3.0階段,能夠提供更高效靈活智能的體系架構(gòu)。
基于融合架構(gòu),浪潮將從硬件重構(gòu)、軟件定義兩個方面引領(lǐng)智算技術(shù)的體系創(chuàng)新,支撐AI的應(yīng)用。在融合架構(gòu)2.0階段,我們已經(jīng)實現(xiàn)了CPU同各種加速單元的協(xié)同來提升計算的性能。但普遍采用的是PCIe互聯(lián)的方式,仍然存在地址空間隔離,不支持緩存一致等問題,沒有克服架構(gòu)里面固有的功耗強、內(nèi)存墻、性能、可擴(kuò)展性受限。在3.0階段,可以通過片內(nèi)大容量緩存、片外高帶寬內(nèi)存等存算一體方式實現(xiàn)計算數(shù)據(jù)結(jié)合,突破存儲墻;通過高速互連交換網(wǎng)絡(luò),支持更廣泛的多元異構(gòu)計算、支持新型存儲資源池化,提高性能、降低能耗,實現(xiàn)更大規(guī)模資源可擴(kuò)展,并進(jìn)一步通過在互聯(lián)處理單元中卸載控制平面,實現(xiàn)控制計算分離,進(jìn)而達(dá)到更為靈活的資源可重構(gòu)
在系統(tǒng)軟件創(chuàng)新方面,在可重構(gòu)的硬件資源池基礎(chǔ)上,通過軟件定義的方式實現(xiàn)控制層和基礎(chǔ)設(shè)施的分離、統(tǒng)一資源組織模型、標(biāo)準(zhǔn)化可編程結(jié)構(gòu),形成軟件定義計算、軟件定義存儲、軟件定義網(wǎng)絡(luò)。并通過微服務(wù)化實現(xiàn)集中管理平臺的高可用和可擴(kuò)展。
在這個基礎(chǔ)之上,會進(jìn)一步與AI技術(shù)結(jié)合,從業(yè)務(wù)上,實現(xiàn)基于特征感知的自適應(yīng)應(yīng)用編排和彈性資源調(diào)度,例如,面向視頻分析、語音識別、自然語言處理、語義理解等AI典型場景,可以按需定義訓(xùn)練和推理系統(tǒng)。從管理上,實現(xiàn)智能化的運營運維,也就是智算中心的無人巡檢、異常行為分析、容量預(yù)測、故障自愈等等。
舉個例子,這是我們已經(jīng)研發(fā)完成,并且在大客戶當(dāng)中有了成功實踐的案例,通過創(chuàng)新體系架構(gòu)實現(xiàn)了智算中心的彈性高擴(kuò)展。在這個案例當(dāng)中通過浪潮的智能網(wǎng)卡,在控制面實現(xiàn)了對虛機、裸機、容器統(tǒng)一管理,在數(shù)據(jù)面以硬件輔助的方式為虛擬化實力提供潔凈硬件性能的計算存儲和網(wǎng)絡(luò)功能,通過IO虛擬化卸載、CPU有效利用率可以提升80%,網(wǎng)絡(luò)存儲延遲達(dá)到了本地延遲水平。電商秒殺性能提升30%,計算性價比提升20%。
這一個是我們正在研究的項目,目標(biāo)是加速巨量模型的高性能計算能力,當(dāng)前NPU與CPU之間是通過PCIE互聯(lián)的方式,嚴(yán)重制約了NPU訪問系統(tǒng)內(nèi)存的帶寬,NPU不增加片上內(nèi)存應(yīng)對模型越來越大的挑戰(zhàn),但是巨量模型的出現(xiàn)是單純增加片上內(nèi)存這條路已經(jīng)走不下去了。
所以我們提出了新的體系結(jié)構(gòu)、參考設(shè)計,核心在于通過高速互聯(lián)來連接NPU和CPU,為NPU提供高速訪問系統(tǒng)內(nèi)存的能力。通過數(shù)據(jù)自動壓縮和解壓縮單元,進(jìn)一步加速NPU訪問內(nèi)存的效率,這樣可以通過大容量高速內(nèi)存池達(dá)到完全容納GPT-3模型,避免模型分割所導(dǎo)致的芯片利用率低、通信頻繁等問題。
在產(chǎn)品方面,浪潮會在融合架構(gòu)的技術(shù)路線指引下,將持續(xù)鞏固算力系統(tǒng),云數(shù)智軟件平臺方面的優(yōu)勢提供硬件重構(gòu)的計算整機系統(tǒng),包括智算基礎(chǔ)系統(tǒng)、智算加速系統(tǒng),也會面向海量數(shù)據(jù)和高速互聯(lián)來提供智算存儲和數(shù)據(jù)中心交換機產(chǎn)品。
此外,我們也會將技術(shù)戰(zhàn)持續(xù)的往底層延伸,面向不同的場景來開發(fā)定制化的AI加速、網(wǎng)絡(luò)加速、存儲加速產(chǎn)品,最終形成覆蓋芯片、板卡、系統(tǒng)平臺和算法的領(lǐng)先的產(chǎn)品體系,在加速芯片和板卡方面,芯片多元化應(yīng)該既是挑戰(zhàn)也是應(yīng)對當(dāng)前算力需求復(fù)雜多樣的手段。
像FPGA在特定場景下,相對CPU來講都會有10-15倍的性能提升,而GPU各種AI加速芯片面向訓(xùn)練推理等矩陣運算則有無可比擬的優(yōu)勢,傳統(tǒng)業(yè)務(wù)應(yīng)用像網(wǎng)站數(shù)據(jù)庫等還需要CPU來處理。
浪潮能夠以創(chuàng)新的設(shè)計對算力單元進(jìn)行高效的融合,也會在一些專有的領(lǐng)域開發(fā)我們自己的加速器,像智能網(wǎng)卡、視頻加速器等等,這些在下午的演講當(dāng)中會給大家介紹這些產(chǎn)品。
面向計算的新格局我們會持續(xù)創(chuàng)新,打造全球領(lǐng)先的智算硬件平臺。
在智算基礎(chǔ)系統(tǒng)方面,浪潮具備業(yè)內(nèi)最豐富的產(chǎn)品布局,擁有全球計算架構(gòu)最全,配置最多,規(guī)格最高的服務(wù)器。僅僅在去年一年,浪潮服務(wù)器刷新12項SPEC CPU測試世界紀(jì)錄,打破5項Java性能世界記錄,未來智算基礎(chǔ)系統(tǒng)將向開放、融合、多元方向發(fā)展,深度參與開放計算生態(tài),領(lǐng)導(dǎo)開放計算的發(fā)展,面向智能化、容器化等需求建立多元化的計算平臺。
在智算加速系統(tǒng)方面,浪潮為智算中心提供了最領(lǐng)先的算力機組,浪潮NF5488A5是目前全球最高性能的AI服務(wù)器。在MLPerf全球AI基準(zhǔn)測試中,這個機器單機訓(xùn)練性能測試以絕對優(yōu)勢做到全球第一,推理性能測試在打破了18項記錄,成為打破記錄最多的AI服務(wù)器。下一步我們將持續(xù)以加速器為中心的體系結(jié)構(gòu)創(chuàng)新,開發(fā)高性能、高效能的AI系列服務(wù)器,同時也會研發(fā)高效率制冷技術(shù),實現(xiàn)高性能和低PUE,打造綠色節(jié)能的AI系列產(chǎn)品。
面向海量訓(xùn)練大數(shù)據(jù),浪潮具備全球性能最好的存儲系統(tǒng)。存儲系統(tǒng)已經(jīng)三次打破SPC-1全球性能測試記錄,在未來我們將面向基礎(chǔ)設(shè)施云化、大數(shù)據(jù)、AI等應(yīng)用場景,打造超高密度和超大規(guī)模的智算存儲系統(tǒng),并且針對不同應(yīng)用的需求構(gòu)建容災(zāi)、備份、歸檔等數(shù)據(jù)全生命周期的解決方案。
在網(wǎng)絡(luò)互聯(lián)上,浪潮發(fā)布了國內(nèi)首個商用SONiC網(wǎng)絡(luò)操作系統(tǒng),搭載浪潮自主研發(fā)的核心交換機和TOR交換機,實現(xiàn)了數(shù)據(jù)中心的智能高速互聯(lián),在未來我們浪潮的網(wǎng)絡(luò)將全面實現(xiàn)網(wǎng)絡(luò)數(shù)據(jù)平面、控制平面的可編程,為數(shù)據(jù)中心帶來更加智能化基于意圖的全自驅(qū)網(wǎng)絡(luò)解決方案。
在系統(tǒng)軟件層面,基于在操作系統(tǒng)、云平臺、大數(shù)據(jù)以及AI平臺的長期積累,在業(yè)內(nèi)率先提出智算操作系統(tǒng),通過軟件定義,在南向,智算操作系統(tǒng)實現(xiàn)多元異構(gòu)計算、新型存儲和網(wǎng)絡(luò)資源的統(tǒng)一管理;在管理平臺實現(xiàn)應(yīng)用感知的智能調(diào)度和面向智算中心的統(tǒng)一運營和智能運維。在北向,支持各種各樣的智能化創(chuàng)新應(yīng)用,保障從海量數(shù)據(jù)處理、大規(guī)模分布式訓(xùn)練、自動模型生成,到實時推理應(yīng)用的快速部署上線和高效的運維。
應(yīng)該說智算操作系統(tǒng)將是智算中心的神經(jīng)系統(tǒng),讓算力的生產(chǎn)、聚合、調(diào)度和釋放渾然一體。
在去年線上的合作伙伴大會上,我們提出了智算中心的概念,智算中心應(yīng)該是智慧時代最主要的計算力的生產(chǎn)中心和供應(yīng)中心,它以融合架構(gòu)計算系統(tǒng)為平臺,以數(shù)據(jù)為資源,能夠以強大的AI模型來驅(qū)動對數(shù)據(jù)進(jìn)行深度加工,產(chǎn)生各種智慧計算的服務(wù),并且通過網(wǎng)絡(luò)以云服務(wù)形式向組織和個人進(jìn)行供應(yīng)。
智算中心正在成為推動經(jīng)濟(jì)社會運行的重要基礎(chǔ)設(shè)施也是我國新基建的重要內(nèi)容,智算中心該怎么建呢?在去年浪潮聯(lián)合國家信息中心發(fā)布了《智能計算中心規(guī)劃建設(shè)指南》,并且在指南當(dāng)中提出了智算中心的參考架構(gòu)。
下面講一個例子,江蘇一直是科技創(chuàng)新的大省,是數(shù)字經(jīng)濟(jì)發(fā)展的排頭兵,就在今年年初江蘇按照《智能計算中心規(guī)劃建設(shè)指南》,在南京投資建設(shè)了智算中心,由寒武紀(jì)和浪潮聯(lián)合承建已經(jīng)投入運營使用。
這個智算中心對外可以提供的算力達(dá)到了每秒百億億/次,采用了最先進(jìn)的AI處理芯片和AI計算平臺,應(yīng)該說代表著當(dāng)前我國智算中心建設(shè)的最高水平,該中心將為區(qū)域的公共算力服務(wù)、創(chuàng)新應(yīng)用孵化、產(chǎn)業(yè)聚集發(fā)展、科研創(chuàng)新和人才培養(yǎng)提供助力和支撐。
AI產(chǎn)業(yè)化是一個千億級的市場,產(chǎn)業(yè)AI化是一個萬億級的市場,無論AI產(chǎn)業(yè)化還是產(chǎn)業(yè)AI化,產(chǎn)業(yè)鏈的拉通和生態(tài)的建設(shè)都是必須的,在AI產(chǎn)業(yè)化的過程當(dāng)中,浪潮是新興AI企業(yè)的主要伙伴和算力提供商,這些創(chuàng)業(yè)企業(yè)或者擁有領(lǐng)先的芯片,或者積累了大量優(yōu)質(zhì)的算法框架模型和數(shù)據(jù),這些優(yōu)質(zhì)的AI技術(shù)正是產(chǎn)業(yè)AI化過程當(dāng)中行業(yè)用戶所需要的,也是為那些用戶提供服務(wù)的傳統(tǒng)軟件開發(fā)商所欠缺的。
為了幫助行業(yè)用戶更好的進(jìn)行智慧轉(zhuǎn)型,連接傳統(tǒng)的ISV和新興的AI企業(yè),浪潮提出了元腦生態(tài)計劃,在今后我們還會將元腦生態(tài)升級,與合作伙伴共建共贏、共享元腦生態(tài)平臺,幫助合作伙伴成長,助力伙伴轉(zhuǎn)型,聚合左右手合作伙伴的力量來加速行業(yè)和產(chǎn)業(yè)的智能化進(jìn)程,實現(xiàn)浪潮與伙伴和客戶共同的發(fā)展。
生態(tài)系統(tǒng)首先應(yīng)該是開放的,我們浪潮多年來一直在踐行開放計算的理念,引領(lǐng)開放計算的標(biāo)準(zhǔn),是全球唯一三大開放計算組織的發(fā)起成員或者是白金會員,牽頭制定了服務(wù)器的全部國標(biāo),是開放基礎(chǔ)設(shè)施基金會的創(chuàng)始會員,社區(qū)貢獻(xiàn)中國第一。同時也是國際SPEC組織機器學(xué)習(xí)委員會的主席。我們與伙伴的合作也是開放的,不斷地在進(jìn)行合作中的創(chuàng)新,我們聯(lián)合Intel公司開展第八代服務(wù)器CPU平臺參考設(shè)計,聯(lián)合三星公司貢獻(xiàn)了業(yè)界首先NVME策劃方案,與英偉達(dá)合作開發(fā)了首個支持NVLink低延遲單層鏈路通訊架構(gòu)。
在算法和應(yīng)用創(chuàng)新方面我們聯(lián)合第四范式公司突破了金融票據(jù)世界基礎(chǔ),聯(lián)合馬達(dá)智數(shù)打造了數(shù)據(jù)預(yù)處理、數(shù)據(jù)三位一體展示軟件,聯(lián)合聲揚科技研發(fā)了面向金融行業(yè)的識別算法。
應(yīng)當(dāng)說在過去的一年,浪潮推動的元腦生態(tài)的建設(shè)成績還是非常不錯的,已經(jīng)發(fā)展了1萬5千多的合作伙伴,包括2200多個行業(yè)ISV,超過90%的方案百強企業(yè)。在人工智能百強企業(yè)當(dāng)中有85%都與浪潮有著深度的合作,這里面不僅包括BAT等互聯(lián)網(wǎng)頭部企業(yè),也包括第四范式、寒武紀(jì)等AI的企業(yè)。
下面講一個例子,在智慧交通領(lǐng)域浪潮在積極推動智慧交通方案的邏輯,為交通行業(yè)的頭部供應(yīng)商提供了超過80%的人工智能服務(wù)器,部署了60余類交通算法與應(yīng)用,涵蓋了闖紅燈、超速等等十幾種典型的場景,浪潮也與臻識科技、優(yōu)碼創(chuàng)達(dá)一起推動了江西省智慧交通的建設(shè),為客戶提供的非現(xiàn)場視頻審核一體機在南昌、上饒、新余等16個地市落地,幫助客戶提升審片效率40多倍。
各位合作伙伴,計算向智算轉(zhuǎn)型,多元算力融合,智算中心基建化應(yīng)該是未來計算產(chǎn)業(yè)的新格局,也為我們帶來了巨大的發(fā)展的機遇。在過去的五年,在各位合作伙伴的支持和幫助下,浪潮已經(jīng)成為全球智算智慧計算的領(lǐng)導(dǎo)者,服務(wù)器全球前三,AI服務(wù)器全球第一,小型機中國第一,存儲出貨量增速全球第一。
新的五年計劃已經(jīng)開啟,在新的征程當(dāng)中浪潮將通過技術(shù)、產(chǎn)品、方案方面的持續(xù)創(chuàng)新,推動智算新格局的建設(shè)和發(fā)展,并圍繞著元腦生態(tài)和各位合作伙伴競爭合作攜手共進(jìn),于變局中開新局,加速成為全球第一。謝謝大家!
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )