從智慧計算的點、線、面,讀懂浪潮AI的進化軌跡

原標題:從智慧計算的點、線、面,讀懂浪潮AI的進化軌跡

抽象派畫家康定斯基曾這樣形容藝術(shù):用點線面這樣最基本的語言單位,來表達豐富的內(nèi)涵,賦予藝術(shù)以超凡的精神。

之所以想到這個略顯抽象的描述,是覺得藝術(shù)的表達與科技產(chǎn)業(yè)的構(gòu)建有著相似的邏輯與內(nèi)核:都是通過一些具象的符號來彼此交互、牽引、聯(lián)動,最終呈現(xiàn)出大到人類藝術(shù)文明,小到技術(shù)進步的完整過程。

在這個ICT技術(shù)爆炸、智能世界創(chuàng)生的時代,涌現(xiàn)出了許許多多的符號,比如5G、AI、云計算、IoT、HPC等一系列技術(shù)名詞,亦或是新基建、數(shù)智化、AI產(chǎn)業(yè)化等等趨勢性的表達。到底智能世界的“魂”是什么?也就成了大眾以及每一家企業(yè)、每一個行業(yè)在變革風(fēng)暴來臨時,渴望率先抓住的本質(zhì)。

經(jīng)過了漫長的基礎(chǔ)設(shè)施與市場教育周期,我想,該有人來回答這個問題了。

前不久,浪潮的NF5488A5在國際權(quán)威基準測試MLPerf中打破了18項紀錄,拿下了全球AI服務(wù)器最好成績。再結(jié)合浪潮在疫情大背景下以53.5%的份額持續(xù)領(lǐng)跑AI服務(wù)器市場等表現(xiàn),由它來詮釋產(chǎn)業(yè)AI化的內(nèi)涵與外延,似乎再合適不過。

欣賞一部藝術(shù)作品,需要對點線面等視覺符號的把握和理解,進而感受出美的真諦。同樣,對浪潮勾勒出智慧計算產(chǎn)業(yè)形態(tài)的點線面體的理解,也成為讀懂科技之魂、觸達未來的一把鑰匙。

點:AI服務(wù)器牽引的算力之源

“點”是聚神、點睛的精華之筆,就像一個光源,能讓整部作品都發(fā)揮出靚麗的光彩。而ICT產(chǎn)業(yè)的進化史上,同樣有一些重要的關(guān)鍵詞,將整個行業(yè)推向了全新的發(fā)展階段,比如傳統(tǒng)計算時代的集成電路,又比如智能時代的AI服務(wù)器。

當我們審視當下如火如荼的AI產(chǎn)業(yè)化熱潮,會發(fā)現(xiàn)其本質(zhì)是對龐大數(shù)據(jù)的處理、訓(xùn)練、挖掘來完成產(chǎn)業(yè)端的價值創(chuàng)生。蓬勃發(fā)展的數(shù)字經(jīng)濟,也讓提供澎湃算力的AI服務(wù)器,成為產(chǎn)學(xué)研用各界的共同呼喚。

《2019-2020中國人工智能計算力發(fā)展評估報告》顯示,全球數(shù)據(jù)保有量將從2018年的33ZB增?到2025年 的175ZB。這一趨勢必然導(dǎo)致計算資源水漲船高,實際上,算力基礎(chǔ)設(shè)施早已是各個企業(yè)部署、發(fā)展AI的首要支出。

在火熱的AI服務(wù)器市場中,浪潮的表現(xiàn)可謂一騎絕塵。2020年上半年,浪潮AI服務(wù)器銷售額達到6.88億美元,市場份額占比53.5%。從市場規(guī)模和產(chǎn)品能力來看,浪潮早已經(jīng)進入了該領(lǐng)域的領(lǐng)導(dǎo)者象限。

在疫情期間獲得這樣的增長與業(yè)績,究其原因,一方面源于浪潮本身在高性能計算領(lǐng)域的多年積累,市場根基穩(wěn)固;另一方面則是踩準了AI計算的需求劇增,順利完成了產(chǎn)品革新。

拿剛剛打破AI性能紀錄的浪潮NF5488A5來說,就在Resnet50訓(xùn)練任務(wù)中創(chuàng)下AI性能紀錄,以33.37分鐘完成百萬張圖像訓(xùn)練任務(wù)的優(yōu)秀成績,成為單服務(wù)器性能成績中的榜首。簡單來說,就是做AI訓(xùn)練、AI推理都是(該比賽中)最快的服務(wù)器。

如果僅僅是去一場比賽、參與一次“跑分”,并不足以成為那把引燃需求的科技之火。浪潮的特別之處在于:

首先,打造產(chǎn)業(yè)標準的中國名片。作為業(yè)內(nèi)首套衡量機器學(xué)習(xí)軟硬件性能的通用基準,MLPerf的聯(lián)盟成員包括谷歌、微軟、Facebook、阿里巴巴、浪潮等企業(yè),以及斯坦福、哈佛等高校。而與浪潮5488A5同場競技的還有來自英特爾、英偉達、聯(lián)想、廣達、技嘉等頭部廠商的參賽團隊。在這樣一個國際化測試中,浪潮NF5488A5的勝出在宣告中國計算實力的同時,進一步拉高了產(chǎn)業(yè)技術(shù)的實力上限,讓產(chǎn)業(yè)界和企業(yè)客戶能夠獲得給有效的參考標準,成為牽引服務(wù)器市場加速進化的中國力量。

其次,強調(diào)服務(wù)器的全面能力。MLPerf并不僅僅是單純的跑分,在實際賽程中,設(shè)置了數(shù)據(jù)中心、邊緣端等多種開放模型的多個測試,考驗的是服務(wù)器在AI計算和實際應(yīng)用場景的綜合能力。浪潮NF5488A5問鼎的AI推理基準測試18項紀錄中,就覆蓋圖像分類、自然語言理解、智能推薦、語音識別等場景,在Bert 自然語言理解推理任務(wù)中性能達26675條/秒,DLRM智能推薦每秒推理處理能力達210萬條。

綜合能力意味著,贏得比賽不是服務(wù)器廠商們在靠實驗室技術(shù)“自娛自樂”,而是可以真實進入到語音識別、金融分析、智能客服等大眾熟悉的AI應(yīng)用場景中去的,能夠切實提升AI開發(fā)與應(yīng)用效率,加速產(chǎn)業(yè)AI化的進程。

最后也最值得注意的是,作為浪潮自研的新一代AI服務(wù)器,NF5488A5身上展現(xiàn)出了由軟硬件協(xié)同帶來的卓越性能——這是此次MLPerf全球競賽中唯一可以在4U空間內(nèi)支持8塊安培架構(gòu)A100 GPU實現(xiàn)NVLink高速互聯(lián)的AI服務(wù)器。

極致性能并不來自于簡單的堆疊,浪潮的綜合技術(shù)能力被充分投擲在了AI服務(wù)器NF5488A5身上。比如在硬件層面,對CPU、GPU硬件性能進行精細校準和全面優(yōu)化,以在AI推理時保持最優(yōu)狀態(tài);軟件層面,結(jié)合GPU硬件拓撲對多GPU的輪詢調(diào)度優(yōu)化,使單卡至多卡性能達到了近似線性擴展;算法層面,浪潮通過自研通道壓縮算法成功實現(xiàn)了模型的極致性能優(yōu)化,在精度無損的情況下性能提升近2倍。在可靠性上,通過深度優(yōu)化系統(tǒng)結(jié)構(gòu)設(shè)計,浪潮確保了設(shè)備能夠在高溫環(huán)境下穩(wěn)定運行。

對計算需求的充分理解與支持,AI服務(wù)器產(chǎn)品的全面技術(shù)釋放,從這個角度,我們就可以理解,浪潮為什么能俘獲如此多企業(yè)客戶的青睞,成為服務(wù)器市場上最強勁的上升力量了。

線:AI融入社會化大生產(chǎn)的橋梁

沿著服務(wù)器市場的變化軌跡,不難發(fā)現(xiàn),AI正是進化的初衷和終點。

無論市場還是學(xué)術(shù)界都認為,AI與高性能計算是一對絕配CP。2019年中國HPC TOP100行業(yè)應(yīng)用領(lǐng)域機器系統(tǒng)份額圖中,榜單前十名的產(chǎn)品都具備了AI計算的能力。清華大學(xué)計算機系鄭緯民教授也曾做出判斷,認為“人工智能應(yīng)用有望成為超算的主流應(yīng)用”。

原因也很簡單,深度神經(jīng)網(wǎng)絡(luò)規(guī)模越來越大,許多高精度模型的性能都依賴于超大規(guī)模數(shù)據(jù)集的訓(xùn)練。而人工智能的需求猛增,開啟千億規(guī)模的市場空間,也為服務(wù)器市場帶來了全新機遇。

但二者并不是簡單地拼湊在一起就能成功,還需要解決許多技術(shù)問題。

比如AI計算要用到分布式架構(gòu),需要在硬件底層將很多加速器芯片協(xié)同在一起工作,為傳統(tǒng)數(shù)值計算設(shè)計的服務(wù)器并不適合AI;用經(jīng)典計算服務(wù)器來運行AI算法,無法滿足低功耗和性價比需求,不利于產(chǎn)業(yè)化等等。

讓高性能計算與AI加速融合,成為服務(wù)器廠商在技術(shù)浪潮中拉開身位的關(guān)鍵賽點。

對于這一挑戰(zhàn),浪潮選擇將其劃分為三個賽程:

賽程一,全棧AI技術(shù)積累,厚積薄發(fā)拉開競爭身位。

早在2017年浪潮就發(fā)布“智慧計算”戰(zhàn)略,聚焦打造全球領(lǐng)先的AI算力。經(jīng)過數(shù)年耕耘,構(gòu)建起了包括AI框架優(yōu)化、AI開發(fā)管理和應(yīng)用優(yōu)化等全棧AI能力,AI專利貢獻達到了中國前三。從硬到軟的全棧解決方案能力,讓浪潮能夠駕馭來自產(chǎn)業(yè)端的多種AI計算需求。

賽程二, 系統(tǒng)級優(yōu)化,實現(xiàn)1+1>2的性能提升。

AI計算需要系統(tǒng)化的能力來支撐,包括領(lǐng)先的硬件、強大的軟件、高精度的算法等等,通過對其進行整體優(yōu)化,進而能夠?qū)崿F(xiàn)一致、快速地部署,讓浪潮在競爭中形成了區(qū)隔。

賽程三,高性價比方案,推動AI泛在化。

從生產(chǎn)、聚合、調(diào)度、釋放算力這四大關(guān)鍵作業(yè)環(huán)節(jié),浪潮都進行了創(chuàng)新,來支撐AI在邊緣端、移動端、IoT端、車端等各個計算設(shè)備上的運行。比如在調(diào)度層面,通過從模型開發(fā)、訓(xùn)練、部署、測試、發(fā)布的全流程一站式高效交付,實現(xiàn)了300%的開發(fā)效率提升;在自動機器學(xué)習(xí)領(lǐng)域,浪潮AutoML Suite可實現(xiàn)企業(yè)級一站式模型自動構(gòu)建,模型大小與計算量極致壓縮。這些努力都有效降低了AI在產(chǎn)業(yè)落地的成本門檻。

從2017年押注AI,到如今成為AI計算與千行百業(yè)之間那道硬核的產(chǎn)業(yè)橋梁,浪潮迎來了瓜熟蒂落的收獲季,也印證了那句話:凡事預(yù)則立不預(yù)則廢。

面:智算中心的價值空間

當我們漫步AI產(chǎn)業(yè)之林,感受從無人駕駛、智能客服、智慧城市等等各個應(yīng)用場景中所伸展出的一根根引線,就會發(fā)現(xiàn),這一次轉(zhuǎn)型升級浪潮之所以具有澎湃的生命力,是因為借助數(shù)字化基礎(chǔ)設(shè)施,各行各業(yè)能夠獲得智能化動能,進而提升社會整體生產(chǎn)效率。

因此,能否提供適配垂直產(chǎn)業(yè)發(fā)展需求的算力基礎(chǔ)設(shè)施,就顯得尤為重要,自然也就不難讀懂浪潮通過智算中心,從點到面推進AI產(chǎn)業(yè)化的核心邏輯。

在浪潮看來,企業(yè)渴望通過轉(zhuǎn)型得到的智慧化能力,才是其擁抱AI的終極目標。因此,服務(wù)產(chǎn)業(yè)不能是單純的業(yè)務(wù)數(shù)字化,除了增加額外的收集、存儲、處理成本之外,并不能達到企業(yè)借助智能化提升效率、業(yè)務(wù)創(chuàng)新的本質(zhì)訴求。

今年4月的浪潮云數(shù)據(jù)中心合作伙伴大會上,浪潮率先提出了“云、數(shù)、智”三者的融合發(fā)展,認為企業(yè)的IT基礎(chǔ)架構(gòu)正在從傳統(tǒng)數(shù)據(jù)中心向智算中心轉(zhuǎn)型,要實現(xiàn)業(yè)務(wù)“賦智”。

總結(jié)來說就是,超算中心主要服務(wù)于國家基礎(chǔ)科研創(chuàng)新,而智算中心則致力于支撐產(chǎn)業(yè)界的智能創(chuàng)新,以算力驅(qū)動AI模型來對數(shù)據(jù)進行深加工,為企業(yè)和個人提供智能服務(wù),進而推動產(chǎn)業(yè)升級和GDP高質(zhì)量增長。

智算中心聽起來很美,浪潮具體是怎么做的?想要回答這個問題,要找到源頭,看看產(chǎn)業(yè)究竟遭遇了哪些問題。

1.算力需求定制化。各個行業(yè)的業(yè)務(wù)模式、生產(chǎn)體系、數(shù)字化需求都各不相同,不光需要硬件和技術(shù),還需要針對性的場景化定制解決方案。為此,浪潮選擇將智算中心打造成開放平臺,吸引合作伙伴與行業(yè)解決方案提供商來共同耕耘,打造垂直行業(yè)大腦,完成了通用算力到行業(yè)個性化需求之間的銜接。

2.產(chǎn)品性能領(lǐng)先性。在“一力降十會”的AI計算領(lǐng)域,技術(shù)和產(chǎn)品性能的領(lǐng)先性,是市場首先看重的。目前,浪潮已經(jīng)形成了完整齊備的融合架構(gòu)產(chǎn)品線,為智算中心打造全球領(lǐng)先的算力機組,包括全球性能最強的 AGX-5,全球最高密度 AGX-2等。針對高并發(fā)訓(xùn)練推理集群進行了架構(gòu)優(yōu)化,推出N20X 智能網(wǎng)絡(luò)加速方案,打造了業(yè)界功能最全的 AI 管理平臺AIStation,以及可自動建模、自動調(diào)參的自動機器學(xué)習(xí)平臺AutoML Suite。這些動作讓浪潮足以支撐起國民級的計算業(yè)務(wù)。

比如在國有六大銀行的服務(wù)器中,浪潮的占有率超過50%,每日服務(wù)數(shù)億筆金融交易。還幫助中國乃至全球最大、最復(fù)雜的在線客票系統(tǒng),將售票能力從每天1500萬張?zhí)嵘?000萬張……類似案例還有很多,如果有人需要尋找一個具備頂尖產(chǎn)品性能的計算廠商,浪潮毫無疑問會是第一選擇。

3.普惠AI可持續(xù)。對于浪潮而言,要實現(xiàn)普惠AI的目標,除了短期內(nèi)“授人以魚”,更需要借助智算中心的標準化開放和規(guī)模化集約效應(yīng),實現(xiàn)長期可持續(xù)的低成本智能服務(wù),讓AI像水電、像云計算一樣成為新的社會基本公共服務(wù),更快的普及到每個人、每個企業(yè)。

可以看到,在浪潮智算中心戰(zhàn)略背后,正蘊藏著一場企業(yè)IT基礎(chǔ)設(shè)施的春雷涌動。

體:面向未來的生態(tài)循環(huán)系統(tǒng)

由點到面的價值釋放,足夠托舉起一個企業(yè)在數(shù)年間屹立于“浪潮之巔”。如果我們將眼光放到更遠的未來,會忍不住思考一個問題,整個產(chǎn)業(yè)長期繁榮發(fā)展的動能從哪里來?

這并不是在無病呻吟。盡管AI已經(jīng)進入了產(chǎn)業(yè)化高速發(fā)展階段,但依然存在許多瓶頸:

比如標準的不統(tǒng)一。目前網(wǎng)絡(luò)上開放的AI平臺和各種能力百花齊放,AI的開發(fā)優(yōu)化和部署仍然是一項技術(shù)復(fù)雜度很高的工作,需要一套通用、易用的AI開發(fā)和部署環(huán)境,降低這項工作的技術(shù)門檻。

再比如概念的泛濫。“追趕風(fēng)口”的人多了,市面上各種各樣的軟硬件、解決方案、X算中心等等說法五花八門,由于缺乏共識和秩序,很可能會擾亂大眾認知、透支信任,進而損害整個行業(yè)的形象。引領(lǐng)行業(yè)走向規(guī)范化,需要領(lǐng)頭羊做出更多的努力。

為了搭建一個綜合技術(shù)、產(chǎn)業(yè)、平臺的生態(tài)循環(huán)系統(tǒng),讓數(shù)智化熱潮的動能長久不息,浪潮也堅定地在生態(tài)方面做了許多投入。

對外,2019年,浪潮提出了元腦生態(tài)計劃,集合了具備AI功能開發(fā)核心能力的左手伙伴和具備行業(yè)AI整體方案交付能力的右手伙伴,疊加上浪潮的AI最強算力平臺,來助力產(chǎn)業(yè)AI化落地。比如與百度聯(lián)合開發(fā)的ABC一體機,在鋼表面質(zhì)量檢測系統(tǒng)中,2小時完成以前人工檢測2、3天的工作量,鋼材的缺陷識別準確率達到99%以上。為緩解人象沖突,浪潮與西雙版納國家級自然保護區(qū)管護局合作,在雨林內(nèi)實時收集亞洲象的行為數(shù)據(jù)和行進軌跡,實現(xiàn)毫秒級精準辨識,準確度高達96%。在金融、電力、交通、智慧城市、石油石化等行業(yè),浪潮的影響力逐步釋放。

對內(nèi),浪潮積極推動國際化產(chǎn)業(yè)技術(shù)標準的建立,在全球系統(tǒng)性能評測標準組織SPEC中,發(fā)起并擔(dān)任機器學(xué)習(xí)(Machine Learning)技術(shù)委員會主席。還與百度、Facebook、微軟等共同開發(fā)OAM加速計算的開放規(guī)范(OCP Accelerator Module),推動AI計算多元化融合發(fā)展與產(chǎn)業(yè)化應(yīng)用。

比起浪潮自身在AI計算領(lǐng)域的市場成功,這種用生態(tài)的繁榮之力,支撐起AI計算產(chǎn)業(yè)長久循環(huán)的做法,也讓浪潮得以收獲更為深遠的價值成長空間。

魂:寫自未來的奮斗史詩

集齊了產(chǎn)業(yè)AI中所需要的“點線面體”各個符號,我們可以獲得一個關(guān)于計算產(chǎn)業(yè)在當下的靈魂屬性,也得以確認,到底是什么推動了浪潮一路走來。

一個值得注意的細節(jié)是,2016年前后,以深度學(xué)習(xí)為代表的人工智能所展現(xiàn)出的能量在全球掀起了熱議,絕大多數(shù)同業(yè)者還在觀望之際,浪潮就做出了非常堅決的戰(zhàn)略調(diào)整,選擇了押注AI,成為當時全球第一個全力投入研發(fā)基于NVLink高速AI服務(wù)器的公司。

沒有任何市場調(diào)研數(shù)據(jù)或者前人的經(jīng)驗可以告訴浪潮,AI服務(wù)器到底會不會受歡迎。最后,浪潮全球第一個做出了在2U空間支持做8片NVLink 技術(shù)的V100 GPU的AI服務(wù)器,還好市場反應(yīng)告訴他們,自己做對了。

提前一年多的產(chǎn)業(yè)趨勢預(yù)判,靠的是幸運還是玄學(xué)?顯然都不是,早在多年前的ISC國際超算大會上,浪潮就曾發(fā)布過將深度學(xué)習(xí)與高性能計算相結(jié)合的產(chǎn)品,這一次領(lǐng)先全球的技術(shù)革新,只是春播秋收的自然規(guī)律。

戰(zhàn)略方向的大膽判斷,執(zhí)行途中的踏實穩(wěn)進,產(chǎn)業(yè)共榮的開放瀟灑,最終形成了浪潮的AI之魂。

驚艷眾人的成績單背后,是搏擊風(fēng)浪、勇立潮頭。浪潮相信了未來,于是,未來便流淌在了每一個具象的符號與動作里。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2020-11-09
從智慧計算的點、線、面,讀懂浪潮AI的進化軌跡
在這樣一個國際化測試中,浪潮NF5488A5的勝出在宣告中國計算實力的同時,進一步拉高了產(chǎn)業(yè)技術(shù)的實力上限,讓產(chǎn)業(yè)界和企業(yè)客戶能夠獲得給有效的參考標準,成為牽引服務(wù)器市場加速進化的中國力量。

長按掃碼 閱讀全文