123,123,123

對(duì)于人工智能(AI)而言，任何單一硬件或計(jì)算組件都無(wú)法成為適合各類工作負(fù)載的萬(wàn)能解決方案。AI貫穿從云端到邊緣側(cè)的整個(gè)現(xiàn)代計(jì)算領(lǐng)域，為了滿足不同的AI用例和需求，一個(gè)可以靈活使用CPU、GPU和NPU等不同計(jì)算引擎的異構(gòu)計(jì)算平臺(tái)必不可少。

依托于Arm CPU的性能、能效、普及性、易于編程性和靈活性，從小型的嵌入式設(shè)備到大型的數(shù)據(jù)中心，Arm CPU已經(jīng)為各種平臺(tái)上的AI加速奠定了基礎(chǔ)。

就靈活性而言，這對(duì)生態(tài)系統(tǒng)大有裨益的三個(gè)主要原因是，首先，Arm CPU可以處理廣泛的AI推理用例，其中許多用例通常用于數(shù)十億臺(tái)設(shè)備，例如當(dāng)今的智能手機(jī)、云和數(shù)據(jù)中心。不僅如此，除了推理之外，CPU還經(jīng)常用于技術(shù)棧中的數(shù)據(jù)預(yù)處理和編排等其他任務(wù)。其次，開發(fā)者能夠在更多種類的數(shù)據(jù)格式中運(yùn)行更廣泛的軟件，而無(wú)需構(gòu)建多個(gè)版本的代碼。最后，CPU的靈活性使之成為加速AI工作負(fù)載的理想工具。

提供多樣性和選擇，助力行業(yè)靈活部署AI計(jì)算

除了CPU產(chǎn)品組合外，Arm計(jì)算平臺(tái)還包括GPU和NPU等AI加速器技術(shù)，許多市場(chǎng)都在將這些技術(shù)與CPU進(jìn)行集成。

在移動(dòng)端領(lǐng)域，Arm終端計(jì)算子系統(tǒng)(CSS)包含Armv9.2 CPU集群，并與Arm Immortalis-G925 GPU集成，可為各種AI用例提供加速功能，包括圖像分割、對(duì)象檢測(cè)、自然語(yǔ)言處理和語(yǔ)音轉(zhuǎn)文本等用例。在物聯(lián)網(wǎng)(IoT)方面，Arm Ethos-U85 NPU可與需要加速AI性能的基于Arm Cortex-A的系統(tǒng)一起設(shè)計(jì)，例如工廠自動(dòng)化等場(chǎng)景。

此外，除了Arm自己的加速器技術(shù)外，合作伙伴借助Arm的CPU靈活定制具有差異化的芯片解決方案。例如，NVIDIA用于AI基礎(chǔ)設(shè)施的Grace Blackwell和Grace Hopper超級(jí)芯片均采用了Arm CPU和NVIDIA的AI加速器技術(shù)，從而顯著提升AI性能。

NVIDIA Grace Blackwell超級(jí)芯片將NVIDIA的Blackwell GPU架構(gòu)與基于Arm Neoverse的Grace CPU相結(jié)合。Arm獨(dú)特的產(chǎn)品組合使NVIDIA能夠進(jìn)行系統(tǒng)級(jí)設(shè)計(jì)優(yōu)化，與NVIDIA H100 GPU相比，其能耗降低了25倍，單個(gè)GPU性能提高了30倍。具體來(lái)說(shuō)，得益于Arm Neoverse平臺(tái)的靈活性，NVIDIA能夠?qū)崿F(xiàn)自有的高帶寬NVLink互連技術(shù)，并提升CPU、GPU和內(nèi)存之間的數(shù)據(jù)帶寬和延遲。

Arm致力于通過(guò)Arm全面設(shè)計(jì)生態(tài)項(xiàng)目，為整個(gè)生態(tài)系統(tǒng)注入AI加速的機(jī)遇。通過(guò)該生態(tài)項(xiàng)目，開發(fā)者可以更快訪問(wèn)Arm CSS技術(shù)，賦能軟硬件技術(shù)進(jìn)步，以此驅(qū)動(dòng)AI和芯片創(chuàng)新，并加快開發(fā)和部署AI優(yōu)化的芯片解決方案。

Arm架構(gòu)滿足AI所需的獨(dú)特靈活性

Arm CPU設(shè)計(jì)所具有靈活性關(guān)鍵在于Arm領(lǐng)先的架構(gòu)。它提供了一個(gè)可以與AI加速器技術(shù)緊密集成的基礎(chǔ)平臺(tái)，并支持從128位到2,048位的各種向量長(zhǎng)度，可以在許多不同的數(shù)據(jù)點(diǎn)上輕松執(zhí)行多個(gè)神經(jīng)網(wǎng)絡(luò)。

Arm架構(gòu)的靈活性為整個(gè)芯片生態(tài)系統(tǒng)提供了多樣化的定制機(jī)會(huì)，Arm一直致力于幫助合作伙伴更快地構(gòu)建自己的差異化芯片解決方案。這種獨(dú)特的靈活性也使Arm能夠不斷進(jìn)行架構(gòu)創(chuàng)新，定期推出關(guān)鍵指令和功能來(lái)加速AI計(jì)算，進(jìn)而惠及整個(gè)生態(tài)系統(tǒng)，其中包括領(lǐng)先的芯片合作伙伴，以及在Arm計(jì)算平臺(tái)上構(gòu)建應(yīng)用的2,000多萬(wàn)軟件開發(fā)者等。

這一切始于Armv7架構(gòu)，該架構(gòu)引入了高級(jí)單指令多數(shù)據(jù)(SIMD)擴(kuò)展，例如Neon技術(shù)，這是Arm首次涉足機(jī)器學(xué)習(xí)(ML)工作負(fù)載。在過(guò)去幾年中，該架構(gòu)不斷增強(qiáng)，Armv8中增加了向量點(diǎn)積和矩陣乘法特性，之后在Armv9中又引入了Arm SVE2和新的Arm SME技術(shù)，為廣泛的生成式AI工作負(fù)載和用例提高了計(jì)算性能并降低了功耗。

與AI加速器技術(shù)無(wú)縫集成

Arm是AI時(shí)代的計(jì)算平臺(tái)，推動(dòng)了持續(xù)的架構(gòu)創(chuàng)新，以滿足速度更快、互動(dòng)性更好和沉浸感更強(qiáng)的AI應(yīng)用的發(fā)展。Arm CPU作為靈活處理AI工作負(fù)載的異構(gòu)計(jì)算方法中的一部分，可以無(wú)縫增強(qiáng)和集成GPU和NPU等AI加速器技術(shù)。

Arm CPU是處理眾多AI推理工作負(fù)載的實(shí)用之選，憑借出色的靈活性，它能夠與加速器技術(shù)無(wú)縫集成，打造更強(qiáng)大、更高性能的AI功能，精準(zhǔn)滿足特定用例和計(jì)算需求。對(duì)于Arm的技術(shù)合作伙伴而言，出色的靈活性有助于實(shí)現(xiàn)豐富的定制選擇，使他們能夠?yàn)锳I工作負(fù)載構(gòu)建完整的芯片解決方案。

（免責(zé)聲明：本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請(qǐng)進(jìn)一步核實(shí)，并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏，概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí)，應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后，將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí)，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。）

打造 “CPU+” 異構(gòu)計(jì)算平臺(tái)，Arm 靈活應(yīng)對(duì)各類 AI 工作負(fù)載