人工智能興起 未來人工智能將無處不在|觀點(diǎn)

人工智能(AI)已經(jīng)無處不在,給眾多行業(yè)帶來了革命性的變革。

無處不在的人工智能是我們正在迅速進(jìn)入的一個(gè)時(shí)代,在這個(gè)時(shí)代,終端用戶越來越習(xí)慣于大規(guī)模的個(gè)性化,否則他們將轉(zhuǎn)向商業(yè)競(jìng)爭(zhēng)對(duì)手提供的產(chǎn)品,這些競(jìng)爭(zhēng)對(duì)手可能正在使用人工智能來創(chuàng)建定制服務(wù)和用戶體驗(yàn)。

第五代英特爾至強(qiáng)可擴(kuò)展處理器于2023年12月14日發(fā)布,這是在人工智能領(lǐng)域快速發(fā)展的時(shí)代宣布的,特別是由于商業(yè)和公眾對(duì)生成式人工智能等模型的興趣在公共終端用戶和商業(yè)社區(qū)都積累了許多用戶。

OpenAI的ChatGPT風(fēng)靡全球,在短短2個(gè)月內(nèi)就積累了1億用戶。來自Meta(Instagram)的線程獲得1億用戶的速度更快,然而,這張圖表說明了用戶采用生成式人工智能的速度有多快。

讓我們回顧一下這段歷程,下面列出了一些關(guān)鍵的人工智能類型:

生成式人工智能的興起

目前人工智能領(lǐng)域的許多令人興奮之處都是由生成式人工智能驅(qū)動(dòng)的,特別是那些與深度強(qiáng)化學(xué)習(xí)相結(jié)合的模型。這使終端用戶和企業(yè)能夠創(chuàng)建內(nèi)容,也使企業(yè)能夠開發(fā)更好的最先進(jìn)的虛擬代理,包括聊天機(jī)器人。然而,此類模型的計(jì)算成本也很高,導(dǎo)致高能耗,因此也產(chǎn)生了有意義的碳足跡。

如果我們能夠找到有效擴(kuò)展生成式人工智能的方法,那么就會(huì)帶來切實(shí)的經(jīng)濟(jì)效益。例如,將生成式人工智能應(yīng)用于客戶服務(wù)相關(guān)功能可能會(huì)導(dǎo)致生產(chǎn)力提高,范圍為現(xiàn)有功能成本的30%至45%,并且與研發(fā)相關(guān)的生產(chǎn)力可提高總成本的10%至15%。此外,同一份報(bào)告還估計(jì),生成式人工智能可能會(huì)提高營(yíng)銷職能的生產(chǎn)力,其價(jià)值占總營(yíng)銷支出的5%至15%。

生成式人工智能可以幫助企業(yè)進(jìn)行情感分析、文檔分析和摘要以及文本到圖像的創(chuàng)建。下一節(jié)將舉例說明人工智能如何改變不同經(jīng)濟(jì)部門。

醫(yī)療保?。横t(yī)學(xué)成像、遠(yuǎn)程監(jiān)控、用于分析電子健康記錄(EHR)的自然語言、新藥物發(fā)現(xiàn)和個(gè)性化藥物交付;

教育:私人導(dǎo)師提供定制的教育支持,以滿足學(xué)生的個(gè)性化需求;

營(yíng)銷:用于個(gè)性化內(nèi)容創(chuàng)建的生成式人工智能,針對(duì)那些更有可能對(duì)產(chǎn)品或服務(wù)感興趣的人定制內(nèi)容,以及個(gè)性化優(yōu)惠和推薦;

交通:自動(dòng)駕駛車輛導(dǎo)航、車輛健康檢查和監(jiān)控;

建筑:用于設(shè)計(jì)和數(shù)字孿生的生成式人工智能;

安全:入侵者檢測(cè)、預(yù)測(cè)分析、人群控制警告;

網(wǎng)絡(luò)安全:惡意軟件威脅檢測(cè)和防護(hù);

制造:預(yù)測(cè)分析,包括計(jì)劃外停機(jī)檢測(cè)、自動(dòng)缺陷零件分析;

金融服務(wù)與投資:自動(dòng)化信用分析、股票研究、ESG分類、投資組合構(gòu)建、風(fēng)險(xiǎn)管理、要素投資、保險(xiǎn)自動(dòng)理賠管理、承保風(fēng)險(xiǎn)評(píng)估和定價(jià)的金融科技解決方案;

客戶關(guān)系管理(CRM)和客戶體驗(yàn)(CX):用于客戶參與的聊天機(jī)器人

能源:用于檢查太陽能電池板和風(fēng)力渦輪機(jī)葉片缺陷的計(jì)算機(jī)視覺無人機(jī)、天氣預(yù)報(bào)、可再生能源生產(chǎn)預(yù)測(cè)、能源需求預(yù)測(cè)、電池存儲(chǔ)優(yōu)化、智能電網(wǎng);

智慧城市:城市交通規(guī)劃、智慧建筑、優(yōu)化能源消耗;

零售:個(gè)性化推薦、庫存管理、產(chǎn)品需求預(yù)測(cè)、供應(yīng)鏈優(yōu)化;

會(huì)計(jì):經(jīng)過微調(diào)的LLM可以閱讀和分析特定的文檔和電子表格,并協(xié)助開發(fā)票文檔。

法律部門:用于研究協(xié)助、案件管理、發(fā)票管理、合同起草的自然語言。

英特爾第5代thGenXeon可擴(kuò)展處理器實(shí)現(xiàn)AI的高效擴(kuò)展

大量的延遲會(huì)破壞客戶體驗(yàn)(CX),而高計(jì)算資源可能只會(huì)導(dǎo)致生成式AI模型成本過高而無法大規(guī)模采用。延遲是指客戶端設(shè)備所需的時(shí)間以及從服務(wù)器發(fā)回信號(hào)所需的時(shí)間設(shè)備,通常是數(shù)據(jù)和分析所在的基于云的遠(yuǎn)程服務(wù)器。這可能會(huì)導(dǎo)致糟糕且令人不滿意的用戶體驗(yàn),甚至可能導(dǎo)致客戶端需要響應(yīng)才能做出關(guān)鍵決策的潛在危險(xiǎn)情況。

最新一代的英特爾至強(qiáng)可擴(kuò)展處理器可以解決這個(gè)問題,并幫助企業(yè)和公眾更有效地采用由LLM支持的生成式人工智能模型。

以下是英特爾與第五代至強(qiáng)可擴(kuò)展處理器和AIEverywhere相關(guān)的示例:

英特爾矩陣擴(kuò)展(英特爾AMX)第五代可擴(kuò)展處理器使生成式AI在CPU上更容易訪問,允許用戶在需要訪問加速器之前執(zhí)行更多操作。

憑借每個(gè)內(nèi)核中的AI加速功能,第五代英特爾?至強(qiáng)?處理器已準(zhǔn)備好處理苛刻的AI工作負(fù)載,包括在需要添加離散加速器之前,對(duì)多達(dá)200億個(gè)參數(shù)的模型進(jìn)行推理和微調(diào)。

SLA(服務(wù)等級(jí)協(xié)議)可在200億個(gè)參數(shù)下的LLM上實(shí)現(xiàn)實(shí)時(shí)用戶體驗(yàn),令牌(生成動(dòng)態(tài)口令的終端)延遲低于100毫秒。

具體的性能增強(qiáng)包括:與第四代英特爾至強(qiáng)處理器相比,GPT-J的平均第一次令牌加速高達(dá)13%,平均第二次令牌加速高達(dá)22%。

相對(duì)于第三代英特爾處理器,GPT-J的平均第一令牌加速高達(dá)2.3倍,平均第二令牌加速高達(dá)64%。

第一個(gè)令牌延遲加速高達(dá)12%

與第三代Intel至強(qiáng)處理器相比,LLaMA-213B上的第一個(gè)令牌延遲加速高達(dá)2.1倍,第二個(gè)令牌延遲加速高達(dá)48%。

實(shí)時(shí)推薦

第五代英特爾至強(qiáng)可擴(kuò)展處理器提供快速,個(gè)性化的產(chǎn)品或內(nèi)容推薦,不會(huì)減慢用戶體驗(yàn),基于深度學(xué)習(xí)的推薦系統(tǒng)考慮實(shí)時(shí)用戶行為信號(hào)和上下文特征,如時(shí)間和地點(diǎn)。第五代英特爾?至強(qiáng)?可擴(kuò)展處理器采用英特爾?高級(jí)矩陣擴(kuò)展(英特爾?AMX),這是一種內(nèi)置加速器,可加速深度學(xué)習(xí)推理并加速CPU上的小型模型訓(xùn)練。性能改進(jìn)包括:

● 與第四代AMDEPYC(霄龍?zhí)幚砥鳎┫啾?,DLRM(INT8)的批量推理性能提高了2.34倍。

● 與第四代英特爾至強(qiáng)處理器相比,DLRM(模型)的批量推理性能提高了24%。

自然語言處理

更流暢的體驗(yàn)和更快的響應(yīng)

通過自然語言處理(NLP)推理的性能飛躍,實(shí)現(xiàn)響應(yīng)速度更快的智能助手、聊天機(jī)器人、預(yù)測(cè)文本、語言翻譯等。

● 與采用FP32的第三代英特爾至強(qiáng)處理器相比,BERT-Large(大規(guī)模語言模型)的實(shí)時(shí)推理性能提高了9.9倍。

● 與采用FP32的第三代英特爾至強(qiáng)處理器相比,DistilBERT(大型語言模型)的實(shí)時(shí)推理性能提高了7倍。

隨著英特爾?oneAPI深度神經(jīng)網(wǎng)絡(luò)庫(oneDNN)軟件優(yōu)化已經(jīng)集成到TensorFlow(符號(hào)數(shù)學(xué)系統(tǒng))和PyTorch(開源的Python機(jī)器學(xué)習(xí)庫)的主流發(fā)行版中,開發(fā)人員可以更輕松地訪問內(nèi)置AI加速的好處。英特爾?軟件開發(fā)工具使開發(fā)人員可以自由地在不同的硬件架構(gòu)和供應(yīng)商之間遷移代碼,具有相當(dāng)?shù)男阅埽岣吡松a(chǎn)力和未來的準(zhǔn)備能力,而不會(huì)帶來昂貴和耗時(shí)的挑戰(zhàn)。

對(duì)于更密集的AI需求,請(qǐng)?zhí)砑訉S玫挠⑻貭?Gaudi?AI加速器來擴(kuò)展基于CPU的基礎(chǔ)。

● 與第四代處理器相比,最高可達(dá)1.19倍(BF16)和1.23倍(INT8);與第三代英特爾?至強(qiáng)?處理器相比,最高可達(dá)9.9倍(BF16)和9.2倍(INT8)。

● 與第四代處理器相比,最高可達(dá)1.41倍(BF16)和1.35倍(INT8);與第三代英特爾?至強(qiáng)?處理器相比,最高可達(dá)7倍(BF16)和2.9倍(INT8)。

借助已集成到TensorFlow和PyTorch主流發(fā)行版中的英特爾?oneAPI深度神經(jīng)網(wǎng)絡(luò)庫(oneDNN)軟件優(yōu)化,開發(fā)人員可以獲得內(nèi)置AI加速的優(yōu)勢(shì)。

● 與AMDEPYC9654相比高達(dá)2.34倍,與AMDEYPC9754相比高達(dá)1.9倍。

● 與第四代處理器相比,最高可達(dá)1.24倍(BF16)和1.24倍(INT8);與第三代英特爾?至強(qiáng)?處理器相比,最高可達(dá)8.7倍(BF16)和5.5倍(INT8)。

機(jī)器學(xué)習(xí)

第五代英特爾至強(qiáng)可擴(kuò)展處理器可在CPU上實(shí)現(xiàn)高速機(jī)器學(xué)習(xí)。

經(jīng)典機(jī)器學(xué)習(xí)在高性能計(jì)算(HPC)和人工智能應(yīng)用中發(fā)揮著至關(guān)重要的作用,從生命科學(xué)到金融再到學(xué)術(shù)研究。憑借大內(nèi)存、快速內(nèi)核和英特爾?高級(jí)矢量擴(kuò)展512(英特爾?AVX-512),第五代英特爾?至強(qiáng)?可擴(kuò)展處理器可提供出色的機(jī)器學(xué)習(xí)訓(xùn)練和推理性能。

借助英特爾?AI軟件產(chǎn)品組合,開發(fā)人員可以加速端到端機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)管道。這些工具包括優(yōu)化的框架、模型存儲(chǔ)庫、用于Scikit-learn的英特爾?擴(kuò)展和用于機(jī)器學(xué)習(xí)的英特爾?XGBoost優(yōu)化、通過英特爾?Modin分發(fā)的加速數(shù)據(jù)分析、優(yōu)化的核心Python庫以及端到端工作負(fù)載的示例。

此外,英特爾聲稱,與NVIDIA相比,第五代至強(qiáng)可擴(kuò)展處理器為整個(gè)AI管道提供了更廣泛的范圍,用戶可以:

從數(shù)據(jù)預(yù)處理到推理,使用比NVIDIA gpu更擅長(zhǎng)于更廣泛的AI任務(wù)的Intel?Xeon?處理器導(dǎo)航整個(gè)AI任務(wù)。

只需幾分鐘即可在CPU上訓(xùn)練中小型深度學(xué)習(xí)模型。借助英特爾?高級(jí)矩陣擴(kuò)展(英特爾?AMX),用戶可以獲得內(nèi)置矩陣乘法引擎,該引擎可提供離散加速器性能,而無需增加GPU的硬件和復(fù)雜性。

值得注意的是,當(dāng)今大多數(shù)數(shù)據(jù)中心人工智能推理部署都在指示信任級(jí)別的英特爾?至強(qiáng)?處理器上運(yùn)行。

此外,英特爾還聲稱,憑借大內(nèi)存、快速內(nèi)核和英特爾?高級(jí)矢量擴(kuò)展512(英特爾?AVX-512),英特爾至強(qiáng)處理器可提供比NVIDIAGPU更好的機(jī)器學(xué)習(xí)訓(xùn)練和推理性能。

此外,預(yù)計(jì)邊緣,特別是物聯(lián)網(wǎng)將在2024年繼續(xù)增長(zhǎng)和規(guī)模化,因此支持在設(shè)備上進(jìn)行AI決策的硬件資源將成為關(guān)鍵。不過,值得注意的是,英特爾第5th代Xeon可擴(kuò)展處理器通過英特爾高級(jí)矩陣可將實(shí)時(shí)圖像分類推理提高高達(dá)24%解決方案。

總而言之,第五代英特爾至強(qiáng)可擴(kuò)展處理器為企業(yè)和終端用戶,提供了充分利用和擴(kuò)展生成式人工智能和人工智能模型的巨大潛力的潛力,相對(duì)于上一代英特爾至強(qiáng)處理器,性能顯著提高。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2023-12-25
人工智能興起 未來人工智能將無處不在|觀點(diǎn)
預(yù)計(jì)邊緣,特別是物聯(lián)網(wǎng)將在2024年繼續(xù)增長(zhǎng)和規(guī)?;?,因此支持在設(shè)備上進(jìn)行AI決策的硬件資源將成為關(guān)鍵。不過,值得注意的是,英特爾第5th代Xeon可擴(kuò)展處理器通過英特爾高級(jí)矩陣可將實(shí)時(shí)圖像分類推理提高高達(dá)24%解決方案。

長(zhǎng)按掃碼 閱讀全文