(IBM最新推出的芯片內(nèi)加速型人工處理器Telum)
IBM是當(dāng)今世界為數(shù)不多的具備CPU芯片設(shè)計(jì)與制造能力的公司之一,也是企業(yè)級(jí)混合云與AI的領(lǐng)導(dǎo)廠商之一。作為IT產(chǎn)業(yè)唯一一家具有百年歷史的高科技企業(yè),IBM始終以制造下一代“商業(yè)機(jī)器”為己任。早在1960年4月,在一份給IBM管理者的備忘錄中,當(dāng)時(shí)的首席執(zhí)行官小沃森談及IBM面臨的問題是制造“會(huì)思考的機(jī)器”。如今,60多年過去了,聚集于企業(yè)市場的IBM在“會(huì)思考的商業(yè)機(jī)器”方面,創(chuàng)造了歷史性的進(jìn)步。
2021年8月23日,IBM在年度Hot Chip Conference大會(huì)上,推出了歷時(shí)大約三年研發(fā)的帶有片內(nèi)AI加速器的7納米處理器Telum,將CPU計(jì)算核與AI計(jì)算核集成到一個(gè)芯片上,可以同時(shí)處理傳統(tǒng)企業(yè)計(jì)算以及AI計(jì)算任務(wù),例如在處理金融交易的同時(shí)進(jìn)行實(shí)時(shí)防欺詐AI推理計(jì)算,讓銀行、零售商、保險(xiǎn)商等能夠?qū)崟r(shí)攔截惡意欺詐而不是在事后追回。要知道,僅美國消費(fèi)者在2020年就因欺詐而損失高達(dá)33億美元,而在2019年才為18億美元。
IBM表示,基于Telum芯片的商用硬件系統(tǒng)將在2022年上半年推出。在預(yù)熱溝通會(huì)上,IBM Z & LinuxONE產(chǎn)品管理副總裁Barry Baker介紹,阿提米斯是希臘神話中的狩獵女神,而Telum即為阿提米斯手中的長矛名稱,因此Telum的命名即希望激發(fā)對(duì)“向前移動(dòng)、速度和精準(zhǔn)”的思考。
筆者認(rèn)為,考慮到IBM z14已經(jīng)實(shí)現(xiàn)一臺(tái)z14即一個(gè)企業(yè)混合云數(shù)據(jù)中心,那么基于Telum的IBM商用硬件系統(tǒng)無疑將重塑企業(yè)混合云與AI戰(zhàn)略。
“狩獵女神”的“獵物”
Telum芯片并不是IBM憑空想像而創(chuàng)造出來的黑科技。金融業(yè)務(wù)一直是被譽(yù)為企業(yè)級(jí)市場的“皇冠”,傳統(tǒng)銀行已經(jīng)是國民經(jīng)濟(jì)的支柱之一,而現(xiàn)代數(shù)字金融又已經(jīng)融入到了眾多行業(yè)企業(yè)的業(yè)務(wù)流程,在線保險(xiǎn)、在線零售、在線醫(yī)療等等幾乎所有數(shù)字化轉(zhuǎn)型的企業(yè)和機(jī)構(gòu)都會(huì)涉及到在線交易。凡涉及到在線交易,就有金融欺詐的可能。AI人工智能在給企業(yè)帶來全新反金融欺詐技術(shù)的同時(shí),又迫切需要從事后處理轉(zhuǎn)到實(shí)時(shí)處理,才能帶來更高商業(yè)價(jià)值。
(IBM Telum用于實(shí)時(shí)AI推理計(jì)算)
把AI用于實(shí)時(shí)反金融欺詐,面臨著三大挑戰(zhàn)。首先,以深度神經(jīng)網(wǎng)絡(luò)為代表的AI算法正在向需要更大模型、更大計(jì)算量、更大功耗的方向發(fā)展,這讓AI計(jì)算很難嵌入到實(shí)時(shí)的業(yè)務(wù)交易處理中;其次,目前已有的AI算法軟件,需要將數(shù)據(jù)從CPU芯片傳輸?shù)狡獾钠渌胤?,有時(shí)甚至要通過互聯(lián)網(wǎng)或企業(yè)網(wǎng)傳輸?shù)竭h(yuǎn)處的數(shù)據(jù)中心進(jìn)行AI計(jì)算后,再返回到數(shù)據(jù)源頭,這會(huì)導(dǎo)致由于數(shù)據(jù)傳輸延時(shí)而無法及時(shí)處理可能的欺詐行為;第三,即使將數(shù)據(jù)從CPU芯片傳輸?shù)酵挥布到y(tǒng)里的獨(dú)立AI加速卡,也會(huì)導(dǎo)致安全風(fēng)險(xiǎn)。
IBM院士、IBM研究院加速器架構(gòu)和機(jī)器學(xué)習(xí)高級(jí)主管Kailash Gopalakrishnan表示,實(shí)時(shí)AI計(jì)算的挑戰(zhàn)帶來了每10年到30年才會(huì)發(fā)生一次的重大企業(yè)計(jì)算架構(gòu)變遷。上一次重大企業(yè)計(jì)算架構(gòu)變遷,以IBM Z主機(jī)和Power服務(wù)器為代表;而本次推出的Telum,其對(duì)企業(yè)計(jì)算的影響力和影響程度絕不亞于Z主機(jī)和Power服務(wù)器。
筆者認(rèn)為,隨著Telum以及基于Telum的商用硬件系統(tǒng)的推出,AI在以混合云為代表的下一代企業(yè)計(jì)算中將真正無處不在——這才是“狩獵女神”的“獵物”。
三年鍛造“狩獵女神之矛”
Telum芯片設(shè)計(jì)是IBM全棧式系統(tǒng)設(shè)計(jì)的最新成果,結(jié)合了芯片設(shè)計(jì)、硬件系統(tǒng)、系統(tǒng)驅(qū)動(dòng)和固件、操作系統(tǒng)和中間件等全棧的聯(lián)合優(yōu)化,而這一整套的全棧系統(tǒng)設(shè)計(jì)是為了滿足企業(yè)的關(guān)鍵業(yè)務(wù)計(jì)算需求。Telum作為下一代IBM微處理器芯片,可處理每秒鐘數(shù)以萬筆計(jì)的交易業(yè)務(wù),同時(shí)實(shí)時(shí)完成AI推理計(jì)算,也就是說新的芯片在一個(gè)數(shù)據(jù)流中、在毫秒級(jí)響應(yīng)時(shí)間內(nèi)同時(shí)完成傳統(tǒng)及AI兩種計(jì)算任務(wù),而不用把數(shù)據(jù)傳送到CPU以外的地方。
(IBM Telum可到32個(gè)芯片互聯(lián)的系統(tǒng))
Telum是IBM耗費(fèi)三年的最新研究成果,是IBM研究院AI硬件中心首個(gè)研究成果的商用轉(zhuǎn)化產(chǎn)品,是IBM研究院、IBM Z產(chǎn)品部門以及產(chǎn)業(yè)生態(tài)伙伴(三星是7納米制程結(jié)點(diǎn)技術(shù)7nm EUV的產(chǎn)業(yè)合作伙伴)的聯(lián)合努力成果,也是CPU和AI加速器領(lǐng)域的最新黑科技。IBM Telum采用7納米制程結(jié)點(diǎn)工藝,這是當(dāng)今服務(wù)器芯片領(lǐng)域最先進(jìn)的制造工藝,盡管IBM研究院于今年5月發(fā)布了全球首個(gè)2納米芯片制造工藝,但距離量產(chǎn)仍有相當(dāng)?shù)木嚯x。
7納米工藝的最大好處,就是可以在同樣尺寸的芯片上集成更多的晶體管,從而完成更多的計(jì)算任務(wù)。Telum芯片就包括了220億個(gè)晶體管,17層金屬層的線路總長達(dá)到19英里。這樣,Telum芯片就可以在同樣功耗甚至更低功耗下,容納更多的計(jì)算任務(wù),其中就包括了實(shí)時(shí)AI推理計(jì)算。
(IBM研究院AI硬件中心成立時(shí)的愿景)
Telum的研發(fā)工作,相當(dāng)一大部分源自IBM研究院的努力。2019年2月,IBM研究院專門成立了AI硬件中心,當(dāng)時(shí)就鑒于AI模型越來越大、計(jì)算量需求越來越大、功耗越來越高的現(xiàn)狀,試圖從半導(dǎo)體芯片設(shè)計(jì)開始徹底解決這一問題。成立之初,IBM研究院AI硬件中心的目標(biāo)就設(shè)定為將人工智能系統(tǒng)效率在未來十年提升千倍。具體說來,基于當(dāng)時(shí)技術(shù)的深度學(xué)習(xí)計(jì)算在2020年左右達(dá)到1TFlops/W,基于數(shù)字AI內(nèi)核技術(shù)深度學(xué)習(xí)計(jì)算在2022年左右達(dá)到接近10TFlops/W,而今年2月IBM研究院在ISSCC國際會(huì)議上發(fā)布的7納米4核AI加速芯片原型的能效比最高達(dá)到3.5TFlops/W、整數(shù)計(jì)算能效比最高達(dá)16.5TOPs/W,遠(yuǎn)高于業(yè)內(nèi)水平。隨后,Telum芯片的單片AI計(jì)算能力則達(dá)到6TFlops/W。
“Flops/W”代表的是每瓦功耗所產(chǎn)生的算力,顯然增加單位面積晶體管數(shù)量并不能完全達(dá)成更高能效比的目標(biāo)。為此,IBM研究院從2017年開始著手研究提升AI芯片的能效比,也就是每年提升AI硬件計(jì)算能效比2.5倍,十年后提升千倍。除了芯片的制造工藝外,為了提升AI計(jì)算能效比,IBM從簡化AI算法入手,這就是超低精度AI算法。實(shí)際上,與傳統(tǒng)CPU的高精度浮點(diǎn)計(jì)算不同的是,AI計(jì)算是整數(shù)計(jì)算和矩陣計(jì)算的結(jié)合,因此用低精度浮點(diǎn)運(yùn)算取代高精度浮點(diǎn)運(yùn)算的同時(shí)保持AI模型的高質(zhì)量結(jié)果,就成為一個(gè)算法優(yōu)化方向。在2021 ISSCC大會(huì)上展示的IBM高能效7納米4核AI芯片原型,就采用了混合8位超低精度AI算法,即8位精度浮點(diǎn)計(jì)算用于AI訓(xùn)練和4位精度浮點(diǎn)計(jì)算用于AI推理。
除了超低混合精度AI算法、更低納米制造工藝外,Telum芯片還有很多創(chuàng)新之處,包括完全重新設(shè)計(jì)的緩存和片內(nèi)互聯(lián)技術(shù),實(shí)現(xiàn)了CPU計(jì)算核心和AI計(jì)算核心的片內(nèi)高速超低時(shí)延數(shù)據(jù)共享。其中,每個(gè)Telum計(jì)算核有32MB的L2緩存,這些L2緩存互聯(lián)形成256MB共享虛擬L3緩存以及每8個(gè)Telumn芯片形成2GB的共享虛擬L4緩存,這是能夠?qū)崿F(xiàn)片內(nèi)AI實(shí)時(shí)計(jì)算的關(guān)鍵之處。
簡而言之,三年打造的“狩獵女神之矛”,是多項(xiàng)IBM黑科技的集大成之作,將撬動(dòng)企業(yè)混合云與AI平臺(tái)市場。
發(fā)展下一代企業(yè)混合云與AI平臺(tái)
Telum加速器將成為下一代高性能計(jì)算系統(tǒng)的核心。IBM Z處理器歷來有嵌入各種專項(xiàng)加速器的歷史,從而提升加密、壓縮等通用計(jì)算任務(wù)的性能。而Telum集成了多達(dá)6TFlops片內(nèi)AI算力,每個(gè)計(jì)算核都能夠動(dòng)態(tài)利用整個(gè)片內(nèi)的計(jì)算資源,以最小化AI推理計(jì)算時(shí)延?;赥elum的下一代IBM Z系統(tǒng),可支持高達(dá)200TFLops的系統(tǒng)內(nèi)AI算力。由于采用了集成的加速器架構(gòu)并直接連接到片上緩存體系,Telum適用于企業(yè)關(guān)鍵業(yè)務(wù)。
為什么說IBM Telum是下一代企業(yè)級(jí)混合云與AI平臺(tái)呢?簡單理解,目前的IBM Z和LinuxOne主機(jī)已經(jīng)能夠?qū)崿F(xiàn)一臺(tái)主機(jī)即一個(gè)企業(yè)云數(shù)據(jù)中心,而IBM收購了Red Hat軟件資產(chǎn)后進(jìn)一步將Red Hat Openshift開放混合云軟件與IBM主機(jī)結(jié)合,從而將IBM主機(jī)承載企業(yè)混合云的關(guān)鍵工作負(fù)載,也可以理解為成為企業(yè)混合云的“計(jì)算中心”。企業(yè)可以通過IBM主機(jī)管理外部的多云資源,同時(shí)用IBM主機(jī)的普遍加密技術(shù)處理企業(yè)敏感數(shù)據(jù)和應(yīng)用,并通過IBM主機(jī)完成混合云的安全保障。
除了極強(qiáng)的嵌入實(shí)時(shí)AI算力外,IBM Telum也具備極強(qiáng)的故障恢復(fù)和安全保護(hù)能力。Telum的安全執(zhí)行模式,改進(jìn)了Hyper Protected Virtual Server的性能與可用性,提升了開發(fā)人員在可信計(jì)算環(huán)境中的云原生應(yīng)用開發(fā)能力。Hyper Protected Virtual Server是 IBM Secure Service Container for IBM Cloud Private的技術(shù)演進(jìn),讓開發(fā)人員能夠使用熟悉的工具和自動(dòng)化的持續(xù)軟件交付管道,在私有、公有或混合云中進(jìn)行開發(fā),并提供整個(gè)云原生應(yīng)用開發(fā)生命周期的安全性。而IBM還為Telum重新設(shè)計(jì)了8通道內(nèi)存接口,可以允許通道或DIMM在失效的時(shí)候,以透明的方式恢復(fù)數(shù)據(jù),而不影響計(jì)算響應(yīng)時(shí)間。
高度安全可信的IBM Telum系統(tǒng),讓企業(yè)可以更好地利用實(shí)時(shí)AI推理計(jì)算能力,在高速交易結(jié)果沒有完成之前就完成諸如欺詐分析的計(jì)算,從而及時(shí)攔截惡意交易。例如,今天的一家國際銀行用IBM Z系統(tǒng)的AI計(jì)算能力對(duì)信用卡授權(quán)流程進(jìn)行處理,而不用使用遠(yuǎn)程的AI推理應(yīng)用,就能在信用卡交易授權(quán)過程中檢測到欺詐行為;未來,該銀行需要在毫秒級(jí)別的交易響應(yīng)時(shí)間內(nèi)利用復(fù)雜的深度學(xué)習(xí)AI模型,實(shí)現(xiàn)每秒10萬筆交易、也就是今天交易量的十倍以上規(guī)模,同時(shí)還要達(dá)到低于毫秒級(jí)時(shí)延的每筆交易欺詐檢測,這就是Telum的設(shè)計(jì)目的——大規(guī)模高速運(yùn)行關(guān)鍵業(yè)務(wù)交易與AI處理結(jié)合的計(jì)算。
Barry在預(yù)溝通中還介紹了Telum的其它潛在應(yīng)用場景。除了金融欺詐外,在零售領(lǐng)域由零售品牌商提供的積分獎(jiǎng)勵(lì)計(jì)劃就有可能被零售店員或消費(fèi)者利用獲利,這是零售行業(yè)的潛在欺詐行為。另一個(gè)零售行業(yè)的應(yīng)用場景是尋找銷售增長機(jī)會(huì),也就是在消費(fèi)者掃描商品并結(jié)算付費(fèi)的過程中,零售商如何針對(duì)消費(fèi)者個(gè)人的購買行為和已購商品,實(shí)時(shí)提供個(gè)性化的促銷,從而擴(kuò)大消費(fèi)者每次的“購買籃子”。
全文總結(jié):嵌入了AI加速器的IBM Telum芯片,是開創(chuàng)性的企業(yè)計(jì)算架構(gòu)。由于將實(shí)時(shí)AI推理計(jì)算集成到了CPU處理器中,企業(yè)可以達(dá)到毫秒級(jí)同時(shí)處理傳統(tǒng)業(yè)務(wù)交易和AI推理計(jì)算,這種集成了傳統(tǒng)關(guān)鍵計(jì)算任務(wù)與新型AI計(jì)算任務(wù)的微處理器架構(gòu)和毫秒級(jí)處理能力,將為混合云時(shí)代的企業(yè)帶來全新商業(yè)價(jià)值,也將開創(chuàng)每10-30年才出現(xiàn)一次的企業(yè)計(jì)算架構(gòu)革新。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )