從決策式AI進(jìn)階到生成式AI,SSD將變得更為重要

AI概念沒有火熱之前,無論手機(jī)還是PC都已經(jīng)悄然引入人工智能加速相關(guān)的硬件和技術(shù),目的是在部分功能上獲得更好的體驗(yàn),比如手機(jī)相冊(cè)中的人臉智能識(shí)別和分類,PC和NAS在算力閑暇時(shí)對(duì)圖像、視頻的整理,以及視頻通話時(shí)的背景虛化等等都是很好的例子。

這個(gè)時(shí)期的AI計(jì)算我們通常稱為決策式AI,即在成熟的底層技術(shù)框架內(nèi),通過數(shù)據(jù)分類標(biāo)簽和辨別的形式,通過CPU、GPU、NPU等處理器合力,它們的特點(diǎn)是,具備一套成熟的判斷機(jī)制,通過夜以繼日的訓(xùn)練識(shí)別,不斷提升精度,并具有很強(qiáng)的針對(duì)性。

隨著大模型的火爆,另一種AI也推向了大眾視野,即被稱為生成式AI。無論是云端AI服務(wù)加速,還是近期能夠本地運(yùn)行200億參數(shù)大語言模型的AI PC,它們的思維是發(fā)散且具有創(chuàng)造性的,同時(shí)對(duì)硬件也提出了更高的要求。

生成式AI背后的海量數(shù)據(jù)

生成式AI與決策式AI最大的不同在于模型的規(guī)模,大模型計(jì)算本身意味著高算力、高存儲(chǔ)需求。正因?yàn)槿绱?,LLM大語言模型才會(huì)成為推向應(yīng)用層面的首要選擇,原因很簡單,相對(duì)于圖像、視頻而言,抽象的文字已經(jīng)是最好整理的了。

但即便如此,大語言模型本身占用的數(shù)據(jù)量仍然巨大,以GPT-3為例,光是訓(xùn)練參數(shù)就達(dá)到了1750億個(gè),訓(xùn)練數(shù)據(jù)達(dá)到45TB,每天會(huì)產(chǎn)生45億字內(nèi)容,每次訓(xùn)練費(fèi)用需要460萬美元。而進(jìn)階到GPT-4之后,訓(xùn)練參數(shù)從1750億個(gè)增加到1.8萬億個(gè),訓(xùn)練成本進(jìn)一步提升到6300萬美元,訓(xùn)練數(shù)據(jù)量信息雖然沒有公布,但可想而知增長也是指數(shù)級(jí)的。

有意思的是,大語言模型訓(xùn)練在當(dāng)下似乎已經(jīng)變成了日常,頭部廠商已經(jīng)將目光投向了圖像生成和視頻生成,近段時(shí)間火熱的文字生成視頻應(yīng)用Sora,以及文生圖Midjourney都是很好的例子。現(xiàn)在我們知道光是文字內(nèi)容就可以占據(jù)海量的存儲(chǔ)空間,如果將訓(xùn)練模型換成圖像、視頻,對(duì)內(nèi)容存儲(chǔ)和讀寫性能需求也注定指數(shù)級(jí)攀升。

SSD很重要

隨著生成式AI深入到不同領(lǐng)域,能夠提供高速存儲(chǔ)性能的SSD變得至關(guān)重要。不僅如此,對(duì)于企業(yè)和數(shù)據(jù)中心而言,存儲(chǔ)的可靠性、能效、性價(jià)比,以及對(duì)前沿技術(shù)的支持都變得至關(guān)重要。比如,企業(yè)級(jí)用戶會(huì)考慮在有限的機(jī)房空間內(nèi)獲得更多的容量,即提升單位存儲(chǔ)密度,并且還要考慮機(jī)架和機(jī)房的散熱能力和供電能力,這時(shí)候EDSFF規(guī)格似乎就成為了不錯(cuò)的選擇。

EDSFF,即企業(yè)與數(shù)據(jù)中心標(biāo)準(zhǔn)外形規(guī)格,特點(diǎn)是由頭部企業(yè)引領(lǐng)并獲得行業(yè)認(rèn)可,針對(duì)物理尺寸、散熱、性能、布局、安裝便捷性等特性優(yōu)化,從而達(dá)到更好的效果。

比如鎧俠CD8P就配備了前瞻性的EDSFF E3.S版本,支持PCIe®5.0和NVMe™ 2.0,可提供高達(dá)30.72TB的存儲(chǔ)容量,擁有可達(dá)12,000MB/s順序讀取性能,并具備2000K IOPS的4K隨機(jī)讀取能力,在能耗與應(yīng)用性能表現(xiàn)之間做到很好的平衡,為數(shù)據(jù)中心和企業(yè)級(jí)用戶提供合理的擴(kuò)容選擇。

如果希望性能更進(jìn)一步,鎧俠CM7系列作為高性能企業(yè)級(jí)雙端口固態(tài)硬盤同樣值得參考,事實(shí)上CM7系列是較早提供PCIe®5.0和NVMe™ 2.0支持,并已經(jīng)充足釋放PCIe®5.0性能的產(chǎn)品,最大容量同樣也達(dá)到了30.72TB。擁有高吞吐量和高密度存儲(chǔ)的性能表現(xiàn),非常適合大模型計(jì)算,大數(shù)據(jù),深度學(xué)習(xí)加速、AIGC等人工智能應(yīng)用場景。

而隨著生成式AI的硬件需求越來越高,同時(shí)也不能忽視龐大的數(shù)據(jù)量需要高性能接口、大容量存儲(chǔ)支持,鎧俠企業(yè)級(jí)和數(shù)據(jù)中心級(jí)固態(tài)硬盤則早已為其做好了充足的準(zhǔn)備。未來AI的發(fā)展路徑中,也注定少不了鎧俠SSD承擔(dān)起存儲(chǔ)與加速的重要角色。

*容量的定義:鎧俠定義1兆字節(jié)(MB)為1,000,000字節(jié),1千兆字節(jié)(GB)為1,000,000,000字節(jié),1兆兆字節(jié)(TB)為1,000,000,000,000字節(jié)。但是計(jì)算機(jī)操作系統(tǒng)記錄存儲(chǔ)容量時(shí)使用2的冪數(shù)進(jìn)行表示,即定義1GB = 230= 1,073,741,824字節(jié),因此會(huì)出現(xiàn)存儲(chǔ)容量變小的情況??捎么鎯?chǔ)容量(包括各種媒體文件的示例)將根據(jù)文件大小、格式、設(shè)置、軟件和操作系統(tǒng)(例如Microsoft®操作系統(tǒng)和/或預(yù)安裝的軟件應(yīng)用程序)或媒體內(nèi)容而異。實(shí)際格式化的容量可能有所不同。

*1千位字節(jié) (KiB) 指210, 或1,024字節(jié),1兆字節(jié)(MiB) 指220,或1,048,576 字節(jié),1千兆字節(jié)(GiB)指230, 或1,073,741,824字節(jié)。

*IOPS:每秒輸入輸出(或每秒I/O操作數(shù))

*讀寫速度可能因主機(jī)設(shè)備、讀寫條件和文件大小的不同而不同。

*信息隨時(shí)可能更改:雖然鎧俠在發(fā)布時(shí)已努力確保此處提供信息的準(zhǔn)確性,但產(chǎn)品規(guī)格、配置、價(jià)格、系統(tǒng)/組件/選項(xiàng)等的可用性都可能發(fā)生更改,恕不另行通知。

*產(chǎn)品圖像可以代表設(shè)計(jì)模型。圖像僅用于說明目的。產(chǎn)品外觀可能與實(shí)際產(chǎn)品不同。閃存組件的實(shí)際數(shù)量因硬盤容量而不同。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )