得一微發(fā)布AI-MemoryX顯存擴展技術(shù),助力DeepSeek訓推一體機

近日,得一微電子(YEESTOR)發(fā)布集成AI-MemoryX技術(shù)的顯存擴展解決方案。該方案依托自研存儲控制芯片和AI存儲系統(tǒng)級創(chuàng)新,顯著提升單機的顯存容量,讓32B、70B、110B、671B等DeepSeek系列大模型實現(xiàn)單機微調(diào)訓練,為AI大模型的微調(diào)訓練提供功能強大且經(jīng)濟實惠的解決方案。

得一微發(fā)布AI-MemoryX顯存擴展技術(shù),助力DeepSeek訓推一體機

得一微電子及相關(guān)合作伙伴將提供完整的微調(diào)訓練機解決方案,助力眾多行業(yè)拓展智能應用邊界,在產(chǎn)業(yè)競爭中占據(jù)先機。

低成本實現(xiàn)顯存擴展,解鎖百倍大模型微調(diào)訓練提升

訓練和推理對GPU顯存的需求存在顯著差異。對于同一尺寸的模型,訓練所需的顯存通常是推理的20倍以上。目前市場上,訓推一體機在支持大模型微調(diào)訓練方面仍面臨顯存容量的挑戰(zhàn),通常只能支持7B、14B等大模型的微調(diào)訓練,難以支持110B、70B、32B等更大模型的微調(diào)訓練。

得一微發(fā)布的AI-MemoryX顯存擴展卡,將促進訓推一體機能夠支持超大尺寸大模型的微調(diào)訓練,幫助客戶支持高達110B(甚至671B)規(guī)模的訓練任務(wù)。同時,AI-MemoryX技術(shù)將原本需耗費數(shù)百上千萬的硬件擴充成本,降低至數(shù)萬元級別,大幅降低了超大模型訓練的門檻。這將使得更多企業(yè)甚至個人都能夠以有限的資源,高效開展大規(guī)模模型的訓練與微調(diào)。

高效解決顯存瓶頸,開啟單機微調(diào)訓練新方式

顯存不足,一直是單機微調(diào)訓練超大模型的最大障礙。當下受GPU技術(shù)以及商業(yè)模式的限制,單張GPU顯存容量極為有限,中端顯卡的顯存容量大多在48GB到64GB之間。以DeepSeek 70B模型為例,微調(diào)訓練所需的顯存高達1TB到2TB,這意味著需要動用30多張顯卡;而對于DeepSeek 671B模型,更是需要達到10TB到20TB的顯存,對應300多張顯卡。如此龐大的硬件需求,不僅成本高昂,還使得部署極為復雜,嚴重阻礙了大模型單機微調(diào)的普及。

得一微電子的AI-MemoryX技術(shù)通過其創(chuàng)新性的顯存擴展方案,使單機顯存容量從傳統(tǒng)顯卡的幾十GB提升到10TB級別,大幅降低了微調(diào)訓練對GPU數(shù)量的需求。得益于此,DeepSeek不同尺寸的大模型(如32B、70B、110B、671B等)僅需1到16張顯卡,配合顯存擴展技術(shù),即可高效完成單機訓練微調(diào)。該技術(shù)為大模型在各行業(yè)的應用推廣提供了有力支持。

得一微發(fā)布AI-MemoryX顯存擴展技術(shù),助力DeepSeek訓推一體機

得一微電子推出的 AI-MemoryX 解決方案,是一個完整的微調(diào)訓練機方案,涵蓋大模型訓練框架、顯存擴展卡軟件棧以及顯存擴展卡X200系列,為大模型微調(diào)訓練提供全方位的技術(shù)支持與賦能。

得一微AI-MemoryX技術(shù)特色,發(fā)掘微調(diào)的潛力和價值

監(jiān)督微調(diào)SFT:小樣本撬動大效能

華裔科學家、“AI教母”李飛飛團隊等研究人員,僅用1000個樣本對模型進行監(jiān)督微調(diào),并創(chuàng)新性地提出預算強制(budget forcing)技術(shù),讓s1-32B模型在多個基準測試中超越閉源模型OpenAI o1-preview,成為目前樣本效率極高的推理模型。

s1-32B模型并非從零構(gòu)建,而是基于預訓練模型(阿里通義千問 Qwen2.5-32B - Instruct)進行監(jiān)督微調(diào)。這一成果表明,當模型知識基礎(chǔ)足夠扎實時,少量高質(zhì)量示例即可通過推理鏈激活其潛在推理能力,無需依賴海量數(shù)據(jù),高效且實用。

思維鏈微調(diào)CoT:注入行業(yè)思維,提升推理深度

各行各業(yè)都有其獨特的思維方式,而精心設(shè)計的推理鏈,不僅能助力模型精準理解問題,還能顯著提升其推理的準確性和泛化能力。

DeepSeek通過蒸餾技術(shù),將R1模型的思考能力傳遞給其他模型,讓它們也具備R1級別的思考實力。企業(yè)開發(fā)者可以提供優(yōu)質(zhì)的行業(yè)問題與示范,引導模型自主深入思考,以微調(diào)為橋梁,將千行百業(yè)的人類專家的思維模式和思考過程融入大模型的推理鏈條中,使模型更契合行業(yè)特點和實際需求。

強化學習微調(diào)RFT:規(guī)則框架下的自我進化

每個行業(yè)都有每個行業(yè)需要解決的問題和方法。強化學習微調(diào),相當于賦予AI一套復雜的規(guī)則與思考框架,使其在反復實踐與推理中,逐步掌握解決問題的高效方法。這一訓練方式依托微調(diào)數(shù)據(jù)集和測試數(shù)據(jù)集兩大核心數(shù)據(jù)集。模型先通過微調(diào)數(shù)據(jù)集進行學習,再使用測試數(shù)據(jù)集驗證推理能力,找出不足并針對性調(diào)整。通過這種持續(xù)迭代的自我訓練與驗證,模型推理能力不斷攀升,最終在特定領(lǐng)域達到專業(yè)級水平,為專業(yè)應用場景提供強大支撐。

得一微電子,引領(lǐng)存算技術(shù)新潮流

得一微電子始終錨定存儲控制、存算一體、存算互聯(lián)領(lǐng)域的技術(shù)前沿,致力成為行業(yè)領(lǐng)先的芯片設(shè)計公司。公司面向企業(yè)級、車規(guī)級、工業(yè)級、消費級等全場景應用,提供量身定制的解決方案與服務(wù)。

(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )