千行百業(yè)深度擁抱DeepSeek,誰是DeepSeek部署“最優(yōu)解”?

2025年2月,當(dāng)DeepSeek以“小專家”架構(gòu)和強(qiáng)化學(xué)習(xí)技術(shù)引爆全球AI產(chǎn)業(yè)時,一場關(guān)于算力底座價(jià)值的重新定義正在悄然發(fā)生。

DeepSeek不僅以訓(xùn)練效率提升2-3倍、推理效率提升5倍-7倍的技術(shù)突破,引發(fā)千里之外的巴黎AI峰會熱議,更在商業(yè)落地層面創(chuàng)造了現(xiàn)象級紀(jì)錄——上線20天即吸引160余家企業(yè)接入,日均調(diào)用量突破3000萬次,還登陸Apple Store免費(fèi)應(yīng)用榜首。

以后,我們看到千行百業(yè)深度擁抱DeepSeek。根據(jù)相關(guān)數(shù)據(jù)統(tǒng)計(jì),在DeepSeek R1發(fā)布后的20天內(nèi),國內(nèi)外已有160多家企業(yè)集體接入DeepSeek,覆蓋互聯(lián)網(wǎng)、金融、運(yùn)營商、政務(wù)、教育等行業(yè)。

在這場AI普惠化浪潮中,一個關(guān)鍵問題浮出水面:當(dāng)千行百業(yè)爭相部署DeepSeek時,什么樣的算力底座,才能真正承載這場變革?

千行百業(yè)深度擁抱DeepSeek,誰是DeepSeek部署“最優(yōu)解”?

01

DeepSeek

引發(fā)的算力需求嬗變

在過去的十年時間,生成式AI經(jīng)歷了從技術(shù)突破到大規(guī)模應(yīng)用的跨越。

早在2014年,Google Brain團(tuán)隊(duì)用GAN生成的人臉雖模糊卻震撼了學(xué)界;而后2017年Transformer架構(gòu)的誕生,讓機(jī)器真正掌握了語言序列的奧秘;最為世人皆知的是,2020年GPT-3以1750億參數(shù)震驚世界,其生成的哲學(xué)散文甚至騙過專業(yè)期刊評審。

而近日DeepSeek R1的迅速走紅,其主要通過MoE架構(gòu)與工程優(yōu)化,將千億模型的預(yù)訓(xùn)練成本降低至557.6萬美元,僅是OpenAI GPT-4o模型訓(xùn)練成本的十分之一,徹底打破了以往“暴力堆料”的路徑依賴,成為大家心目中的“國產(chǎn)之光”。

大家都很關(guān)心,DeepSeek作為生成式AI的又一里程碑事件,將帶來哪些影響?

一是技術(shù)路徑轉(zhuǎn)變。以往大模型頭部玩家主張“技術(shù)摸高”,堅(jiān)定投入預(yù)訓(xùn)練基礎(chǔ)模型創(chuàng)新,追逐Scaling Law(擴(kuò)展定律,即模型性能隨著數(shù)據(jù)量和模型大小等因素增加而提升)。

例如Meta將AI投資從400億加碼至650億美元,Google的TPUv5集群規(guī)模突破萬卡,都是為了實(shí)現(xiàn)“更大模型→更強(qiáng)性能”的線性突破。

但DeepSeek以“手術(shù)刀式”的工程創(chuàng)新,開辟出第二條進(jìn)化路徑。DeepSeek在高濃度的技術(shù)專家創(chuàng)新下,通過模型結(jié)構(gòu)、計(jì)算通信、后訓(xùn)練等領(lǐng)域的極致工程優(yōu)化,使得訓(xùn)練成本降低60%,模型性能提升20%,大幅提升算力利用效率。

同時,DeepSeek徹底打破了傳統(tǒng)“預(yù)訓(xùn)練主導(dǎo)”的算力分配格局,推動產(chǎn)業(yè)進(jìn)入預(yù)訓(xùn)練、后訓(xùn)練、推理“三足鼎立”新階段,因此長期穩(wěn)定可靠的算力底座仍是模型創(chuàng)新的關(guān)鍵。

千行百業(yè)深度擁抱DeepSeek,誰是DeepSeek部署“最優(yōu)解”?

02

昇騰助力伙伴迎來爆發(fā)式增長

千行百業(yè)深度擁抱DeepSeek,掀起了DeepSeek的接入浪潮,加速牽引算力需求增長。

那金融、交通、教育、制造等各大行業(yè)企業(yè)和政府機(jī)構(gòu),應(yīng)該如何去接入DeepSeek呢?對于大模型所需要的智算基礎(chǔ)設(shè)施問題,選擇云服務(wù),還是自建還是一體機(jī)?哪種模式更好,誰家的服務(wù)更強(qiáng)?

要知道,DeepSeek的部署需求將AI硬件競爭推向深水區(qū),與傳統(tǒng)大模型不同,其“小專家”架構(gòu)帶來兩個核心挑戰(zhàn):跨節(jié)點(diǎn)通信效率與動態(tài)負(fù)載均衡。

挑戰(zhàn)一:跨節(jié)點(diǎn)通信效率

。在傳統(tǒng)大模型中,計(jì)算主要在單個節(jié)點(diǎn)內(nèi)完成,通信壓力集中于模型并行的參數(shù)同步。而DeepSeek的MoE架構(gòu)中,每個輸入token需動態(tài)路由至多個專家模塊,這些專家往往分布在不同的計(jì)算節(jié)點(diǎn)上,這就對帶寬和時延提出高要求。

挑戰(zhàn)二:動態(tài)負(fù)載均衡。

在MoE架構(gòu)中,專家模塊的調(diào)用頻次高度依賴輸入數(shù)據(jù)分布。其中,高負(fù)載專家所在節(jié)點(diǎn)成為性能瓶頸,而低利用率專家占用內(nèi)存和算力卻貢獻(xiàn)有限。

筆者梳理整個市場的情況發(fā)現(xiàn),部署DeepSeek一體機(jī)的模式,被認(rèn)為是最快速、最安全、最穩(wěn)定的模式。

而在眾多一體機(jī)服務(wù)提供商中,昇騰展現(xiàn)出令人矚目的“中國速度”。

2024年12月26日,DeepSeek AI發(fā)布的大型語言模型DeepSeek V3,發(fā)布即支持昇騰,目前各行業(yè)已有超過80家的客戶,基于昇騰快速上線DeepSeek系列模型,并對外提供服務(wù),占據(jù)國內(nèi)70%的份額。

更值得關(guān)注的是,昇騰生態(tài)伙伴迎來的爆發(fā)式成長。例如,昇騰助力超過20個省份、25座城市的AICC啟動部署DeepSeek,全國超過70%的區(qū)域可獲取本地支持。

當(dāng)巨量用戶涌入,DeepSeek忙到癱瘓時,相信有不少人和筆者一樣,通過昇騰生態(tài)的硅基流動平臺,使用DeepSeek?;跁N騰底座的DeepSeek上線僅一周時間,用戶增長率達(dá)到數(shù)倍。

同樣火熱的還有魔樂社區(qū),其聯(lián)合昇騰社區(qū)同步上線DeepSeek系列模型,下載量超過10000次,一躍成為國內(nèi)最受歡迎的模型社區(qū)。

03

昇騰為何成為

DeepSeek部署“最優(yōu)解”?

從眾多行業(yè)企業(yè)的選擇可以看出,昇騰成為DeepSeek部署的“最優(yōu)解”。昇騰脫穎而出,為什么呢?

千行百業(yè)深度擁抱DeepSeek,誰是DeepSeek部署“最優(yōu)解”?

我們認(rèn)為,一方面,昇騰與其他廠商相比,展現(xiàn)出獨(dú)特的差異化優(yōu)勢。

其一,在軟件生態(tài)方面,昇騰擁有硬件+框架+云的完整體系,工具鏈?zhǔn)滞晟?,而同領(lǐng)域國產(chǎn)廠商軟件生態(tài)較弱,國外廠商雖然生態(tài)成熟,但存在被封鎖風(fēng)險(xiǎn)。

其二,在行業(yè)解決方案方面,昇騰與華為行業(yè)軍團(tuán)緊密合作,特別是在政務(wù)、交通等領(lǐng)域。國產(chǎn)廠商行業(yè)覆蓋有限,國際廠商主要依賴代理商,本地化支持不足。

其三,在端邊云協(xié)同方面,昇騰的架構(gòu)能夠覆蓋云、邊、端,可做到無縫部署,而國產(chǎn)廠商則專注于單一場景,國際廠商邊緣端依賴海外廠商生態(tài),需額外適配。

當(dāng)行業(yè)聚焦于應(yīng)對MoE架構(gòu)的深水區(qū)挑戰(zhàn)時,昇騰展現(xiàn)出的不僅是橫向生態(tài)優(yōu)勢,其技術(shù)縱深的突破性創(chuàng)新,更成為支撐DeepSeek規(guī)模化落地的核心力量。

首先,在訓(xùn)練能力層面,昇騰是業(yè)界首個適配完成DeepSeek核心算法,支持DeepSeek全系模型從預(yù)訓(xùn)練到微調(diào)全流程均適配的AI訓(xùn)練平臺。同時,昇騰還提供“行業(yè)強(qiáng)化微調(diào)解決方案”,支撐行業(yè)快速將DeepSeek強(qiáng)化學(xué)習(xí)技術(shù)應(yīng)用到模型訓(xùn)練,提升模型效果。

其次,在推理能力層面,昇騰并行推理DeepSeek V3和R1,高效跨機(jī)互聯(lián)和MoE專家通信優(yōu)化,將通信時延降低30%。此外,昇騰通過偽EP混合并行算法和稀疏路由稠密化算法,從而降低專家不均衡度,使得推理吞吐性能提升20%~35%。

最后,在AI框架支持層面,昇思MindSpore Transformers大模型使能套件提供了端到端的全流程支持,模塊化賦能DeepSeek V3開發(fā),實(shí)現(xiàn)天級快速復(fù)現(xiàn)。而且,該套件為所有開發(fā)者提供了即取即用的模型資源,加速了模型創(chuàng)新及在行業(yè)落地應(yīng)用。

以備受追捧的昇騰一體機(jī)為例,其融合昇騰高性能算力底座與DeepSeek全系列大模型能力,具備高吞吐、低時延、多并發(fā)、靈活部署四大優(yōu)勢,覆蓋語言理解、圖像分析等全場景需求,擁有服務(wù)器、推理卡、加速模組等產(chǎn)品形態(tài),為企業(yè)提供一站式AI解決方案。

昇騰的不可替代性從何而來?

DeepSeek的成功實(shí)踐,成為昇騰生態(tài)價(jià)值的典型例證。歷經(jīng)多年發(fā)展,昇騰構(gòu)建起完善的技術(shù)和商業(yè)生態(tài),這對企業(yè)快速部署DeepSeek及產(chǎn)業(yè)落地有著天然的吸引力。

以技術(shù)生態(tài)舉例,昇騰的推理硬件覆蓋模組-加速卡-推理小站-服務(wù)器等全系列,讓算力底座發(fā)揮出更高性能,還發(fā)展了330萬開發(fā)者。

商業(yè)生態(tài)的廣度拓展同樣顯著。目前昇騰聯(lián)合60余家硬件伙伴、2500多個行業(yè)合作伙伴,孵化5800余個解決方案,還聯(lián)合伙伴開發(fā)了160多個原生算子,打造了40多個原生模型,助力浙江移動、浙江電信等企業(yè)上線400多個原生應(yīng)用,成效顯著。

這場由DeepSeek引發(fā)的產(chǎn)業(yè)變革,檢驗(yàn)的是基礎(chǔ)創(chuàng)新厚度與生態(tài)協(xié)同效率的雙重較量。

在AI基礎(chǔ)設(shè)施的競技場上,以昇騰和DeepSeek為代表的中國力量正走出一條獨(dú)特的發(fā)展路徑——不是簡單替代或盲目追隨,而是以系統(tǒng)工程思維構(gòu)建自主創(chuàng)新的生態(tài)體系。

這條路或許漫長,卻注定通向更廣闊的產(chǎn)業(yè)未來。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )