超ChatGPT,DeepSeek成全球增速最快AI應用!國產(chǎn)AI黑馬是如何煉成的?

2月6日消息,據(jù)國內(nèi)AI產(chǎn)品榜 aicpb.com數(shù)據(jù),DeepSeek 應用(APP) 2025/01/11 日發(fā)布,截止 1/31 日上線僅 21 天。日活躍用戶DAU 2215萬,達ChatGTP日活用戶的41.6%。

DeepSeek上線20天全球日活 DAU突破2000 萬,超過ChatGTP成為全球增速最快的AI應用。

更令人咋舌的是,截止1月31日DeepSeek霸榜蘋果應用商店157個國家/地區(qū)的第一名。

SensorTower數(shù)據(jù)顯示,目前DeepSeek應用每日下載量接近500萬。

DeepSeek這股熱潮簡直勢不可擋。

一、芯片巨頭適配DeepSeek,國產(chǎn)GPU們歡呼“過年”

DeepSeek的火爆,不僅體現(xiàn)在用戶數(shù)量的激增上,更在于它贏得了芯片巨頭的青睞。AMD、英偉達、英特爾等大佬紛紛宣布適配DeepSeek,國產(chǎn)GPU企業(yè)更是歡呼雀躍,仿佛過年一般。壁仞科技、摩爾線程、華為昇騰等紛紛宣布上線DeepSeek推理服務,為全球開發(fā)者提供了云端體驗的全系列模型服務,從1.5B到70B,應有盡有,簡直是開發(fā)者的福音。

早在1月25日,AMD宣布將DeepSeek-V3模型集成到其Instinct MI300X GPU上;1月31日,英偉達官宣其NVIDIA NIM微服務預覽版支持DeepSeek-R1模型;2月1日,美國芯片巨頭英特爾宣布DeepSeek能夠在英特爾產(chǎn)品上運行,包括搭載英特爾處理器的AI PC上實現(xiàn)離線使用。

正在過年的國內(nèi)芯片企業(yè)緊隨其后。

2月5日,壁仞科技宣布壁仞AI算力平臺正式上線 DeepSeek R1 蒸餾模型推理服務,全球開發(fā)者可云端體驗 1.5B、7B、8B、14B、32B、70B 全系列模型服務。該服務具備以下兩大核心優(yōu)勢:一是零部署成本:免去硬件采購與環(huán)境搭建,實現(xiàn)“開箱即用”的云端推理體驗。二是多場景覆蓋:針對LLM等不同任務預置優(yōu)化配置方案。

2月4日,摩爾線程智能科技公司在2025年2月宣布成功部署DeepSeek蒸餾模型推理服務,驗證了其自研全功能GPU在復雜AI任務中的支持能力。摩爾線程還計劃開放自主設計的夸娥(KUAE)GPU智算集群,支持DeepSeek V3、R1模型及新一代蒸餾模型的分布式部署。

2月4日,DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro正式上線昇騰社區(qū),支持一鍵獲取DeepSeek系列模型,支持昇騰硬件平臺上開箱即用,推理快速部署,帶來更快、更高效、更便捷的AI開發(fā)和應用體驗,歡迎廣大開發(fā)者體驗使用。

二、全球云巨頭爭先恐后接入DeepSeek

開源模型成本的下降對產(chǎn)業(yè)鏈上的云服務廠商無疑是利好。目前,全球主要云廠商紛紛將DeepSeek系列模型部署在其云服務上,以豐富其AI產(chǎn)品線,提升服務競爭力。

1月30日,亞馬遜云科技就舉辦一場關于在Amazon Bedrock上部署DeepSeek模型的線上直播。用自定義模型導入功能,在Amazon Bedrock上部署DeepSeek-R1 Distill Llama模型,無縫集成至Amazon Bedrock環(huán)境中,即可充分利用Amazon Bedrock的Serverless基礎設施和統(tǒng)一API。

1月30日,微軟董事長兼CEO薩蒂亞·納德拉宣布DeepSeek-R1模型已可通過微軟的Azure AI Foundry和GitHub獲取。微軟宣布推出針對NPU優(yōu)化的DeepSeek-R1首批將面向搭載高通驍龍X芯片的Copilot+ PC推出,隨后是英特爾酷睿Ultra 200V等平臺。

還在春節(jié)假期期間的國內(nèi)云服務商們也不甘落后、緊急加班起來。

2月1日華為云宣布,硅基流動與華為云團隊聯(lián)合首發(fā)并上線基于華為云昇騰云服務的DeepSeek-R1/V3推理服務。

2月2日,騰訊云宣布騰訊云高性能應用服務 HAI 支持 DeepSeek-R1 一鍵部署,2月4日又宣布騰訊云 TI 上架 DeepSeek 系列模型;

2月3日宣布阿里云PAI ModelGallery支持云上一鍵部署DeepSeek-V3、DeepSeek-R1。

2月3日晚,百度智能云宣布,百度智能云千帆平臺已正式上架 DeepSeek-R1 和 DeepSeek-V3 模型。

2月4日,火山引擎宣布,將支持 V3、R1 等不同尺寸的 DeepSeek 開源模型,可以通過在火山引擎機器學習平臺 veMLP 中部署和在火山方舟中調(diào)用模型兩種方式使用模型。

2月5日下午,青云科技旗下 AI 算力云服務——基石智算CoresHub 正式上線 DeepSeek-R1 系列模型,限時免費!既可以通過大模型服務直接調(diào)用 DeepSeek 系列模型,按token計費,前5天免費使用,不限token數(shù)量;也可以通過 AI 算力云服務提供的 GPU 在云端部署推理服務,按需使用算力,可隨用隨開,新用戶注冊認證立即贈送 50 元算力券,可免費體驗。

三、DeepSeek爆火背后的創(chuàng)新和突破點

DeepSeek之所以能夠爆火,背后自然有其創(chuàng)新和突破點。

在C端用戶使用來看,DeepSeek與ChatGPT等其他聊天機器人的不同之處在于,DeepSeek的同名聊天機器人在回應用戶提問時,會將思維鏈(Chain of Thought,CoT)完全展示出來。將自己的思考過程完全展示給用戶看,這激發(fā)了大量用戶的熱情。

對企業(yè)等B端用戶而言,DeepSeek R1 API 的價格,比o1便宜近27倍。效果差不多的情況下,便宜這么多,誰不選便宜又好用的呢?

DeepSeek模型在前端的優(yōu)秀表現(xiàn),其背后依賴于DeepSeek的技術突破。

DeepSeek-R1 在后訓練階段大規(guī)模使用了強化學習技術,在僅有極少標注數(shù)據(jù)的情況下,極大提升了模型推理能力。在數(shù)學、代碼、自然語言推理等任務上,性能比肩 OpenAI o1 正式版。

DeepSeek V3模型和R1系列模型都是基于更基礎版本V3-Base開發(fā)的。V3模型的突破主要在于訓練成本和計算效率,R1開辟了訓練推理模型的新路徑。

在R1之前,業(yè)界大模型普遍依賴于RLHF(基于人類反饋的強化學習)。這一強化學習模式使用了大量由人類撰寫的高質(zhì)量問答以了解“什么才是好的答案”

根據(jù)DeepSeek 發(fā)表的論文,R1模型放棄了RLHF中的HF(人類反饋)部分,只采用RL(強化學習):為模型設置兩個獎勵函數(shù),一個用于獎勵“結(jié)果正確”的答案,另一個獎勵“思考過程正確”的答案;鼓勵模型一次嘗試幾個不同的答案,然后根據(jù)兩個獎勵函數(shù)對它們進行評分。DeepSeek稱,經(jīng)過數(shù)千個RL步驟,DeepSeek-R1-Zero在推理基準測試中的性能就與OpenAI-o1-0912的性能相當了。

四、DeepSeek顛覆“大算力”玩法兒,英偉達GPU被拋售?

更值得一提的是,DeepSeek的低成本模型已經(jīng)給產(chǎn)業(yè)界帶來震撼。

DeepSeek的模型在較低成本的算力環(huán)境下運行高效,降低了對英偉達高端GPU芯片的依賴。這可能導致市場對英偉達高端芯片的需求增長放緩。

DeepSeek的技術突破使投資者重新審視AI產(chǎn)業(yè)的投資邏輯,對英偉達等依賴高端算力芯片的企業(yè)前景產(chǎn)生擔憂,導致英偉達等科技股集體下挫。DeepSeek的技術突破引發(fā)市場對AI算力需求的懷疑,導致博通、臺積電等依賴AI獲得巨額市值增長的芯片制造商股價下跌。

同時,DeepSeek的開源策略和技術突破有助于吸引更多開發(fā)者參與優(yōu)化和部署,進一步降低算力成本,提高模型的應用效果。

整體來看,DeepSeek的崛起促使全球科技圈重新審視AI產(chǎn)業(yè)的投資邏輯和技術路徑,加速了AI技術的創(chuàng)新和發(fā)展。

近期,就有消息稱,DeepSeek發(fā)布之后,英偉達GPU預期需求已經(jīng)出現(xiàn)下降,有人發(fā)現(xiàn)Alibaba網(wǎng)站上有大量全新的英偉達H800、A100、甚至H100上線,正在瘋狂被拋售。

五、圍堵DeepSeek,又是美國挑頭

然而,DeepSeek的崛起之路并非一帆風順。美國政府挑頭圍堵DeepSeek。

據(jù)媒體報道,近日,美國參議員Josh Hawley提出了一項激進的法案《2025年美國人工智能能力與中國脫鉤法案》。根據(jù)新的法案,任何下載或使用DeepSeek的行為將被定性為犯罪,最高可判處20年監(jiān)禁。如果與中國的高校、大學或?qū)嶒炇液献?,可能涉及違法行為,并對違反規(guī)定的行為設定了民事罰款,具體為個人罰款100萬美元,公司罰款1億美元,此外賠償金額為3倍。

早在法案提出之前,美國總統(tǒng)就已開始屏蔽DeepSeek,包括國防部、國會和NASA等部門。

另外,意大利等國家也跟風禁用DeepSeek。意大利數(shù)據(jù)保護局(Garante)以數(shù)據(jù)隱私風險為由,要求DeepSeek提供關于個人數(shù)據(jù)收集和存儲的詳細信息,包括數(shù)據(jù)來源、用途、法律依據(jù)及是否存儲在中國境內(nèi)。由于DeepSeek的回應被認定為“完全不充分”,Garante隨即下令屏蔽其服務,并展開正式調(diào)查。意大利要求政府設備移除DeepSeek相關產(chǎn)品,但個人設備暫未受限。

自2025年1月31日起,DeepSeek在意大利的蘋果和谷歌應用商店已無法下載。

意大利的舉措引發(fā)了歐洲多國跟進。例如,法國、愛爾蘭等國的監(jiān)管機構(gòu)也啟動了對DeepSeek的質(zhì)詢,而澳大利亞、美國部分州及韓國則進一步擴大至政府系統(tǒng)的全面禁用。

總結(jié):

DeepSeek的顛覆性影響已經(jīng)顯現(xiàn)。它不僅改變了大模型經(jīng)濟的格局,更讓全球科技圈重新審視AI產(chǎn)業(yè)的未來。

不過,目前使用DeepSeek服務非常不穩(wěn)定。有用戶反饋,一上午問了10個問題,7個被回復“服務器繁忙,請稍后再試?!?/p>

所以,首要需求是,請DeepSeek服務更穩(wěn)定!

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。

2025-02-06
超ChatGPT,DeepSeek成全球增速最快AI應用!國產(chǎn)AI黑馬是如何煉成的?
DeepSeek這股熱潮簡直勢不可擋。

長按掃碼 閱讀全文