為什么DeepSeek必須開源

DeepSeek的開源策略讓它在市場上獲得立足點(diǎn),但這并不意味著OpenAI就會被淘汰。OpenAI依舊是行業(yè)領(lǐng)頭羊,開源模式的崛起只會激發(fā)更多創(chuàng)新。

現(xiàn)在大家應(yīng)該都聽說過DeepSeek了。它是那個訓(xùn)練出R1開源推理模型的中國AI實(shí)驗室,R1的表現(xiàn)與OpenAI的o1不相上下,但它是用較為普通的硬件,以極低的成本完成訓(xùn)練的。

DeepSeek之所以能夠做到這一點(diǎn),是因為它采用了一種創(chuàng)新的訓(xùn)練方法,比OpenAI、Anthropic以及其他資金雄厚的競爭者使用的訓(xùn)練方式更高效。那么,為什么DeepSeek會選擇開源呢?

從表面上看,這似乎違背了所有商業(yè)課本中教的常識:如果你通過創(chuàng)新打造了一個市場領(lǐng)先的產(chǎn)品,而且成本低廉,你應(yīng)該利用這一優(yōu)勢進(jìn)行盈利??煽诳蓸凡粫炎约旱呐浞介_源,對吧?

但在大型語言模型(LLM)的世界里,這種做法并不罕見。我相信DeepSeek幾乎不得不選擇開源,隨著時間的推移,開源模型將變得越來越主流。

為什么DeepSeek必須開源

DeepSeek的情況十分特殊。作為一家中國公司,它可能讓一些企業(yè)在與其合作時感到不安,尤其是在涉及客戶數(shù)據(jù)時,更別提需要遵守HIPAA或SOC2認(rèn)證的情況了。

中國的AI API在西方市場可能會受到懷疑,但開源模型則能立刻建立信任。自己托管或通過像Together AI這樣的AI供應(yīng)商使用開源模型,你完全可以掌控一切。

為了在西方市場站穩(wěn)腳跟,DeepSeek不得不將其模型開源。但這不僅僅是一個經(jīng)濟(jì)決策,它也是一種文化決策。最近我聽到一句話:“開源不僅僅是一種技術(shù)行為,它也是一種文化行為。”

開源公司(至少在初期)必須做到以小博大。正是因為DeepSeek必須面對出口控制問題,無法使用像Nvidia H100和GB10等先進(jìn)芯片,它才不得不找到更高效的訓(xùn)練模型的方式。

OpenAI、Meta、Google等公司擁有數(shù)十億美元的資金、龐大的計算資源和世界級的分發(fā)渠道。它們不需要尋找更高效的模型訓(xùn)練方式,因為它們的昂貴解決方案就是唯一選擇。事實(shí)上,如果能夠讓LLM的構(gòu)建更容易且更便宜,這反而會削弱它們的競爭優(yōu)勢。

然而,這一切已經(jīng)發(fā)生了變化。

模型的商品化

現(xiàn)在幾乎每周都有新發(fā)布的GPT-4級別的LLM。我在使用的AI應(yīng)用中,根本分不清我到底是在使用LLaMa、GPT、Claude還是Mistral模型。從我的個人經(jīng)驗和基準(zhǔn)測試來看,它們的表現(xiàn)幾乎不相上下。

OpenAI依舊是行業(yè)的領(lǐng)導(dǎo)者。它們是首個發(fā)布推理模型的公司,也是首個發(fā)布GPT-4的公司。但如今,模型正在逐漸商品化,值得思考的是,是否值得為OpenAI API支付高額費(fèi)用,尤其是在開源模型已經(jīng)有了很好的表現(xiàn)時。

DeepSeek或許就是這個現(xiàn)象最典型的例子。OpenAI的o1每百萬輸出標(biāo)記收費(fèi)60美元,而DeepSeek的R1通過Together AI平臺,每百萬輸出標(biāo)記僅需7美元。

如果最終用戶根本無法察覺兩者的差異,那為什么要付出更多呢?尤其在基礎(chǔ)設(shè)施領(lǐng)域,這一點(diǎn)尤為重要。

基礎(chǔ)設(shè)施領(lǐng)域,開源最終勝出

使用開源和專有軟件之間往往存在一個權(quán)衡:開源軟件便宜且更具可定制性,但由于需要自己維護(hù),它會占用更多資源,并且需要一定的技術(shù)知識。而專有軟件則更貴,但提供了更順暢(盡管更僵化)的體驗。

對于很多產(chǎn)品類別來說,這種權(quán)衡并不值得大多數(shù)公司去做。你不想因為自托管的Notion替代品出現(xiàn)故障而丟失所有的知識庫。

然而,基礎(chǔ)設(shè)施總是定制的,它始終需要你的參與。即便是專有的Oracle數(shù)據(jù)庫,也需要大量的工作來設(shè)置和維護(hù)。這也是為什么開源數(shù)據(jù)庫越來越受歡迎的原因。

專有軟件的優(yōu)勢(不需要維護(hù)、不需要技術(shù)知識等)在基礎(chǔ)設(shè)施領(lǐng)域的作用遠(yuǎn)不如其它領(lǐng)域。實(shí)際上,情況正好相反:越是技術(shù)性強(qiáng)的產(chǎn)品,越適合用戶(工程師)使用開源軟件,因為他們可以審核代碼庫。

這也是我們選擇將Lago作為開源公司構(gòu)建的原因。我們知道,無論你是自己構(gòu)建,還是選擇供應(yīng)商,計費(fèi)系統(tǒng)都會變得非常復(fù)雜,工程師們更傾向于使用Lago。

LLM也一樣。要構(gòu)建任何有用的產(chǎn)品,你無論如何都要進(jìn)行大量的定制化提示和工程調(diào)整,那不如選擇DeepSeek的R1,而不是OpenAI的o1。

這也是為什么開源基礎(chǔ)設(shè)施公司那么多,而開源消費(fèi)品公司幾乎沒有成功的原因。

這意味著專有AI已經(jīng)結(jié)束了嗎?不。

OpenAI遠(yuǎn)未過時

關(guān)于DeepSeek的R1或其他開源模型會讓OpenAI過時的說法,完全不準(zhǔn)確。首先,OpenAI一直是市場的領(lǐng)先者,無論是在LLM(如GPT-4)還是推理模型(如o1)上。

沒有OpenAI的模型,就沒有DeepSeek的R1和許多其他模型(因為LLM的蒸餾技術(shù))。這確實(shí)引發(fā)了一個問題,那就是,如果你提供了突破性的技術(shù),而其他公司以更低的價格推出類似的產(chǎn)品,那么構(gòu)建新的前沿模型是否仍然值得呢?

不過,R1也可能會促使那些資金雄厚的老牌公司重新審視自身的效率,并推動他們尋找更高效的方式,誰知道當(dāng)他們同時擁有效率和世界一流的資源時,會創(chuàng)造出什么呢?

本文譯自 Lago Blog,由 BALI 編輯發(fā)布。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2025-01-31
為什么DeepSeek必須開源
DeepSeek的開源策略讓它在市場上獲得立足點(diǎn),但這并不意味著OpenAI就會被淘汰。OpenAI依舊是行業(yè)領(lǐng)頭羊,開源模式的崛起只會激發(fā)更多創(chuàng)新?,F(xiàn)在大家應(yīng)該都聽說過DeepSeek了。

長按掃碼 閱讀全文