伯克利團(tuán)隊(duì)僅30美元復(fù)制DeepSeek AI

伯克利團(tuán)隊(duì)以30美元復(fù)制DeepSeek AI的核心功能,推出開(kāi)源項(xiàng)目TinyZero,證明AI研究不再是高成本領(lǐng)域,降低了進(jìn)入門(mén)檻,推動(dòng)了更廣泛的技術(shù)應(yīng)用。

人工智能研究通常是巨頭企業(yè)的專(zhuān)屬游戲,這些公司擁有深厚的財(cái)力支持。然而,伯克利加州大學(xué)的一支研究團(tuán)隊(duì)卻打破了這一局面。他們僅以30美元復(fù)制了DeepSeek R1-Zero的核心功能。他們的項(xiàng)目名為T(mén)inyZero,證明先進(jìn)的人工智能推理模型并不需要耗費(fèi)巨額資金。更重要的是,人工智能研究比以往任何時(shí)候都更容易接近。

在Jiayi Pan的帶領(lǐng)下,該團(tuán)隊(duì)旨在通過(guò)強(qiáng)化學(xué)習(xí)(Reinforcement Learning,RL)重新構(gòu)建DeepSeek的推理模型。與依賴(lài)昂貴的云服務(wù)或巨大的計(jì)算能力不同,他們使用了一個(gè)基本的語(yǔ)言模型、一個(gè)簡(jiǎn)單的提示和一個(gè)獎(jiǎng)勵(lì)系統(tǒng)來(lái)訓(xùn)練TinyZero。

Pan在X平臺(tái)上分享了他的興奮之情,表示:“你可以親身經(jīng)歷那一刻,只需不到30美元?!彼€將TinyZero描述為第一個(gè)開(kāi)源的推理模型復(fù)現(xiàn)項(xiàng)目,強(qiáng)調(diào)了它如何學(xué)會(huì)驗(yàn)證和完善自己的答案。

如何開(kāi)發(fā)TinyZero

為了測(cè)試模型,研究人員選擇了一個(gè)名為Countdown的游戲,玩家需要通過(guò)基本的數(shù)學(xué)運(yùn)算來(lái)達(dá)到目標(biāo)數(shù)字。盡管TinyZero最初是隨機(jī)猜測(cè),但隨著時(shí)間的推移,它學(xué)會(huì)了驗(yàn)證自己的答案、尋找更好的解決方案并相應(yīng)地進(jìn)行調(diào)整。

他們嘗試了不同規(guī)模的模型,從50億參數(shù)到700億參數(shù)。結(jié)果是什么?參數(shù)規(guī)模較小的模型(50億參數(shù))只是隨機(jī)猜測(cè)答案然后停止。而參數(shù)規(guī)模較大的模型(150億參數(shù)及以上)則學(xué)會(huì)了自我驗(yàn)證、完善解決方案并顯著提高了準(zhǔn)確率。

TinyZero真正引人注目的地方在于,與傳統(tǒng)的人工智能模型相比,它的成本低得驚人??纯催@些對(duì)比:

* OpenAI的API:每百萬(wàn)tokens收費(fèi)15美元
* DeepSeek-R1:每百萬(wàn)tokens收費(fèi)0.55美元
* TinyZero的總成本:一次性訓(xùn)練成本30美元

這意味著任何人(不僅僅是大型科技公司)都可以在無(wú)需燒錢(qián)到破產(chǎn)的情況下實(shí)驗(yàn)人工智能推理模型。

可用性

TinyZero是開(kāi)源的,并且可以在GitHub上找到,因此任何人都可以嘗試改進(jìn)它。盡管它目前僅在Countdown游戲中進(jìn)行了測(cè)試,但潘佳乂希望這個(gè)項(xiàng)目能夠使強(qiáng)化學(xué)習(xí)研究更加普及。

當(dāng)然,這仍然是一個(gè)早期階段?!爱?dāng)然,其中一個(gè)缺點(diǎn)是,它僅在Countdown任務(wù)中得到了驗(yàn)證,但尚未在一般推理領(lǐng)域中得到驗(yàn)證?!盤(pán)an承認(rèn)。但即便如此,其影響仍然是顯而易見(jiàn)的:人工智能的發(fā)展并不一定要昂貴。有了像TinyZero這樣的項(xiàng)目,低成本、開(kāi)源的人工智能或許將成為未來(lái)的趨勢(shì)。

本文譯自 Gizmochina,由 BALI 編輯發(fā)布。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )

贊助商
2025-03-01
伯克利團(tuán)隊(duì)僅30美元復(fù)制DeepSeek AI
伯克利團(tuán)隊(duì)以30美元復(fù)制DeepSeek AI的核心功能,推出開(kāi)源項(xiàng)目TinyZero,證明AI研究不再是高成本領(lǐng)域,降低了進(jìn)入門(mén)檻,推動(dòng)了更廣泛的技術(shù)應(yīng)用。

長(zhǎng)按掃碼 閱讀全文