最近梁文鋒的DeepSeek很火,震驚了華爾街。那么,問(wèn)題來(lái)了,既然DeepSeek是蒸餾出來(lái)的大模型,其他人會(huì)不會(huì)效仿這種方法。第一個(gè)叫板DeepSeek的是華裔李飛飛,據(jù)透露,她僅用50美元,短時(shí)間就蒸餾出類似DeepSeek-R1的推理模型S1,該模型在數(shù)學(xué)及編碼能力方面,與OpenAI O1和DeepSeek R1幾乎處于同一水平。
參與研制S1模型的,是李飛飛團(tuán)隊(duì)(包括斯坦福大學(xué)及華盛頓大學(xué)的研究人員)等,花費(fèi)50美元,折合人民幣大約360元。當(dāng)然,這只是部分成本(云計(jì)算費(fèi)用)。該團(tuán)隊(duì)使用了16個(gè)英偉達(dá)H100 GPU,用時(shí)26分鐘完成了訓(xùn)練過(guò)程?。
當(dāng)然,李飛飛團(tuán)隊(duì)的S1模型,同樣是站在前人肩膀上的,秘訣同樣是蒸餾。其以阿里通義團(tuán)隊(duì)的Qwen2.5- 32B-Instruct作為基礎(chǔ)模型,并通過(guò)蒸餾谷歌DeepMind的推理模型Gemini 2.0 Flash Thinking實(shí)驗(yàn)版,最終蒸餾出S1模型。目前,該模型已宣布開(kāi)源,李飛飛研究團(tuán)隊(duì)公布了訓(xùn)練數(shù)據(jù)及代碼。
李飛飛何許人也?她1976年出生于北京,有“AI教母”之稱。據(jù)公開(kāi)信息,她16歲隨家人移民美國(guó)新澤西。她是人工智能方面的專家,美國(guó)斯坦福大學(xué)首位紅杉講席教授,長(zhǎng)期研究人工智能。2013年至2018年,她擔(dān)任斯坦福人工智能實(shí)驗(yàn)室主任,她還曾擔(dān)任過(guò)Google副總裁以及Google Cloud AI/ML首席科學(xué)家。
李飛飛集多重榮耀于一身,是美國(guó)國(guó)家工程院院士、美國(guó)國(guó)家醫(yī)學(xué)院院士、美國(guó)藝術(shù)與科學(xué)院院士。李飛飛的研究領(lǐng)域主要包括計(jì)算機(jī)視覺(jué)、認(rèn)知神經(jīng)科學(xué)、計(jì)算神經(jīng)科學(xué)和大數(shù)據(jù)分析。
美國(guó)工程院對(duì)李飛飛的評(píng)價(jià)是:她為建立大型機(jī)器學(xué)習(xí)和視覺(jué)理解知識(shí)庫(kù)做出了貢獻(xiàn)。斯坦福大學(xué)對(duì)李飛飛給出了高度評(píng)價(jià),認(rèn)為她是ImageNet和ImageNet Challenge的發(fā)明者,為深度學(xué)習(xí)和AI的最新發(fā)展做出了貢獻(xiàn)。并且,斯坦福大學(xué)還稱贊她,除了技術(shù)貢獻(xiàn)外,還是倡導(dǎo)STEM及AI多樣性的全國(guó)領(lǐng)導(dǎo)者。
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無(wú)關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- DeepSeek大流行,我擔(dān)心的事還是發(fā)生了
- 春晚“機(jī)器人大換血”!優(yōu)必選“退場(chǎng)”,宇樹(shù)科技“上位”!
- 李飛飛叫板梁文鋒?幾百元不到半小時(shí)蒸餾出AI模型
- 突破2納米,日本芯片崛起,臺(tái)積電不再一家獨(dú)大
- DeepSeek破圈,AI商業(yè)化臨界點(diǎn)是如何被打開(kāi)的?
- 劉興亮 | 走哪泡哪
- DeepSeek詳解量化交易內(nèi)幕,股民看了心驚肉跳
- 信創(chuàng)算力關(guān)鍵年的三個(gè)趨勢(shì)與最佳選擇
- 暴跌3萬(wàn)億!中國(guó)AI技術(shù)崛起,嚇壞了美國(guó)AI芯片龍頭
- 微信又“爆改”:微信朋友圈實(shí)況照片不再默認(rèn)播放,你滿意嗎?
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。