3月18日消息,據(jù)外媒報(bào)道,馬斯克領(lǐng)導(dǎo)的人工智能公司xAI當(dāng)?shù)貢r(shí)間周日在官網(wǎng)宣布,他們的大語(yǔ)言模型Grok-1已正式開(kāi)源,發(fā)布了基本模型的權(quán)重和網(wǎng)絡(luò)架構(gòu),有興趣的用戶可通過(guò)github.com/xai-org/grok上的指引使用。
從xAI在官網(wǎng)公布的消息來(lái)看,Grok-1是擁有3140億參數(shù)的混合專家模型。在目前已開(kāi)源的大語(yǔ)言模型中,Grok-1的參數(shù)是最多的。
XAI官網(wǎng)的信息還顯示,Grok-1是由他們從頭開(kāi)始訓(xùn)練的模型,此次發(fā)布的是預(yù)訓(xùn)練階段結(jié)束時(shí)的原始基礎(chǔ)模型檢查點(diǎn),預(yù)訓(xùn)練階段在去年10月份完成。這也就意味著他們開(kāi)源的模型,沒(méi)有進(jìn)行針對(duì)對(duì)話等任何具體應(yīng)用的微調(diào)。
在官網(wǎng)上,xAI披露Grok-1是在大量文本數(shù)據(jù)上訓(xùn)練的基礎(chǔ)模型,是xAI團(tuán)隊(duì)使用JAX和Rust編程語(yǔ)言自定義訓(xùn)練棧從零開(kāi)始訓(xùn)練的成果,權(quán)重和架構(gòu)均依照Apache 2.0開(kāi)源許可協(xié)議發(fā)布。
雖然Grok-1已正式開(kāi)源,但在開(kāi)源時(shí)間上,還是要晚于馬斯克此前所宣布的時(shí)間。
馬斯克是上周一,在他所收購(gòu)的社交媒體上宣布Grok大模型將開(kāi)源的,當(dāng)時(shí)他公布的開(kāi)源時(shí)間是上周,xAI官網(wǎng)宣布開(kāi)始發(fā)布的時(shí)間是周日。而包括美國(guó)在內(nèi)的諸多國(guó)家,仍習(xí)慣將周日作為一周的開(kāi)始,止于周六,3月17日是新一周的第一天,這也就意味著Grok-1并未如馬斯克此前在社交媒體上所公布的那樣,在上周開(kāi)源。
不過(guò),按照國(guó)際標(biāo)準(zhǔn)化組織在ISO 8601國(guó)際標(biāo)準(zhǔn)中給出的日歷星期表示方法,每個(gè)日歷星期是始于周一,止于周日。如果按照這一標(biāo)準(zhǔn),Grok-1的開(kāi)源時(shí)間仍是在馬斯克所說(shuō)的那一周內(nèi)。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )