7月6日消息,據(jù)報(bào)道,阿里巴巴研究團(tuán)隊(duì)研發(fā)出一款名為 Deep-Thinking 的大語(yǔ)言模型情境學(xué)習(xí)框架。
這個(gè)框架是一種迭代式的前向訓(xùn)練框架,旨在讓大模型能夠深度思考和快速定制專(zhuān)屬模型。它摒棄了傳統(tǒng)的模型訓(xùn)練方法,通過(guò)情境學(xué)習(xí)(In-context Learning)使該模型功能更為強(qiáng)大。
情境學(xué)習(xí)框架是在大模型時(shí)代的背景下提出的新興框架。
大模型具有思維鏈、情景學(xué)習(xí)等涌現(xiàn)能力,能夠執(zhí)行人類(lèi)的指令,并可以直接與人類(lèi)進(jìn)行對(duì)話。其核心作用是突破數(shù)據(jù)標(biāo)注的困境,通過(guò)學(xué)習(xí)海量無(wú)標(biāo)注的數(shù)據(jù)來(lái)進(jìn)行預(yù)訓(xùn)練,從而提升大模型的知識(shí)水平,并在后續(xù)的下游任務(wù)中應(yīng)用。
這個(gè)框架的提出將有助于大模型更好地理解和適應(yīng)不同的情境,為人工智能的發(fā)展帶來(lái)新的可能性,有望在語(yǔ)言處理和人工智能領(lǐng)域發(fā)揮重要作用。
- 英偉達(dá)Q4凈利220.9億美元同比增80%,全面凈利728.8億美元增長(zhǎng)145%
- 阿里視頻生成大模型萬(wàn)相2.1開(kāi)源!效果超Sora,消費(fèi)級(jí)顯卡就能跑
- 沒(méi)網(wǎng)也能用AI 極氪宣布完成座艙端側(cè)大模型離線部署
- 微軟推出全能新模型:Phi-4 多模態(tài)及迷你模型,視覺(jué)、語(yǔ)音、文本一網(wǎng)打盡!
- 職業(yè)棋手作弊被揭發(fā):AI作弊被捕,中國(guó)圍棋協(xié)會(huì)嚴(yán)厲懲罰,禁賽8年
- 字節(jié)跳動(dòng)又一布局:悟空瀏覽器接入DeepSeek,抖音新篇章即將開(kāi)啟?
- 亞馬遜全新智能家居神器:Alexa+聯(lián)動(dòng)6億設(shè)備,顛覆你的未來(lái)家居生活!
- AI在兩天內(nèi)破解了科學(xué)家研究了十年的超級(jí)細(xì)菌難題
- IBM亞太區(qū)總經(jīng)理:AI的開(kāi)源時(shí)刻可能是其未來(lái)的轉(zhuǎn)折點(diǎn)
- TechWeb微晚報(bào):DeepSeek正籌劃加快推出R2模型,特斯拉FSD入華“水土不服”?
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。