2024 年 3 月 18 日,通用人工智能創(chuàng)業(yè)公司——月之暗面(Moonshot AI)宣布在大模型長上下文窗口技術(shù)上取得新的突破,Kimi 智能助手已支持 200 萬字超長無損上下文,并于即日起開啟產(chǎn)品“內(nèi)測”。對大模型超長無損上下文能力有需求的用戶,可到 Kimi 智能助手網(wǎng)頁版 kimi.ai 首頁申請搶先體驗。
據(jù)了解,Kimi 智能助手是月之暗面(Moonshot AI)基于自研千億參數(shù)大模型打造的對話式 AI 助手產(chǎn)品,在 2023 年 10 月發(fā)布時支持約 20 萬漢字無損上下文輸入,創(chuàng)造了消費級AI產(chǎn)品所支持的上下文輸入長度紀(jì)錄。2023 年 11 月,Kimi 智能助手正式面向全社會開放服務(wù),出色的長上下文處理能力,幫助用戶解鎖了很多新的使用場景,包括專業(yè)學(xué)術(shù)論文的翻譯和理解、輔助分析法律問題、一次性整理幾十張發(fā)票、快速理解API開發(fā)文檔等,獲得了良好的用戶口碑。
不到半年時間,月之暗面將 Kimi 智能助手的無損上下文長度提升了一個數(shù)量級, 從 20 萬字到 200 萬字。由于沒有采用常規(guī)的漸進式提升路線,月之暗面團隊遇到的技術(shù)難度也是指數(shù)級增加的。為了達到更好的長窗口無損壓縮性能,月之暗面的研發(fā)和技術(shù)團隊從模型預(yù)訓(xùn)練到對齊、推理環(huán)節(jié)均進行了原生的重新設(shè)計和開發(fā),不走“滑動窗口”、“降采樣”等技術(shù)捷徑,攻克了很多底層技術(shù)難點,才取得了新的突破。
媒體溝通會現(xiàn)場,月之暗面“拋磚引玉”,展示了一些超長無損上下文的使用場景示例。例如,用戶上傳幾十萬字的經(jīng)典德州撲克長篇教程后,讓 Kimi 扮演德?lián)鋵<覟樽约禾峁┏雠撇呗缘闹笇?dǎo)。
上傳一份完整的近百萬字中醫(yī)診療手冊,讓 Kimi 針對的用戶問題給出診療建議。
上傳英偉達過去幾年的完整財報,讓 Kimi 成為英偉達財務(wù)研究專家,幫用戶分析總結(jié)英偉達歷史上的重要發(fā)展節(jié)點。
上傳一個代碼倉庫里的源代碼,可以詢問 Kimi 關(guān)于代碼庫的所有細節(jié),即便是毫無注釋的陳年老代碼也能幫助你快速梳理出代碼的結(jié)構(gòu)。
過去要 10000 小時才能成為專家的領(lǐng)域,現(xiàn)在只需要 10 分鐘,Kimi 就能接近任何一個新領(lǐng)域的初級專家水平。用戶可以跟 Kimi 探討這個領(lǐng)域的問題,讓 Kimi 幫助自己練習(xí)專業(yè)技能,或者啟發(fā)新的想法。有了支持 200 萬字無損上下文的 Kimi,快速學(xué)習(xí)任何一個新領(lǐng)域都會變得更加輕松。
快速整理大量的資料是很多用戶在工作中經(jīng)常遇到的挑戰(zhàn)。現(xiàn)在 Kimi 能夠一口氣精讀 500 個,甚至更多數(shù)量的文件,幫助用戶快速分析所有文件的內(nèi)容,并且支持通過自然語言進行信息查詢和篩選,大大提高了信息處理效率。例如,公司 HR 可以基于業(yè)務(wù)需求,快速從最近的 500 份簡歷中,讓 Kimi 快速找出有某個行業(yè)從業(yè)經(jīng)歷,同時從計算機類專業(yè)畢業(yè)的求職者,更加高效地篩選和識別合適的候選人。
從長篇小說、故事或劇本中,重新發(fā)現(xiàn)值得玩味的蛛絲馬跡,進行深層細節(jié)的挖掘,是很多影視娛樂 IP 的愛好者熱衷的事情。如果將甄嬛傳全集幾十萬字的劇本傳給 Kimi,然后提問劇本中有哪些細節(jié)表明甄嬛的孩子是果郡王的。Kimi 能在不同時間段、各個場景的故事情節(jié)中,深入挖掘甄嬛、果郡王的情感線以及和他們孩子的真相,堪比一個看了好幾十遍電視劇的“甄”學(xué)家。
“我們相信,大模型無損上下文長度的數(shù)量級提升,也會進一步幫助大家打開對AI應(yīng)用場景的想象力,包括完整代碼庫的分析理解、可以自主幫我們完成多步驟復(fù)雜任務(wù)的智能體Agent、不會遺忘關(guān)鍵信息的終身助理、真正統(tǒng)一架構(gòu)的多模態(tài)模型等等。”月之暗面工程副總裁許欣然在媒體溝通會上表示,“無論是內(nèi)存、算力還是網(wǎng)絡(luò)帶寬,歷史上每一次基礎(chǔ)技術(shù)的升級,都會解鎖新的產(chǎn)品形態(tài)和應(yīng)用場景。我們對 200 萬無損上下文的 Kimi 可以帶來哪些超出想象力的創(chuàng)新機遇充滿期待。”
“通往通用人工智能(AGI)的話,無損的長上下文將會是一個很關(guān)鍵的基礎(chǔ)技術(shù)。從 word2vec 到 RNN、LSTM,再到 Transformer,歷史上所有的模型架構(gòu)演進,本質(zhì)上都是在提升有效的、無損的上下文長度。”月之暗面創(chuàng)始人楊植麟博士此前在接受采訪時表示,“上下文長度可能存在摩爾定律,但需要同時優(yōu)化長度和無損壓縮水平兩個指標(biāo),才是有意義的規(guī)模化。”
從很多 Kimi 智能助手用戶的反饋來看,20 萬字的無損長上下文幫助他們打開了新的AI應(yīng)用世界,帶來了更大的價值,但隨著他們嘗試更復(fù)雜的任務(wù)、解讀更長的文檔,依然會遇到對話長度超出限制的情況。這也是大模型產(chǎn)品的無損上下文長度需要繼續(xù)提升的一個直接原因。
此外,Kimi 智能助手的智能搜索,更是離不開大模型的無損長上下文能力。Kimi 主動搜索得到的多篇資料,會作為上下文的一部分交給模型去推理。正是因為 Kimi 大模型支持的上下文窗口足夠長,窗口內(nèi)的信息損失足夠低,Kimi 智能助手才能輸出高質(zhì)量的結(jié)果,為用戶帶來截然不同的搜索體驗——Kimi 可以根據(jù)用戶的問題,主動去互聯(lián)網(wǎng)上搜索、分析和總結(jié)最相關(guān)的多個頁面,生成更直接、更準(zhǔn)確的答案。例如,用戶可以讓 Kimi 主動去搜索和對比兩家同領(lǐng)域上市公司的最新財報數(shù)據(jù),直接生成對比表格,節(jié)省大量的資料查找時間。而傳統(tǒng)的搜索引擎通常只能根據(jù)用戶的問題,返回一些參雜著廣告信息網(wǎng)頁鏈接。
另一項與大模型的無損上下文能力息息相關(guān)的指標(biāo)是指令遵循(Instruction Following)能力。指令遵循能力主要體現(xiàn)在兩個方面:第一,模型在多輪對話中是否能夠始終遵循用戶的指令,理解用戶的需求;第二,模型是否能夠遵循復(fù)雜指令,有時候復(fù)雜指令可能長達幾千、上萬字。從產(chǎn)品推出以來的用戶反饋來看,Kimi 智能助手的多輪交互和超長指令遵循能力,也同樣具備顯著優(yōu)勢。
伴隨模型能力的每日升級,iOS應(yīng)用、Android應(yīng)用、小程序、Web等多端平臺的上線,Kimi 智能助手已成為越來越多用戶工作和生活離不開的 AI 小助手。3 月 18 日啟動 200 萬字超長上下文的內(nèi)測申請后,月之暗面會逐步開放更多用戶來體驗具備超長無損上下文能力的 Kimi 智能助手,期待與更多用戶共創(chuàng)智能。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )