123,123

2024 年 3 月 18 日，通用人工智能創(chuàng)業(yè)公司——月之暗面(Moonshot AI)宣布在大模型長上下文窗口技術(shù)上取得新的突破，Kimi 智能助手已支持 200 萬字超長無損上下文，并于即日起開啟產(chǎn)品“內(nèi)測”。對大模型超長無損上下文能力有需求的用戶，可到 Kimi 智能助手網(wǎng)頁版 kimi.ai 首頁申請搶先體驗(yàn)。

據(jù)了解，Kimi 智能助手是月之暗面(Moonshot AI)基于自研千億參數(shù)大模型打造的對話式 AI 助手產(chǎn)品，在 2023 年 10 月發(fā)布時支持約 20 萬漢字無損上下文輸入，創(chuàng)造了消費(fèi)級AI產(chǎn)品所支持的上下文輸入長度紀(jì)錄。2023 年 11 月，Kimi 智能助手正式面向全社會開放服務(wù)，出色的長上下文處理能力，幫助用戶解鎖了很多新的使用場景，包括專業(yè)學(xué)術(shù)論文的翻譯和理解、輔助分析法律問題、一次性整理幾十張發(fā)票、快速理解API開發(fā)文檔等，獲得了良好的用戶口碑。

不到半年時間，月之暗面將 Kimi 智能助手的無損上下文長度提升了一個數(shù)量級，從 20 萬字到 200 萬字。由于沒有采用常規(guī)的漸進(jìn)式提升路線，月之暗面團(tuán)隊(duì)遇到的技術(shù)難度也是指數(shù)級增加的。為了達(dá)到更好的長窗口無損壓縮性能，月之暗面的研發(fā)和技術(shù)團(tuán)隊(duì)從模型預(yù)訓(xùn)練到對齊、推理環(huán)節(jié)均進(jìn)行了原生的重新設(shè)計(jì)和開發(fā)，不走“滑動窗口”、“降采樣”等技術(shù)捷徑，攻克了很多底層技術(shù)難點(diǎn)，才取得了新的突破。

媒體溝通會現(xiàn)場，月之暗面“拋磚引玉”，展示了一些超長無損上下文的使用場景示例。例如，用戶上傳幾十萬字的經(jīng)典德州撲克長篇教程后，讓 Kimi 扮演德?lián)鋵＜覟樽约禾峁┏雠撇呗缘闹笇?dǎo)。

上傳一份完整的近百萬字中醫(yī)診療手冊，讓 Kimi 針對的用戶問題給出診療建議。

上傳英偉達(dá)過去幾年的完整財報，讓 Kimi 成為英偉達(dá)財務(wù)研究專家，幫用戶分析總結(jié)英偉達(dá)歷史上的重要發(fā)展節(jié)點(diǎn)。

上傳一個代碼倉庫里的源代碼，可以詢問 Kimi 關(guān)于代碼庫的所有細(xì)節(jié)，即便是毫無注釋的陳年老代碼也能幫助你快速梳理出代碼的結(jié)構(gòu)。

過去要 10000 小時才能成為專家的領(lǐng)域，現(xiàn)在只需要 10 分鐘，Kimi 就能接近任何一個新領(lǐng)域的初級專家水平。用戶可以跟 Kimi 探討這個領(lǐng)域的問題，讓 Kimi 幫助自己練習(xí)專業(yè)技能，或者啟發(fā)新的想法。有了支持 200 萬字無損上下文的 Kimi，快速學(xué)習(xí)任何一個新領(lǐng)域都會變得更加輕松。

快速整理大量的資料是很多用戶在工作中經(jīng)常遇到的挑戰(zhàn)?，F(xiàn)在 Kimi 能夠一口氣精讀 500 個，甚至更多數(shù)量的文件，幫助用戶快速分析所有文件的內(nèi)容，并且支持通過自然語言進(jìn)行信息查詢和篩選，大大提高了信息處理效率。例如，公司 HR 可以基于業(yè)務(wù)需求，快速從最近的 500 份簡歷中，讓 Kimi 快速找出有某個行業(yè)從業(yè)經(jīng)歷，同時從計(jì)算機(jī)類專業(yè)畢業(yè)的求職者，更加高效地篩選和識別合適的候選人。

從長篇小說、故事或劇本中，重新發(fā)現(xiàn)值得玩味的蛛絲馬跡，進(jìn)行深層細(xì)節(jié)的挖掘，是很多影視娛樂 IP 的愛好者熱衷的事情。如果將甄嬛傳全集幾十萬字的劇本傳給 Kimi，然后提問劇本中有哪些細(xì)節(jié)表明甄嬛的孩子是果郡王的。Kimi 能在不同時間段、各個場景的故事情節(jié)中，深入挖掘甄嬛、果郡王的情感線以及和他們孩子的真相，堪比一個看了好幾十遍電視劇的“甄”學(xué)家。

“我們相信，大模型無損上下文長度的數(shù)量級提升，也會進(jìn)一步幫助大家打開對AI應(yīng)用場景的想象力，包括完整代碼庫的分析理解、可以自主幫我們完成多步驟復(fù)雜任務(wù)的智能體Agent、不會遺忘關(guān)鍵信息的終身助理、真正統(tǒng)一架構(gòu)的多模態(tài)模型等等。”月之暗面工程副總裁許欣然在媒體溝通會上表示，“無論是內(nèi)存、算力還是網(wǎng)絡(luò)帶寬，歷史上每一次基礎(chǔ)技術(shù)的升級，都會解鎖新的產(chǎn)品形態(tài)和應(yīng)用場景。我們對 200 萬無損上下文的 Kimi 可以帶來哪些超出想象力的創(chuàng)新機(jī)遇充滿期待。”

“通往通用人工智能(AGI)的話，無損的長上下文將會是一個很關(guān)鍵的基礎(chǔ)技術(shù)。從 word2vec 到 RNN、LSTM，再到 Transformer，歷史上所有的模型架構(gòu)演進(jìn)，本質(zhì)上都是在提升有效的、無損的上下文長度。”月之暗面創(chuàng)始人楊植麟博士此前在接受采訪時表示，“上下文長度可能存在摩爾定律，但需要同時優(yōu)化長度和無損壓縮水平兩個指標(biāo)，才是有意義的規(guī)?；?。”

從很多 Kimi 智能助手用戶的反饋來看，20 萬字的無損長上下文幫助他們打開了新的AI應(yīng)用世界，帶來了更大的價值，但隨著他們嘗試更復(fù)雜的任務(wù)、解讀更長的文檔，依然會遇到對話長度超出限制的情況。這也是大模型產(chǎn)品的無損上下文長度需要繼續(xù)提升的一個直接原因。

此外，Kimi 智能助手的智能搜索，更是離不開大模型的無損長上下文能力。Kimi 主動搜索得到的多篇資料，會作為上下文的一部分交給模型去推理。正是因?yàn)?ensp; Kimi 大模型支持的上下文窗口足夠長，窗口內(nèi)的信息損失足夠低，Kimi 智能助手才能輸出高質(zhì)量的結(jié)果，為用戶帶來截然不同的搜索體驗(yàn)——Kimi 可以根據(jù)用戶的問題，主動去互聯(lián)網(wǎng)上搜索、分析和總結(jié)最相關(guān)的多個頁面，生成更直接、更準(zhǔn)確的答案。例如，用戶可以讓 Kimi 主動去搜索和對比兩家同領(lǐng)域上市公司的最新財報數(shù)據(jù)，直接生成對比表格，節(jié)省大量的資料查找時間。而傳統(tǒng)的搜索引擎通常只能根據(jù)用戶的問題，返回一些參雜著廣告信息網(wǎng)頁鏈接。

另一項(xiàng)與大模型的無損上下文能力息息相關(guān)的指標(biāo)是指令遵循(Instruction Following)能力。指令遵循能力主要體現(xiàn)在兩個方面：第一，模型在多輪對話中是否能夠始終遵循用戶的指令，理解用戶的需求;第二，模型是否能夠遵循復(fù)雜指令，有時候復(fù)雜指令可能長達(dá)幾千、上萬字。從產(chǎn)品推出以來的用戶反饋來看，Kimi 智能助手的多輪交互和超長指令遵循能力，也同樣具備顯著優(yōu)勢。

伴隨模型能力的每日升級，iOS應(yīng)用、Android應(yīng)用、小程序、Web等多端平臺的上線，Kimi 智能助手已成為越來越多用戶工作和生活離不開的 AI 小助手。3 月 18 日啟動 200 萬字超長上下文的內(nèi)測申請后，月之暗面會逐步開放更多用戶來體驗(yàn)具備超長無損上下文能力的 Kimi 智能助手，期待與更多用戶共創(chuàng)智能。

（免責(zé)聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請進(jìn)一步核實(shí)，并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏，概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時，應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后，將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí)，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。）

Kimi智能助手宣布支持200萬字無損上下文，不到半年提升10倍

Kimi智能助手宣布支持200萬字無損上下文，不到半年提升10倍