出品 | 51CTO技術(shù)棧(微信號:blog51cto)
Kimi 智能助手 2023 年 10 月初次亮相時,憑借約 20 萬漢字的無損上下文能力,幫助用戶解鎖了很多新的使用場景,包括專業(yè)學(xué)術(shù)論文的翻譯和理解、輔助分析法律問題、一次性整理幾十張發(fā)票、快速理解API開發(fā)文檔等,獲得了良好的用戶口碑和用戶量的快速增長。
不到半年時間過去,我們今天宣布 Kimi 智能助手在長上下文窗口技術(shù)上再次取得突破,無損上下文長度提升了一個數(shù)量級到 200 萬字。
圖片
即日起,支持 200 萬字上下文的 Kimi 已啟動“內(nèi)測”。對大模型超長無損上下文能力有需求的用戶,可到 Kimi 智能助手網(wǎng)頁版 kimi.ai 首頁申請搶先體驗。
從 20 萬字到 200 萬字,由于沒有采用常規(guī)的漸進(jìn)式提升路線,月之暗面團(tuán)隊遇到的技術(shù)難度也是指數(shù)級增加的。為了達(dá)到更好的長窗口無損壓縮性能,我們的研發(fā)和技術(shù)團(tuán)隊從模型預(yù)訓(xùn)練到對齊、推理環(huán)節(jié)均進(jìn)行了原生的重新設(shè)計和開發(fā),不走“滑動窗口”、“降采樣”等技術(shù)捷徑,攻克了很多底層技術(shù)難點。
我們相信,大模型無損上下文長度的數(shù)量級提升,也會進(jìn)一步幫助大家打開對AI應(yīng)用場景的想象力,包括完整代碼庫的分析理解、可以自主幫人類完成多步驟復(fù)雜任務(wù)的智能體Agent、不會遺忘關(guān)鍵信息的終身助理、真正統(tǒng)一架構(gòu)的多模態(tài)模型等等。
接下來“拋磚引玉”,先來看幾個超長無損上下文的使用場景示例:
用戶上傳幾十萬字的經(jīng)典德州撲克長篇教程后,讓 Kimi 扮演德?lián)鋵<覟樽约禾峁┏雠撇呗缘闹笇?dǎo)。
圖片
上傳一份完整的近百萬字中醫(yī)診療手冊,讓 Kimi 針對用戶的問題給出診療建議。
圖片
上傳英偉達(dá)過去幾年的完整財報,讓 Kimi 成為英偉達(dá)財務(wù)研究專家,幫用戶分析總結(jié)英偉達(dá)歷史上的重要發(fā)展節(jié)點。
圖片
上傳一個代碼倉庫里的源代碼,可以詢問 Kimi 關(guān)于代碼庫的所有細(xì)節(jié),即便是毫無注釋的陳年老代碼也能幫助你快速梳理出代碼的結(jié)構(gòu)。
圖片
過去要 10000 小時才能成為專家的領(lǐng)域,現(xiàn)在只需要 10 分鐘,Kimi 就能接近任何一個新領(lǐng)域的初級專家水平。用戶可以跟 Kimi 探討這個領(lǐng)域的問題,讓 Kimi 幫助自己練習(xí)專業(yè)技能,或者啟發(fā)新的想法。有了支持 200 萬字無損上下文的 Kimi,快速學(xué)習(xí)任何一個新領(lǐng)域都會變得更加輕松。
快速整理大量的資料是很多用戶在工作中經(jīng)常遇到的挑戰(zhàn)。現(xiàn)在 Kimi 能夠一口氣精讀 500 個,甚至更多數(shù)量的文件,幫助用戶快速分析所有文件的內(nèi)容,并且支持通過自然語言進(jìn)行信息查詢和篩選,大大提高了信息處理效率。例如,公司 HR 可以基于業(yè)務(wù)需求,快速從最近的 500 份簡歷中,讓 Kimi 快速找出有某個行業(yè)從業(yè)經(jīng)歷,同時從計算機(jī)類專業(yè)畢業(yè)的求職者,更加高效地篩選和識別合適的候選人。
圖片
從長篇小說、故事或劇本中,重新發(fā)現(xiàn)值得玩味的蛛絲馬跡,進(jìn)行深層細(xì)節(jié)的挖掘,是很多影視娛樂 IP 的愛好者熱衷的事情。如果將甄嬛傳全集幾十萬字的劇本傳給 Kimi,然后提問劇本中有哪些細(xì)節(jié)表明甄嬛的孩子是果郡王的。Kimi 能在不同時間段、各個場景的故事情節(jié)中,深入挖掘甄嬛、果郡王的情感線以及和他們孩子的真相,堪比一個看了好幾十遍電視劇的“甄”學(xué)家。
圖片
“通往通用人工智能(AGI)的話,無損的長上下文將會是一個很關(guān)鍵的基礎(chǔ)技術(shù)。從 word2vec 到 RNN、LSTM,再到 Transformer,歷史上所有的模型架構(gòu)演進(jìn),本質(zhì)上都是在提升有效的、無損的上下文長度?!痹轮得鎰?chuàng)始人楊植麟博士此前在接受采訪時表示,“上下文長度可能存在摩爾定律,但需要同時優(yōu)化長度和無損壓縮水平兩個指標(biāo),才是有意義的規(guī)?;!?/p>
從很多 Kimi 智能助手用戶的反饋來看,20 萬字的無損長上下文幫助他們打開了新的AI應(yīng)用世界,帶來了更大的價值,但隨著他們嘗試更復(fù)雜的任務(wù)、解讀更長的文檔,依然會遇到對話長度超出限制的情況。這也是大模型產(chǎn)品的無損上下文長度需要繼續(xù)提升的一個直接原因。
此外,Kimi 智能助手的智能搜索,同樣離不開大模型的無損長上下文能力。Kimi 主動搜索得到的多篇資料,會作為上下文的一部分交給模型去推理。正是因為 Kimi 大模型支持的上下文窗口足夠長,窗口內(nèi)的信息損失足夠低,Kimi 智能助手才能輸出高質(zhì)量的結(jié)果,為用戶帶來截然不同的搜索體驗。
Kimi 可以根據(jù)用戶的問題,主動去互聯(lián)網(wǎng)上搜索、分析和總結(jié)最相關(guān)的多個頁面,生成更直接、更準(zhǔn)確的答案。例如,用戶可以讓 Kimi 主動去搜索和對比兩家同領(lǐng)域上市公司的最新財報數(shù)據(jù),直接生成對比表格,節(jié)省大量的資料查找時間。而傳統(tǒng)的搜索引擎通常只能根據(jù)用戶的問題,返回一些參雜著廣告信息網(wǎng)頁鏈接。
另一項與大模型的無損上下文能力息息相關(guān)的指標(biāo)是指令遵循(Instruction Following)能力。指令遵循能力主要體現(xiàn)在兩個方面:第一,模型在多輪對話中是否能夠始終遵循用戶的指令,理解用戶的需求;第二,模型是否能夠遵循復(fù)雜指令,有時候復(fù)雜指令可能長達(dá)幾千、上萬字。從產(chǎn)品推出以來的用戶反饋來看,Kimi 智能助手的多輪交互和超長指令遵循能力,也是產(chǎn)品的一項核心優(yōu)勢。
伴隨模型能力的每日升級,iOS應(yīng)用、Android應(yīng)用、Kimi 智能助手、Web(kimi.ai)等多端平臺的上線,Kimi 智能助手已成為越來越多用戶工作和生活離不開的 AI 小助手。今天啟動 200 萬字超長上下文的內(nèi)測申請后,月之暗面逐步開放更多用戶來體驗具備超長無損上下文能力的 Kimi 智能助手,期待與更多用戶共創(chuàng)智能。