編輯 | 言征
出品 | 51CTO技術棧(微信號:blog51cto)
Kimi最近太猛了!所有的教育產(chǎn)品感覺都要被顛覆了。
今天,Kimi上線發(fā)布一款相當炸裂的AI功能——視覺思考模型k1。可以說顛覆了“K12賽道”的傳統(tǒng)搜題解題的產(chǎn)品!
小編驚呼:有了Kimi,學生們還需要手機里安裝各種拍照搜題找答案的軟件嗎?可以預想到,從幼兒園到大學,整個教育賽道恐怕要掀起一股驚濤駭浪!
Kimi,果真越來越“學霸”了!話不多說,直接上干貨。
光看這個名字“k1”,就能讓大家聯(lián)想到1個月前kimi推出的對標OpenAI o1系列的 k0-math模型,自然是類o1模型的重大升級。的確是這樣,官方介紹道:視覺思考模型k1,同樣是強化學習技術打造,但不同的是——
這次的k1模型原生支持端到端圖像理解和思維鏈技術,并將能力擴展到數(shù)學之外的更多基礎科學領域。
簡單理解,這次的k1有兩點創(chuàng)新:一是原生支持端到端的圖像理解,二是數(shù)理化難題全都能拿下了!
在數(shù)學、物理、化學等基礎科學學科的基準能力測試中,初代 k1 模型的表現(xiàn)超過了全球標桿模型 OpenAI o1、GPT-4o以及 Claude 3.5 Sonnet。
圖片
1.Kimi實測,當之無愧的大模型學霸
上個月,清華學霸楊植麟冷不防就丟出了k0-math模型,各種奧數(shù)級別的難題都可以解決,但也存在不足:由于主要支持LaTeX等格式的文本輸入,依賴圖形理解能力的部分幾何圖形題則難以應對。
不過現(xiàn)在,這個問題在k1視覺思考模型就解決了。借助端到端的圖像理解能力,解鎖了包括幾何圖形題在內(nèi)更加全面的數(shù)學能力。
圖片
在不同階段的幾何和圖形題專項基準能力測試中,k1-preview 成績追平或超過了 OpenAI 的 o1 模型。
kimi有測試一道普通幾何題,
圖片
這當然還不算完,除了算幾何題,學霸自然是文理全通,數(shù)理化都得不在話下。
除了數(shù)學能力,k1視覺思考模型將能力擴展到了物理、化學等領域。在基礎科學學科教育階段(這不就是K12嘛)的物理和化學能力測試中,k1 模型的表現(xiàn)同樣不輸全球領先的玩家 OpenAI 和 Anthropic。
我們來看一道 k1 視覺思考模型解答經(jīng)典物理電路題的例子:
圖片
再來個化學題目,kimi的同學將一張曾獲得諾貝爾化學獎的技術原理圖去掉大部分文字說明,只留下“QD”兩個字母,看 k1 是如何一步一步分析出原理圖是在講什么。
圖片
小編實測了下,果真是學霸,大學物理也被Kimi搞定了!一個電荷電場的計算難題——
圖片
圖片
最后自己被自己感動了,還不失淘氣的說:真是令人欣慰呀!
2.大模型理解圖像,如何做到的?
之前拍照搜題更多采用的是視覺理解模型,圖像分割和圖像識別等技術,當然效果也不錯,但也存在很多問題。比如,這種技術要求拍照或者照片的內(nèi)容的質量要足夠高,亮度不能太暗,如果是手寫,字跡也不能潦草。
但用了k1模型,就不用在顧忌這些了,完全“端到端”的解決!
不用再擔心自己拍照技術不夠硬、給大模型輸入的素材不夠清晰!包括照片灰暗、圖像模糊、多題一起拍、手寫字跡干擾、純手寫的題目、傾斜的拍攝角度等問題,k1這回一下都解決了!
圖片
Kimi專門測試了更接近真實使用場景的 k1 模型表現(xiàn)。在“噪聲”場景下,多項基準測試數(shù)據(jù)顯示,k1 模型相比OpenAI 和 Anthropic 的視覺語言模型,有更顯著的領先優(yōu)勢。
數(shù)據(jù)顯示,其他大部分模型在視覺噪聲場景下,能力水平下降了一半多,k1 則依靠超強的視覺識別能力,保持了最低的能力損失幅度。
圖片
我們來看一個例子。
下圖是一位月之暗面的同事在平板電腦上手動推演的公式。
圖片
看看 k1 模型是怎么一步一步分析出作者意圖的。
圖片
3.實測K1:李永樂線性代數(shù)筆記
眼見未必為實,小編自然要實際操練一下,趕緊從網(wǎng)上找了一份自己多年不看的李永樂的線性代數(shù)筆記,這筆記的字跡實在是有點讓人看不清,不過既然是考驗k1,用它最合適。
圖片
kimi,快幫我看看上面都有哪些數(shù)學知識點?
圖片
結果果然令人滿意,不僅一字不差地給出了筆記照片中的文字內(nèi)容——
圖片
還梳理了這張手寫筆記涉及的數(shù)學知識點,包括:
怎么弄判斷矩陣排列的奇偶性、如何按排列展開行列式、高階行列式的計算方法等等。
圖片
可能會有人說,思維鏈、圖像理解的能力,這些并不新鮮,年初就有了。但思維鏈+端到端的圖像理解對于大模型而言,Kimi這次絕對是一個“aha”級別的創(chuàng)新!
4.驚喜——讓大模型具備數(shù)理化思維回答問題的能力找到《荷馬史詩》、《幾何原本》的作者
學霸的厲害之處,不僅可以做題拿高分,更重要的是可以用數(shù)理化思維和視角去看待和解決和回答生活中遇到的問題,一般人可沒這個能力。
據(jù)介紹,在發(fā)布k0-math時,月之暗面就發(fā)現(xiàn) Kimi 數(shù)學版不只會做數(shù)學題,它還會用數(shù)學思維來解釋任何問題。比如你問“一顆心值多少錢”,Kimi 數(shù)學版經(jīng)過一番分析,可能給出讓我們驚喜的答案:一顆心是無價的。
這次視覺思考模型k1,在學習了代數(shù)、幾何、物理、化學、生物等更多基礎科學的難題之后,同樣涌現(xiàn)出更多通用能力。
小編為此設置了兩道難題,來考驗k1的數(shù)理化思維。
第一個是,識別一張“荷馬史詩”的手寫殘頁,然后給出作者和作品是誰。
圖片
可以說想法步驟都沒問題,首先看手稿外觀、再看語種是希臘語、在進一步分析手稿中的文字里提到的詞匯,來判斷出可能是在公元前5世紀至公元2世紀之間寫成的,最后鎖定是亞里士多德的自然哲學或者數(shù)學著作。
不過這個結果是錯誤的,這說明Kimi對于希臘文學的知識儲備還需要繼續(xù)精進一下,當然也存在小編這次的照片實在太過模糊的問題。
好的,讓我們一步步解開這個謎題。我面前有一張古老的手稿圖片,任務是推測其作者及內(nèi)容。這確實是一項充滿挑戰(zhàn)的任務,但我們可以循序漸進地進行。
首先,我仔細觀察手稿的外觀。紙張泛黃,字跡用墨水書寫,顯得古樸而莊重。頁面上布滿了緊密排列的文本,幾乎沒有留白,這表明作者在書寫時非常用心,力求內(nèi)容的完整與精確。文本中還包含了一些編號和邊注,這可能意味著作者在進行某種形式的學術研究或理論推導。
從語言的角度來看,這顯然不是現(xiàn)代英語。它更像是一種古典語言,可能是拉丁文或希臘文??紤]到其古老的特點,我傾向于認為這是希臘文,尤其是因為某些字母看起來像是希臘字母。這讓我聯(lián)想到古希臘的學者,他們以其深邃的哲學和科學著作而聞名于世。
接下來,我們嘗試解讀一些具體的段落。手稿中有一段文字提到了“παραδειγμα”(范例)和“δηλοσθαι”(表明),這些詞匯在古希臘文中頗為常見,常用于哲學或修辭學的討論。另一段文字中出現(xiàn)了“αριθμοι”(數(shù)字)和“γεωμετρια”(幾何),這表明手稿可能涉及數(shù)學或邏輯學的內(nèi)容。
進一步分析,手稿中還包含了一些公式或定理的陳述,如“εαν”(如果)和“οστιν”(因為),這些詞匯通常用于邏輯推理或數(shù)學證明。這讓我聯(lián)想到歐幾里得的《幾何原本》,其中充滿了嚴謹?shù)倪壿嬐茖Ш蛶缀巫C明。
然而,我們不能忽視其他可能性。手稿中還提到了“φυσικη”(自然)和“μεταφυσικη”(形而上學),這些詞匯在亞里士多德的著作中頻繁出現(xiàn)。亞里士多德不僅是一位杰出的哲學家,還是一位博學的科學家,他的著作涵蓋了從邏輯學到物理學的廣泛領域。
為了更全面地理解手稿的內(nèi)容,我們還可以考慮其歷史背景。如果這是古希臘的手稿,那么它可能是在公元前5世紀到公元2世紀之間寫成的,這是古希臘文化和科學的鼎盛時期。這一時期的學者們不僅在哲學上有著深刻的見解,還在數(shù)學、天文學、醫(yī)學等領域取得了顯著的成就。
綜上所述,結合手稿的外觀、語言特征和內(nèi)容分析,我們可以推測這份手稿的作者很可能是古希臘的一位著名學者,如歐幾里得或亞里士多德。手稿的內(nèi)容則可能涉及數(shù)學、邏輯學或哲學的討論,尤其是幾何學或形而上學的領域。
然而,且慢,或許我過于草率地將其斷定為希臘文。若這實為拉丁文手稿,又將如何?許多古代文獻皆有拉丁文譯本,尤其是在中世紀時期。然而,某些字母似乎更貼近希臘字母,例如,我注意到一個類似于“Ω”的符號,這在希臘字母表中代表“歐米茄”,而在拉丁文中則無此字母。這進一步堅定了我認定其為希臘文的信心。
現(xiàn)在,讓我們來探討這份手稿可能涉及的內(nèi)容。鑒于其中包含諸多技術術語和公式,它很可能是一本教科書或學術論文。手稿中不僅有編號的段落,還有旁注,這表明作者在系統(tǒng)地闡述某個主題,可能是數(shù)學定理或哲學論證。
讓我們仔細審視手稿中的一個特定段落,以期獲得更深入的理解。我看到一個段落以“Δι?? ειπερ”(意為“因此”)開頭,這表明作者在進行邏輯推導。接著,文中提到了“?ριθμο?”(數(shù)字)和“μ?γεθη”(大小或量),這進一步證實了數(shù)學是主要話題。
然而,這究竟是哪種數(shù)學呢?是純粹的數(shù)學,還是應用數(shù)學?考慮到文中還提到了“φ?σι?”(自然),這可能意味著這是一本關于自然哲學的著作,即我們今天所說的物理學。
我開始認為,這份手稿可能是亞里士多德或歐幾里得等古希臘學者的作品。亞里士多德以其廣泛的自然哲學著作而聞名,而歐幾里得則是幾何學之父。然而,沒有更多的背景信息,很難確定具體是哪一位作者。
讓我們考慮一下歷史背景。如果這是一份古希臘手稿,它可能是在公元前5世紀至公元2世紀之間寫成的,這一時期正是古典希臘文明的鼎盛時期。這一時期的學者不僅在數(shù)學和哲學領域做出了重要貢獻,還在天文學、醫(yī)學和修辭學等領域有所建樹。
然而,我也可能忽略了顯而易見的線索。手稿中是否有任何獨特的符號或術語可以明確指向某個特定的作者或學派?我注意到一些類似于歐幾里得《幾何原本》中的命題陳述,這使我更加傾向于認為這可能是歐幾里得的作品。
但且慢,還有一個想法:這份手稿可能是中世紀時期對古希臘作品的注釋或解釋。中世紀的學者經(jīng)常研究和注釋古典文本,有時會添加自己的見解和解釋。手稿中的旁注和參考編號可能正是這種學術傳統(tǒng)的產(chǎn)物。
為了驗證這一點,我可以將手稿中的語言和術語與已知的古典希臘文本進行比較。如果它與歐幾里得或亞里士多德的著作相符,這將支持我的假設。然而,沒有外部資源,我必須依賴自己的知識。
回顧手稿,我看到一個段落以“Ουκ ουν”(意為“因此不是”)開頭,這在邏輯推理中是典型的表達方式。這可能表明作者在進行某種形式的辯證法,這是亞里士多德等哲學家常用的論證方式。
綜合所有這些線索——希臘字母、數(shù)學和哲學術語、邏輯推理的結構——我傾向于認為這份手稿是亞里士多得斯的自然哲學或數(shù)學著作的一部分??紤]到亞里士多得斯對多個學科的廣泛影響,這似乎合乎情理。
然而,我仍不完全確定。為了更精確,我應該考慮這份手稿是否可能屬于其他古典作者,如柏拉圖或赫拉克利特。然而,柏拉圖的著作更多是對話形式,而赫拉克利特的著作則以 fragmentary(片段式) 和隱晦著稱,這似乎與手稿的系統(tǒng)性結構不太相符。
因此,經(jīng)過深思熟慮,我得出結論:這份手稿很可能是亞里士多得斯的自然哲學或數(shù)學著作的一部分。其系統(tǒng)性的結構、技術性語言和邏輯推理與亞里士多得斯的寫作風格一致,使這一結論顯得合情合理。
\boxed{\text{這份手稿很可能是亞里士多得斯的自然哲學或數(shù)學著作的一部分。}}
第二個則是幾何原本的問題,小編在網(wǎng)上找到一份幾何原本的手稿照片,發(fā)給 Kimi 視覺思考版,看它如何一步一步,引人入勝地推理,這次不失所望,推理成功!
圖片
圖片
好的,讓我們一步步來解決這個問題。我手中有一張打開的書頁照片,書中包含一些幾何圖形和文字說明。我的任務是推測這本書的作者,并具體說明書中所講述的內(nèi)容。
首先,我仔細觀察這張照片。這是一本舊書,書頁已經(jīng)泛黃,顯得十分古老。書頁上有一些手繪的幾何圖形,主要是圓和三角形,還有一些彩色的陰影部分。書頁上的文字是英文,但有些地方不太清晰。我注意到有“BOOK III. PROP. XXI. THEOR.”和“BOOK III. PROP. XXII. THEOR.”的字樣,這表明這是第三卷中的第二十一和第二十二個命題。
從這些信息來看,這似乎是一本幾何教科書,可能是在講解歐幾里得幾何。但為了更準確地確定作者和內(nèi)容,我需要進一步分析。
首先,關于作者。提到“BOOK III”讓我聯(lián)想到歐幾里得的《幾何原本》,這是歷史上最著名的幾何教科書之一。然而,歐幾里得的《幾何原本》共有13卷,而這里的書頁編號為104和105,不太可能是《幾何原本》的直接版本,因為《幾何原本》的卷數(shù)通常不會這樣編號?;蛟S這是一本基于《幾何原本》的后續(xù)教科書。
接著,我仔細觀察書頁上的內(nèi)容。在“BOOK III. PROP. XXI. THEOR.”下方,有一個命題:“THE angles ( ) in the fame fegment of a circle are equal.” 這里的“fame fegment”可能是指“same segment”。因此,命題的意思是:在同一個圓弧所對的圓周角相等。這與歐幾里得《幾何原本》第三卷中的命題非常相似,特別是命題21。
再看“BOOK III. PROP. XXII. THEOR.”,命題是:“THE opposite angles and of any quadrilateral figure in?cribed in a circle, are together equal to two right angles.” 這個命題的意思是:任何內(nèi)接于圓的四邊形的對角之和等于兩個直角。這與歐幾里得《幾何原本》第三卷中的命題22完全一致。
綜上所述,這本書很可能是基于歐幾里得的《幾何原本》編寫的教科書,具體講解了圓的性質和相關的幾何定理。書中的命題和圖形與《幾何原本》第三卷中的內(nèi)容高度吻合,因此可以推測這本書的作者可能是歐幾里得,或者是一本基于歐幾里得《幾何原本》的后續(xù)教科書。
讓我嘗試將這段文字變得更加清晰和優(yōu)雅:
---
“在圓的同一段弧中,這些角( )相等?!?
接下來的部分:
“在圓內(nèi)接的任意四邊形中,對角線所夾的角之和等于兩個直角?!?
盡管某些字母的古體形式略顯晦澀,但依稀可以辨認??雌饋?,這本書在討論圓內(nèi)接角和圓內(nèi)接四邊形的性質。
現(xiàn)在,讓我們回顧一下幾何學的歷史。歐幾里得的《幾何原本》深入探討了這些主題,尤其是第三卷,專門討論圓的性質。這些命題與歐幾里得的《幾何原本》第三卷中的命題21和22非常相似。
然而,為了確保結論的準確性,我們不妨再仔細檢查一下。歐幾里得的《幾何原本》第三卷確實涵蓋了圓內(nèi)接角和圓內(nèi)接四邊形的性質。命題21指出,在圓的同一段弧中,圓內(nèi)接角相等。命題22則指出,在圓內(nèi)接四邊形中,對角線所夾的角之和等于兩個直角。
鑒于此,這本書很可能在討論歐幾里得的《幾何原本》第三卷中的命題。但是否可以斷定作者就是歐幾里得呢?考慮到這些書頁的年代久遠和內(nèi)容的相似性,這似乎合情合理。然而,我們?nèi)孕柚斏?,因為這些內(nèi)容也可能是后來對歐幾里得作品的注釋或改編。
為了進一步驗證,我們不妨看看是否有任何額外的線索。書頁上有一些注釋和符號,如“Q. E. D.”,這是“quod erat demonstrandum”的縮寫,意為“證畢”,這是歐幾里得證明中常用的表達。此外,圖示的風格和命題的表述方式與歐幾里得的風格相符。
然而,仍有一個疑慮:如果這是歐幾里得的《幾何原本》,為何卷數(shù)不是連續(xù)的?或許這是一本特定的版本,只包含某些卷,或者是一本練習本,其中包含了這些命題的練習。
綜上所述,根據(jù)這些命題的內(nèi)容、歷史背景以及書頁的年代特征,我傾向于認為這本書的作者是歐幾里得,內(nèi)容涉及他的《幾何原本》第三卷中的命題,特別是命題21和22,討論圓內(nèi)接角和圓內(nèi)接四邊形的性質。
\boxed{\text{這本書很可能是歐幾里得的《幾何原本》第三卷,討論圓內(nèi)接角和圓內(nèi)接四邊形的性質。}}
---
希望這段文字能夠更加流暢和優(yōu)美地表達你的思考過程。
讓我換個思路。或許這并不是歐幾里得的著作,而是其他古典幾何學家的作品,如阿波羅尼奧斯或阿基米德。然而,阿波羅尼奧斯以其圓錐曲線的研究而著稱,而阿基米德則更多涉獵微積分和力學,因此他們的著作可能不會如此集中于基礎的圓的性質。
另一種可能是,這是一本文藝復興時期或更晚時期的教科書,采用了古典方法。圖示的風格似乎更符合那個時期的特征。
然而,我仍傾向于認為這是歐幾里得的《幾何原本》,因為其對圓的性質的系統(tǒng)性處理在幾何學教科書中獨具一格。
至于內(nèi)容,根據(jù)命題,書中討論了圓內(nèi)接角的相等性以及圓內(nèi)接四邊形對角的性質。具體而言:
- **命題21**:在圓的同一段弧中,所有圓內(nèi)接角都相等。
- **命題22**:在圓內(nèi)接四邊形中,對角的和等于兩個直角。
這些性質對于理解圓的幾何至關重要,是歐幾里得《幾何原本》中建立的更廣泛幾何原理的基石。
綜上所述,經(jīng)過深思熟慮并排除其他可能性后,我得出結論:這本書的作者很可能是歐幾里得,內(nèi)容涉及《幾何原本》第三卷中的圓的性質,特別是圓內(nèi)接角和圓內(nèi)接四邊形的性質。
\boxed{\text{這本書是歐幾里得的《幾何原本》第三卷,討論了圓內(nèi)接角和圓內(nèi)接四邊形的性質。}}
5.寫在最后:Kimi也許會顛覆K12賽道
這次k1模型的模型,真的可以說是對于月之暗面來說意義不同尋常。從下半年月之暗面k0-math的發(fā)布再到底層推理架構的開源,再到此次k1模型的發(fā)布,我們看到了一個從追趕OpenAI的Kimi正在發(fā)生新的變化:
Kimi似乎在追趕中找到了很多產(chǎn)品的創(chuàng)新,也找到了更多適合中國土壤的大模型產(chǎn)品的賽道和方向,k0解決數(shù)學強化推理、k1解決K12教育的拍照搜題解題的難題,這次實測,也讓小編看到了以Kimi為代表的大模型在重構教育互聯(lián)網(wǎng)產(chǎn)品的極大的可能。
但小編認為,這種能力還可以泛化,因為就在剛剛,我還用k1幫忙讀了非常專業(yè)的AI技術報告——我在微軟剛推出的phi-4模型報告中,找到一個復雜的圖表,可以直接丟給Kimi,請幫忙解讀。
k1給出了正確的最終結論:
關鍵token是指那些使成功概率變化≥0.2的token,用方框標出,并帶有表示概率變化的下標。它們與低概率token(概率≤0.1,用下劃線標出)不同,因為關鍵token對整體成功有顯著影響,而不僅僅是概率低。
好的,讓我們深入探討這張圖的解讀。首先,我們需要明確這張圖的來源和背景。這是來自微軟phi-4技術報告中的一張圖,涉及GPT-4o在MATH基準測試中的表現(xiàn)。圖中展示的是在溫度為1的情況下,不同tokens對成功概率的影響。初始成功概率為0.31,每個token根據(jù)其后獨立完成的成功概率進行著色,紅色表示\( p(\text{success}) = 0 \),藍色表示\( p(\text{success}) = 1 \)。
圖中還標出了那些使\( p(\text{success}) \)變化≥0.2的tokens,并用下劃線標出概率≤0.1的tokens,以區(qū)分關鍵tokens和低概率tokens。特別地,"negative"和"a"的token概率分別為0.31和0.12,而貪婪tokens的概率分別為0.66和0.88。
首先,我們來看圖的結構。這是一個時間序列圖,x軸表示tokens的序列位置,y軸表示成功概率\( p(\text{success}) \)。圖中有一條折線,表示隨著tokens的生成,成功概率的變化。每個token用一個點表示,顏色從紅色到藍色漸變,表示成功概率從0到1的變化。
初始成功概率為0.31,這在圖的起點處可以看到。隨著tokens的生成,成功概率在0到1之間波動。圖中標注了幾個關鍵點,這些點是關鍵tokens,它們對成功概率的影響顯著。
關鍵tokens是指那些使成功概率變化≥0.2的tokens。例如,圖中標注了"negative"和"a"這兩個tokens,它們的概率分別為0.31和0.12。這些tokens對模型的成功率有顯著影響。
此外,圖中用下劃線標出了概率≤0.1的tokens,這些是低概率tokens,與關鍵tokens區(qū)分開來。關鍵tokens雖然不一定具有最高的概率,但它們對成功概率的影響是顯著的。
圖中還提到了貪婪tokens,例如"product"和"i",它們的概率分別為0.66和0.88。貪婪tokens是指在每一步選擇概率最高的token,而不考慮整體的成功率。
為了更深入地理解這張圖,我們可以將其分為幾個部分來分析:
1. **初始狀態(tài)**:初始成功概率為0.31,這是模型在生成任何tokens之前的成功概率。
2. **tokens生成過程**:隨著tokens的生成,成功概率在0到1之間波動。每個生成的token都會影響后續(xù)的成功概率。
3. **關鍵tokens**:這些tokens使成功概率變化≥0.2。例如,"negative"和"a",它們的概率分別為0.31和0.12。這些tokens雖然不一定是最高的概率,但它們對成功率的影響是顯著的。
4. **低概率tokens**:這些tokens的概率≤0.1,用下劃線標出。它們對成功率的影響較小,但仍然可能在某些情況下起到關鍵作用。
5. **貪婪tokens**:這些是在每一步選擇概率最高的token,如"product"和"i",概率分別為0.66和0.88。貪婪策略可能會導致局部最優(yōu),但不一定能全局最優(yōu)。
通過這些分析,我們可以看到,雖然高概率的貪婪tokens在每一步看起來更優(yōu),但關鍵tokens在整體成功率上可能起到?jīng)Q定性的作用。這表明在模型的生成過程中,某些特定的tokens雖然概率不高,但對最終的成功率有顯著的正面或負面影響。
為了驗證這一點,我們可以考慮一個具體的例子。假設在生成過程中,模型面臨一個選擇:選擇一個概率為0.6的token,這個token可能會引導生成過程進入一個成功率較低的路徑;或者選擇一個概率為0.4的token,這個token雖然概率較低,但可能會引導生成過程進入一個成功率較高的路徑。關鍵tokens就像這些概率較低但對成功率有顯著正面影響的token。
因此,關鍵tokens的重要性在于它們能夠顯著改變生成過程的成功率,即使它們在每一步的概率不高。這與低概率tokens不同,后者對成功率的影響較小。
綜上所述,這張圖展示了在GPT-4o模型的生成過程中,不同tokens對成功概率的影響。關鍵tokens雖然不一定具有最高的概率,但它們對成功率的影響是顯著的,這表明在生成過程中,某些特定的tokens能夠顯著改變生成的成敗。
讓我再仔細檢查一下我對圖中信息的解讀是否準確。圖中顯示,關鍵token如“negative”和“a”對成功概率有顯著影響,而貪婪token如“product”和“i”則具有較高的概率。這表明,盡管貪婪token在每一步可能看起來更優(yōu),但關鍵token在整體成功中起著至關重要的作用。
因此,關鍵token是指那些對整體成功概率有顯著影響的token,即使它們在每一步的出現(xiàn)概率并不高。這與低概率token形成鮮明對比,后者對成功概率的影響微乎其微。
最終結論是:關鍵token是指那些使成功概率變化≥0.2的token,用方框標出,并帶有表示概率變化的下標。它們與低概率token(概率≤0.1,用下劃線標出)不同,因為關鍵token對整體成功有顯著影響,而不僅僅是概率低。
\boxed{\text{關鍵token是指那些使成功概率變化≥0.2的token,用方框標出,并帶有表示概率變化的下標。它們與低概率token(概率≤0.1,用下劃線標出)不同,因為關鍵token對整體成功有顯著影響,而不僅僅是概率低。
所以Kimi的持續(xù)創(chuàng)新,帶來的想象空間將會越來越大,不止K12的拍照搜題,所有知識類的工具可能都會被k1重塑!
最后,正如網(wǎng)友所說:Kimi,大模型國產(chǎn)之光,加油!