Kimi官宣,國內首個對標OpenAI的數(shù)學模型來了
一年前,Kimi憑借其“長文本”功能迅速占據(jù)市場,成為中國首個因技術創(chuàng)新而廣受歡迎的AI應用。如今,Kimi再次迎來技術的重大升級。11月16日,在Kimi正式上線一周年之際,月之暗面發(fā)布了最新數(shù)學模型k0-math。
圖片
k0-math的卓越表現(xiàn)
在多項基準能力測試中,k0-math的數(shù)學能力已經(jīng)能夠與全球領先的OpenAI o1-mini和o1-preview模型相媲美,甚至在中考、高考、考研及入門競賽題MATH等四個數(shù)學基準測試中超越了它們。特別是在MATH測試中,k0-math得分為93.8,超過o1-mini的90分和o1-preview的85.5分,僅次于未開放使用的o1完全版94.8分。
技術特色與優(yōu)勢
k0-math是Kimi推出的首款推理能力強化模型,它采用了強化學習和思維鏈推理技術,這兩項技術也是OpenAI o1系列背后的關鍵技術。通過模擬人腦的思考和反思過程,k0-math顯著提升了解決數(shù)學難題的能力。即使在經(jīng)歷多次失敗后,它也能意識到之前方法的復雜性,并最終得出正確結果。月之暗面創(chuàng)始人楊植麟表示,訓練這個模型的關鍵在于其深度思考的能力,對于一些難度極高的競賽題目,k0-math能夠提供完整的解題思路,并在推導過程中不斷給出新的思路。
未來的挑戰(zhàn)與方向
盡管k0-math已經(jīng)展現(xiàn)出強大的能力,但AI技術仍處于快速迭代之中,它仍有很大的提升空間。在兩個難度更大的競賽級別數(shù)學題庫OMNI-MATH和AIME的基準測試中,k0-math的表現(xiàn)與最好的o1-mini相比尚有15%左右的差距。楊植麟指出,接下來的研究重點是提升k0-math的泛化能力,使其能在更多場景中落地使用。特別是在一些過于簡單的數(shù)學問題上,如“1+1等于幾”,k0-math可能會過度思考,這也是需要改進的地方。
月之暗面的戰(zhàn)略與布局
作為國內最受矚目的AI獨角獸之一,月之暗面此次推出k0-math,不僅是一次常規(guī)的技術發(fā)布,更是其在技術范式上的一次重大迭代。楊植麟表示,月之暗面將越來越關注基于強化學習的方法,通過“Scaling”來支撐AI技術的發(fā)展。他認為,Scaling并不是簡單地把模型做得更大,而是要找到有效的方法來平衡數(shù)據(jù)、算法和算力。
k0-math的應用前景
數(shù)學模型在教育領域有著廣闊的應用前景,k0-math可以應用于K12教育、大學教育甚至競賽培訓。此外,為了將推理模型進行更多的泛化,月之暗面還將強化學習技術應用于搜索場景,與Kimi探索版結合,顯著提升了搜索過程中的推理能力。數(shù)據(jù)顯示,Kimi探索版的搜索量是普通版的10倍,一次搜索可精讀超過500個頁面,在信息調研和分析場景中表現(xiàn)出色。
月之暗面的快速發(fā)展
過去一年多,月之暗面經(jīng)歷了飛速發(fā)展,無論是產品技術還是估值都取得了顯著進展。Kimi在10月的月活躍用戶已經(jīng)超過3600萬,并持續(xù)增長。月之暗面的多模態(tài)產品也已經(jīng)處于內測階段,預計很快會對外公布。這些動作無疑會吸引更多用戶,為公司在全球AI競賽中贏得更多優(yōu)勢。
結語
在這場全球AI競賽中,月之暗面正帶領Kimi在充滿希望和質疑的行業(yè)中不斷前行。k0-math的發(fā)布是月之暗面在AI技術領域的一次重要突破,也為公司未來的發(fā)展奠定了堅實基礎。然而,這場征程才剛剛開始,月之暗面還需要不斷探索和創(chuàng)新,才能在AI領域走得更遠。
本文轉載自 ??軍哥說AI??,作者: 軍哥說AI
