股票漲停、潑天流量,Kimi受寵若驚到宕機(jī):預(yù)計25日恢復(fù),200萬無損窗口實測:好用!不失優(yōu)秀、免費的國產(chǎn)大模型產(chǎn)品!
原創(chuàng) 精選編輯 | 言征、伊風(fēng)
出品 | 51CTO技術(shù)棧(微信號:blog51cto)
3月20日,Kimi概念股直接漲停。潑天的流量蜂擁而至,打得猝不及防,一時間難以接駕,以至于一大早9點半開始,Kimi就宕機(jī)了。即便月之暗面的技術(shù)團(tuán)隊已經(jīng)應(yīng)急進(jìn)行了5次擴(kuò)容,依舊對這突如其來的“寵幸”應(yīng)接不暇。月之暗面發(fā)公告稱:這種情況預(yù)計會延遲到25日。
圖片
經(jīng)《科創(chuàng)板日報》記者測試,月之暗面旗下大模型應(yīng)用Kimi的App和小程序均無法正常使用。此前,月之暗面發(fā)布情況說明:從 2024.3.20 9:30:00 開始,觀測到 Kimi的系統(tǒng)流量持續(xù)異常增高,流量增加的趨勢遠(yuǎn)超對資源的預(yù)期規(guī)劃。
這導(dǎo)致了從 2024.3.20 10:00:00 開始,有較多的SaaS客戶持續(xù)的體驗到 429:engine is overloaded的異常問題,并對此表示深表抱歉。
圖片
“作為一家以技術(shù)為導(dǎo)向的公司,我們非常理解一個API的穩(wěn)定性是能否投入實際生產(chǎn)的最關(guān)鍵因素之一,已經(jīng)有多項應(yīng)急措施正在實施,包括不限于:從3月20日觀測到流量異常增高后,已經(jīng)進(jìn)行了5次擴(kuò)容工作。推理資源會持續(xù)配合流量進(jìn)行擴(kuò)容,以盡量承載持續(xù)增長的用戶量;設(shè)計了一套更有效的SaaS流量優(yōu)先級策略,以保障付費用戶的調(diào)用穩(wěn)定,預(yù)計3月25日之前完成并上線?!?/p>
1.真正讓用戶用得爽的大模型對話:開啟“長文本”時代
3月18日,月之暗面宣布了最新的重大技術(shù)升級:上下文窗口由20萬字提升10倍到200萬字。200萬字,這是怎樣一種概念?
對于愛閱讀的朋友而言,相當(dāng)于2~3套《三體》全本,對于學(xué)法律的朋友而言,則相當(dāng)于117部憲法的長度,對于高中生而言,相當(dāng)于一下70本語言教材。
這些只是數(shù)字,更為打動人的是,這么長的窗口才是大家使用生成式AI產(chǎn)品“最舒服”的窗口長度,月之暗面(現(xiàn)在已改名Kimi大模型)已經(jīng)找到了這個臨界尺寸。
200萬字的無損上下文窗口是符合用戶使用習(xí)慣的臨界點。太短的上下文窗口限制很難迎合用戶一次就想搞定解決問題的沖動和習(xí)慣。
這樣就可以批量處理涉及諸如比較、總結(jié)、概括、篩選等許多頻繁的文字處理工作,這一點是找對了用戶使用場景的痛點。
來源:AIGCLINK
而擁有200萬字以后,體驗就變得非常耳目一新了。Kimi 可以幫HR批量篩選出符合條件人才簡歷,可以幫研究人員快速整理多篇相關(guān)論文的創(chuàng)新點等等。
2.Kimi:總結(jié)歸納的利器
3月,Kimi Chat改名為Kimi智能助手,同時Moonshot大模型改名為Kimi大模型?!耙院笾灰涀imi就夠了!”
打開Kimi官網(wǎng),你會發(fā)現(xiàn)非常多與其他大模型產(chǎn)品的不同之處,其中最為明顯的就是它可以支持上傳多達(dá)50個100M以內(nèi)的文件,這個要比國內(nèi)外大多數(shù)大模型產(chǎn)品都要牛逼。
圖片
Kimi的主要功能是進(jìn)行基于文本的信息檢索、數(shù)據(jù)分析、語言翻譯等工作。雖然支持上傳圖片格式的文件,但仍然圍繞著文字提取和總結(jié),并非提供多模態(tài)功能。
圖片
3.實測:RAG技術(shù)非常友好
Kimi采用的RAG檢索增強(qiáng)生成(Retrieval-Augmented Generation)技術(shù),這一技術(shù)能讓Kimi根據(jù)用戶提供的prompt進(jìn)行網(wǎng)頁搜索,獲得更多參考資料以提升生成回答的精確度和內(nèi)容質(zhì)量。
圖片
從上面的案例可以看到,擁有RAG能力的Kimi可以幫助用戶降低搜索信息的成本,同時搜索使得Kimi大模型能夠訪問最新的外部數(shù)據(jù),保證回答內(nèi)容的時效性。
由于網(wǎng)頁內(nèi)容的多樣性和理解復(fù)雜語言帶來的困難,Kimi對搜索信息的總結(jié)不能排除幻覺出現(xiàn)的可能。但是他提供的資料讓用戶可以方便的追溯到具體的信息源,從而對AI生成內(nèi)容進(jìn)行檢查和優(yōu)化。
4.比ChatGPT好用?
正如AIGCLINK社區(qū)測評后對升級后的Kimi所說, 最大的亮點還是超長文本窗口,實測并沒有外界所說的神乎其神,要客觀看待!
圖片
同時,實測視頻中也指出,Kimi在英文翻譯能力不如ChatGPT。
當(dāng)然, 也有資深的AI研究人士表示,Kimi對于數(shù)學(xué)題,也并不那么擅長。
圖片
小編也實測了一道奧數(shù)題,文心一言答對了,但Kimi似乎有點把自己整懵了。
圖片
然后,推理能力也不太擅長。
圖片
同樣的問題,放在通義千問,得到了正確的回答。
圖片
據(jù)悉,有字節(jié)的朋友也曬出測評:1萬長度的時候就開始出現(xiàn)幻覺了!
圖片
5.不一樣的Kimi:年輕、技術(shù)信仰、最晚考慮商業(yè)化
2024年,是大模型公司落地、應(yīng)用之年,大模型CEO們從開年之后,就一直處于理想與現(xiàn)實的劇烈拉扯之間,中國互聯(lián)網(wǎng)素來充斥著商業(yè)化的聲音,而這位月之暗面卻非常獨特:AI研究員背景的年輕創(chuàng)始人、頭部國產(chǎn)大模型獨角獸中人數(shù)最少的一家(只有80人),沒有選擇對手們認(rèn)為更穩(wěn)妥的to B生意,也沒有在在醫(yī)療和游戲等細(xì)分場景中找機(jī)會,而是選擇做且只做了一款to C的對話產(chǎn)品——智能助手Kimi,沒錯,Kimi也是楊植麟的英文名。值得感嘆的是,楊植麟傾向于將他的公司看作是構(gòu)建一個結(jié)合科學(xué)、工程和商業(yè)的系統(tǒng)。
3月中旬,Kimi迎來了重大升級,上下文窗口已經(jīng)支持200萬漢字輸入,這一下點燃了用戶對于生成式AI技術(shù)的使用熱情。(最新的Geimni 1.5,也只有100萬tokens)
圖片
6.寫在最后:大模型應(yīng)用落地的兩個條件
月之暗面是AI領(lǐng)域新秀,也是資本的寵兒。之所以能贏得資本熱捧,錨定長文本無損壓縮是其中關(guān)鍵因素之一。固然在數(shù)學(xué)解題和多模態(tài)能力暫缺或稍弱,但其長文本處理能力卻的確讓人眼前一亮。
楊植麟曾公開表示,長文本作為公司“登月”的第一步,是新的計算機(jī)內(nèi)存,很本質(zhì),個性化并非通過微調(diào)實現(xiàn),上下文定義了個性化過程。楊植麟還認(rèn)為,大模型“馬拉松剛開始,接下來會有更多差異化”。
銀河證券認(rèn)為,2024年AI應(yīng)用元年有兩個條件:1、大模型達(dá)到可使用狀態(tài):這點從Kimi用戶好評如潮中可以看出;2、大模型公眾可觸達(dá):目前Kimi已經(jīng)面向全社會開放使用。Kimi智能助手是AGI進(jìn)程中的不可忽視的地標(biāo)之一,或許意味著大模型將正式進(jìn)入“長文本時代”。
期待未來Kimi給我們帶來的驚喜:“每一次,都集中全力!”