DeepSeek在美超越ChatGPT!問鼎蘋果免費App第一
DeepSeek的熱,還在持續(xù)ing。
就在剛剛過去的周末,DeepSeek反超ChatGPT,一舉登頂美區(qū)蘋果應(yīng)用商店免費App排行第一!
其熱度之高,有網(wǎng)友甚至這樣描述:
我甚至都不喜歡AI助手應(yīng)用,但我已經(jīng)下載了DeepSeek。
至于原因,正是DeepSeek在前幾天開源的推理模型R1,引發(fā)了一陣又一陣的輿論熱潮。
僅僅花費560萬美元訓(xùn)練的R1,在很多AI基準(zhǔn)測試中已經(jīng)達(dá)到甚至超越OpenAI o1模型。
而且DeepSeek是真的免費,而ChatGPT雖然在免費榜上,但要是想解鎖它的完全體,還是要掏上200美元……
現(xiàn)在要是在X上搜“DeepSeek”,目之所及,處處都是“使用DeepSeek構(gòu)建一切”、“Goodbye ChatGPT”這樣的話題:
并且不止是科技圈的人在關(guān)注,例如風(fēng)險投資家Marc Andreessen就高度稱贊道:
DeepSeek R1是我見過最令人驚嘆的突破之一。
就連回應(yīng)“DeepSeek將如何盈利”這個問題中的一句話——“DeepSeek是一個小項目”,也是被網(wǎng)友們轉(zhuǎn)瘋了……
嗯,火,著實是有點火。
也剛引發(fā)一波復(fù)現(xiàn)熱潮
作為本身就是開源模型的DeepSeek R1,就在昨天還引發(fā)了一股復(fù)現(xiàn)熱潮。
這個項目就是由HuggingFace在GitHub上發(fā)起的Open R1。
項目僅僅發(fā)布2天,已經(jīng)斬獲4.2K個Star。
聯(lián)合創(chuàng)始人兼CEO Clem Delangue表示:
我們的科學(xué)團(tuán)隊已經(jīng)開始致力于完全復(fù)制和開源R1,包括訓(xùn)練數(shù)據(jù)、訓(xùn)練腳本……
我們希望能充分發(fā)揮開源AI的力量,讓全世界每個人都能受益于AI的進(jìn)步!我相信這也有助于揭穿一些神話。
而在Open R1的項目文檔中,官方進(jìn)一步表示:
這個項目的目的是構(gòu)建R1 pipeline中缺失的部分,以便所有人都能在此之上復(fù)制和構(gòu)建R1。
HuggingFace表示,將以DeepSeek-R1的技術(shù)報告為指導(dǎo),分3個步驟完成這個項目:
第1步:用DeepSeek-R1蒸餾高質(zhì)量語料庫,來復(fù)制R1-Distill模型。
第2步:復(fù)制DeepSeek用來構(gòu)建R1-Zero的純強化學(xué)習(xí)(RL)pipeline。這可能涉及為數(shù)學(xué)、推理和代碼整理新的大規(guī)模數(shù)據(jù)集。
第3步:通過多階段訓(xùn)練,從基礎(chǔ)模型過渡到RL版本。
除了復(fù)現(xiàn)潮之外,網(wǎng)友們分享的玩法也是層出不窮。
例如一個小哥分享的《用DeepSeek R1構(gòu)建一切》,手把手教你怎么做游戲、開發(fā)編程等等。
而從DeepSeek的熱度延伸出來,國貨之光的含金量還在上升:
先是DeepSeek,現(xiàn)在是Kimi k1.5……中國(大模型)的發(fā)展速度非???。
對于DeepSeek引爆的熱點話題,LeCun則站出來表示:
我們要關(guān)注的真正的點,應(yīng)該是開源模型正在超越專有模型。
DeepSeek接下來還會引發(fā)怎樣的熱潮,是值得繼續(xù)關(guān)注一波。