自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<sub id="c6s9b"><input id="c6s9b"></input></sub>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設置退出

馬斯克“地表最強”Grok 3炸場，競技場首超1400分

作者：量子位 2025-02-18 15:09:07

人工智能新聞

Grok 3是首個突破1400分的模型，并且在所有類別中排名第一。

剛剛，馬斯克xAI的Grok 3終于亮相（超300萬人次圍觀）！

一出道即巔峰，競技場（lmarena.ai）官方給出了這樣的評價：

Grok 3是首個突破1400分的模型，并且在所有類別中排名第一。

而且，Grok 3還是首個在10萬張（后擴展到20萬）H100集群上訓練出的模型。

在發(fā)布預告消息的時候，馬斯克就對Grok 3大力夸贊，稱其是“地球上最聰明的AI”。

發(fā)布之前，大神Karpathy獲得了搶先體驗資格，玩了兩個小時之后發(fā)長文詳述了自己的感受。

Karpathy認為，Grok-3的思考能力達到了SOTA，推理水平和o1-pro差不多，略好于DeepSeek R1和Gemini的推理模型。

如果考慮到Grok 3是一年前從頭開始訓練的，取得這樣的成績屬實不可思議。

并且對于數(shù)字母、小數(shù)比大小這些經典大模型“難題”，Grok 3在開啟推理之后也都正確解決。

不過也人質疑Grok的地位，有一位仿冒老黃的網友說，Grok 3即便真的是最強，也最多只能強一周。

加上OpenAI也劇透了下一代GPT計劃，馬斯克和奧特曼的另一場推特大戰(zhàn)就要爆發(fā)了。

奧特曼昨晚也發(fā)推稱，GPT-4.5的測試讓他感受到了比預期更強烈的“feel the AGI”的感覺。

還有網友到評論區(qū)起哄，讓他在早上截胡馬斯克，直播發(fā)布GPT-4.5。

言歸正傳，我們來看直播都講了啥。

20萬張H100，訓出最強模型

這次直播一共有四人參與，除了馬斯克之外，較為醒目的就是坐在C位的兩位華人，他們都是xAI創(chuàng)始成員。

二人從左至右分別是：

Jimmy Ba，2023年斯隆獎得主，Hinton手下的助理教授，本科到博士都在多倫多大學。
吳宇懷Yuhuai（Tony） Wu，斯坦福大學博士后，博士畢業(yè)于多倫多大學。

而最左邊的則是Igor Babuschkin，是xAI的一位工程師。

四人先是介紹了Grok 3的訓練歷程。

去年馬斯克劇透，Grok 3在10萬張H100上進行訓練，是首個達到如此訓練集群規(guī)模的模型。

當時就有網友稱這簡直是神經網絡的超級工廠。

今天的發(fā)布會上又透露，到訓練進行到第92天時，集群規(guī)模擴展到了20萬卡。

如此強大算力，xAI也是緊跟潮流在Grok 3中推出了思維鏈推理能力。

在此前迪拜的一場峰會上，馬斯克高調宣稱：

Grok 3具有強大推理能力，聰明程度超越目前所有已知模型。

這一波Grok 3有滿血和mini兩個版本，在數(shù)學、科學、代碼等數(shù)據(jù)集上表現(xiàn)均超過了GPT-4o、DeepSeek-V3等非推理模型。

并且Grok 3早期還化名“巧克力”打榜LMSYS，一舉奪魁并成為唯一一個得分超1400的模型。

在Grok 3和mini的基礎之上，xAI團隊還打造了兩款推理模型。

其中基于mini的推理模型（Grok 3 mini Reasoning）已經比較成熟，而基于滿血版的推理模型（Grok 3 Reasoning Beta）還處在Beta階段。

介紹成績之前，四人用馬斯克的賬號先讓Grok跑了兩個案例，分別和物理學以及游戲相關。

生成一段代碼，為從地球降落在火星，然后在下一個發(fā)射窗口返回地球的發(fā)射繪制三維動畫圖表。

生成的過程中，有人開玩笑說什么時候能把Grok裝到SpaceX的火箭上，馬斯克也回應說可能再過2年。

馬斯克還表示，如果一切順利，SpaceX將在大約2025年11月左右，也就是下一個地球-火星轉移窗口期，用星艦把擎天柱機器人送上火星。

說回Grok，在考慮了開普勒定律并將其轉化為代碼之后，最終生成了可以繪制出這樣的動畫的代碼：

第二個問題開啟了Big Brain模式，會讓模型用更多的計算資源去做更多的思考。

題目要求則是使用pygame組件，設計一款游戲，把俄羅斯方塊和寶石迷陣縫合到一起。

同時還提示代碼可能會很長，需要保存到一個文件當中，并且要“insanely great”。

而Grok 3也不負眾望，把這兩款游戲成功結合，并介紹了合體版游戲的特點：

運行起來是醬嬸兒的，既有俄羅斯方塊的消除機制，又根據(jù)寶石迷陣的特點調整成了三個方塊消除一次。

再來看跑分結果，在數(shù)學、科學和代碼任務中，兩者都取得了不俗的成績。

并且如果讓他們“多思考”（柱狀圖上方淺色部分）之后，表現(xiàn)超越了DeepSeek-R1和高配版o3-mini。

不過，目前很多模型都在Benchmark上出現(xiàn)了“過擬合”的現(xiàn)象，那么Grok 3的實際表現(xiàn)究竟咋樣呢？

研發(fā)團隊讓它們挑戰(zhàn)了今年AIME 2025競賽的試題，結果Grok-3 Reasoning Beta和mini Reasoning分別取得了93和90分的成績，力壓其他推理模型。

除了Grok 3預訓練模型和兩個推理模型之外，這次xAI團隊還發(fā)布了一個AI Agent，叫做DeepSearch。

這個功能可以看做是xAI對OpenAI、谷歌等陸續(xù)推出的Deep Research功能的對標。

簡而言之，DeepSearch通過掃描互聯(lián)網和X來分析信息，并提供摘要來回答問題。

至于權限方面，X的Premium+用戶今日起可以體驗Grok 3。

獨立APP上，則需要訂閱SuperGrok——30美元/月或300美元/年。

發(fā)布過程一波三折，語音模式推遲上線

而縱觀Grok 3問世的整個過程，也可謂是一波三折。

去年8月，馬斯克接受知名訪談博主Lex Fridman采訪時曾說過，Grok 3在有望當年年底發(fā)布。

結果一直到今年1月19號，第一個測試實例才終于被公布，實際發(fā)布更是拖到了現(xiàn)在。

并且就在發(fā)布前的周末，xAI團隊還在對Grok 3進行緊急打磨。

xAI員工也現(xiàn)身說法，周日晚11:30（北京時間周一下午3:30，也就是發(fā)布前不到24小時）發(fā)帖表示還在熬夜趕工。

甚至到了發(fā)布會前一個半小時，馬斯克突然宣布原本打算發(fā)布的語音功能需要延期。

馬斯克發(fā)推稱，語音模式還有些不穩(wěn)定，需要推遲到一周之后。

現(xiàn)場QA環(huán)節(jié)也有網友提問具體發(fā)布時間，團隊的回答是“很快會上線一個早期版本，然后逐步迭代”。

不過，同屬馬斯克旗下的Neuralink高管Shivon Zilis曾體驗過1個小時的Ara，并在北京時間今早發(fā)布了她的體驗感受。

Shivon表示，那是她一生中最意外、最有意義的時刻之一。

她和Ara聊了生物學、量子糾纏等話題，還讓Ara出題檢驗她的學習效果。

結果Shivon只答對了一半的問題，但Ava非常耐心地向她解釋了其余的問題，而且并不會嫌問題問得過于愚蠢。

當時還有人在評論區(qū)追問，Ara是語音版本嗎，Shivon給出了肯定的回答。

尋求100億美元新融資，還要進軍游戲

事實上，老馬選擇此時發(fā)布Grok 3難免有一點微妙。

就在上周五，彭博社爆料xAI正尋求一輪約100億美元的新融資，公司估值達到約750億美元（5454.6億元人民幣）。

現(xiàn)有投資者包括紅杉資本、Andreessen Horowitz以及Valor Equity Partners，正在洽談參與此次融資。

由于還沒有最終敲定，新模型的發(fā)布大概率將對本輪融資產生一定影響。

一旦上述消息得到確認，顯然xAI的融資速度實在有點驚人了。

去年12月底，這家公司才剛完成了一輪60億美元的C輪融資，當時公司估值510億美元。

短短不到兩個月，公司估值直接漲了約47%。而且再往前推，從B輪到C輪的融資，更是實現(xiàn)了半年內估值翻倍。

可以說，僅成立不到兩年的xAI，已經成長為OpenAI的強大對手。

而有了充足資金的xAI，除了繼續(xù)發(fā)展模型，也官宣了其他方向——

押注游戲領域，成立AI游戲工作室。

這一消息最早在去年11月老馬就透露了，當時他吐槽“過多游戲工作室掌握在大型企業(yè)手中”。

這下，老馬的商業(yè)版圖又將擴展了。

One More Thing

就在Grok 3發(fā)布前幾日，還有一件非常抓馬的事引起熱議。

一位xAI工程師（現(xiàn)在是前員工了）公開發(fā)帖將Grok 3與其他幾個競品的代碼能力進行了對比。

雖然清晰標注了這是個人觀點，但顯然他將自家模型Grok 3排在第4位（前三名都是OpenAI模型）的做法還是惹來了爭議。

隨后該員工爆料稱，公司要求他要么刪帖，要么被解雇，理由是這條帖子暴露了Grok 3的存在。

一聽這話，小哥覺得有點扯，畢竟Grok 3大家早就知道了，而且還甩出了馬斯克之前的發(fā)言截圖。

面對著xAI的這波小心眼，小哥也直接不慣著，帶著一篇洋洋灑灑的小作文，決定辭職了。

我會保持我的言辭和尊嚴，找另一份工作，或者自己創(chuàng)業(yè)?；仡^見。

對于這件事，老馬后來也回應了“這很奇怪”，但后續(xù)沒有更多動作傳出。

更戲劇的是，由于對工資支付產生爭議，小哥后來再次公開發(fā)帖艾特老馬：

請做正確的事。

不過，雖然已經“分手”，但參與了Grok 3語音模式的小哥還是不計前嫌，多次幫忙宣傳Grok 3。

并且今天老馬宣布延期的語音模式，也是這位小哥所在團隊的工作成果，即便已經離職，小哥依然對這項工作感到自豪。

話說回來，你覺得這次的Grok 3如何？等到下一代GPT發(fā)布之后，老馬還能繼續(xù)保持領先嗎？

責任編輯：張燕妮來源：量子位

模型 AI 數(shù)據(jù)

51CTO技術棧公眾號

業(yè)務
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學堂精培企業(yè)培訓 CTO訓練營

<pre id="pbjq9"></pre>

<acronym id="pbjq9"></acronym>

<center id="pbjq9"></center>