自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<s id="cviga"><li id="cviga"></li></s>

<legend id="cviga"></legend>

<cite id="cviga"></cite>

<sup id="cviga"></sup>

^{<blockquote id="cviga"></blockquote>}

<s id="cviga"></s>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

小模型界o1來了：微軟推出Phi-4，數(shù)學(xué)推理能力太逆天！14B模型擊敗GPT-4o！還印證了AI墻的一個重要推斷原創(chuàng)

51CTO技術(shù)棧

發(fā)布于 2024-12-13 13:52

瀏覽

0收藏

編輯 | 伊風(fēng)

出品 | 51CTO技術(shù)棧（微信號：blog51cto）

家人們，微軟Phi-4的數(shù)學(xué)能力太逆天了。誰看了不感慨一句：小模型才是未來！

8個月前，微軟發(fā)布了Phi-3，性能超過龐然大物L(fēng)lama-3，狠狠驚艷了我們一把。

8個月后，Phi-4飛躍式突破，讓所有人知道誰才是小模型唯一的王！

小模型界o1來了：微軟推出Phi-4，數(shù)學(xué)推理能力太逆天！14B模型擊敗GPT-4o！還印證了AI墻的一個重要推斷-AI.x社區(qū) 圖片

自幾個月前o1發(fā)布后，模型“搞定”數(shù)理化的能力已經(jīng)飛升到博士級別，大模型也紛紛在推理能力上進(jìn)行追趕。

而Phi-4祭出了小模型的王炸，14B小小模型，在數(shù)學(xué)推理上竟然反超多模態(tài)大模型Gemini Pro 1.5 兩分之多！

小模型界o1來了：微軟推出Phi-4，數(shù)學(xué)推理能力太逆天！14B模型擊敗GPT-4o！還印證了AI墻的一個重要推斷-AI.x社區(qū) 圖片

在「AI撞墻」被熱烈討論的一天，微軟另辟蹊徑，似乎告訴AI公司：別再傻傻地Scaling了！

1.14B小模型，也能懂?dāng)?shù)學(xué)推理！

Phi-4確實可以進(jìn)行思維推理！

在微軟給的案例中，Phi-4在解題過程中展現(xiàn)了清晰的推理鏈條，成功解決了蝸牛難題！

小模型界o1來了：微軟推出Phi-4，數(shù)學(xué)推理能力太逆天！14B模型擊敗GPT-4o！還印證了AI墻的一個重要推斷-AI.x社區(qū) 圖片

問題：在一場由 5 只蝸牛參加的比賽中，最多可能出現(xiàn)一場平局，但平局可以涉及任意數(shù)量的蝸牛。例如，比賽結(jié)果可能是 Dazzler 獲得第一名，Abby、Cyrus 和 Elroy 并列第二，Bruna 獲得第五名。那么，比賽的可能結(jié)果總共有多少種？

Phi-4根據(jù)題干，先計算了沒有平局出現(xiàn)的情況，為120種。

然后在有一場平局的情況中，繼續(xù)按照“選擇 k 只蝸牛組成平局組”的思路分解問題，最終得出了正確回答。

這一能力表明，Phi-4在科學(xué)研究、工程和金融建模等領(lǐng)域未來可期！

也讓我們對端側(cè)模型的未來更加期待了！對于許多應(yīng)用來說，這種針對性的卓越性能比大型模型的廣泛但較低效的能力更有價值得多。

2.模型訪問：azure獨家首發(fā)，下周登陸抱抱臉

比較可惜的是，Phi-4目前的可用性有限。

獨家首發(fā)在了微軟自家的Azure AI Foundry上使用，更多的面向科研用途。地址：

??https://ai.azure.com/explore/models?&selectedCollectinotallow=phi??

不過，按照計劃下周會在Hugging Face平臺上線。

這也算是微軟在用Phi-4這張王牌，給Azure AI Foundry“引流”了。

Azure AI Foundry在去年推出，作為一個集中管理的中心，旨在幫助企業(yè)級用戶管理項目、微調(diào)AI模型，并訪問Azure AI服務(wù)。

在Phi-4技術(shù)報告中，還提到了該平臺獨特的內(nèi)容安全功能。主要包括：

Prompt Shields（提示保護(hù)）：幫助應(yīng)對潛在的提示攻擊。
受保護(hù)內(nèi)容檢測：識別敏感或受限制的材料。
Groundedness Detection（扎實性檢測）：確保生成內(nèi)容有據(jù)可依。

3.AI墻絕不是危言聳聽：已逼近預(yù)訓(xùn)練數(shù)據(jù)墻！

在Phi-4的報告中，Phi系列在性能上的“極致一躍”，被歸功于合成數(shù)據(jù)和后期訓(xùn)練的提高和改進(jìn)。

“在數(shù)學(xué)推理方面，Phi-4 的表現(xiàn)優(yōu)于同類和更大型的模型，這得益于整個流程的進(jìn)步，包括高質(zhì)量合成數(shù)據(jù)集的使用、高質(zhì)量有機數(shù)據(jù)的整理以及后期訓(xùn)練的創(chuàng)新?！?/p>

小模型界o1來了：微軟推出Phi-4，數(shù)學(xué)推理能力太逆天！14B模型擊敗GPT-4o！還印證了AI墻的一個重要推斷-AI.x社區(qū) 圖片

Phi展現(xiàn)了模型界的一種趨勢，也反映著預(yù)訓(xùn)練的尷尬之處：大規(guī)模的預(yù)訓(xùn)練，通常需要海量的數(shù)據(jù)和計算資源。隨著硬件能力的提升和模型規(guī)模的擴大，雖然模型性能逐漸增強，但增益的邊際效應(yīng)越來越小，即每次訓(xùn)練的優(yōu)化效果趨于減弱。

Scale AI 首席執(zhí)行官Alexandr Wang周四在一條推文中說："我們已經(jīng)達(dá)到了預(yù)訓(xùn)練數(shù)據(jù)墻。"

小模型界o1來了：微軟推出Phi-4，數(shù)學(xué)推理能力太逆天！14B模型擊敗GPT-4o！還印證了AI墻的一個重要推斷-AI.x社區(qū) 圖片

國內(nèi)則更早展現(xiàn)了這個趨勢的“風(fēng)聲”。此前報道，國內(nèi)大模型“六小虎”中至少有兩家公司已經(jīng)放棄了預(yù)訓(xùn)練，開始專注于AI應(yīng)用層。

AI公司越來越認(rèn)識到，預(yù)訓(xùn)練的燒錢帶來的價值在走低，尤其是在硬件資源有限的情況下，開發(fā)大規(guī)模預(yù)訓(xùn)練模型可能難以為繼。不如守好自己的用戶，通過靈活的后期訓(xùn)練和反饋迭代，扎實地做好AI產(chǎn)品的落地。

另外，還有一個小插曲，Phi-4是微軟Phi系列核心人物布貝克（Sébastien Bubeck），被OpenAI挖走后的首次更新！

小模型界o1來了：微軟推出Phi-4，數(shù)學(xué)推理能力太逆天！14B模型擊敗GPT-4o！還印證了AI墻的一個重要推斷-AI.x社區(qū) 圖片

在 2024 年加入 OpenAI 之前，Bubeck 在微軟研究院工作了近十年，離職前為微軟的人工智能副總裁。

本文轉(zhuǎn)載自??51CTO技術(shù)棧??，作者：伊風(fēng)

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請注明出處，否則將追究法律責(zé)任

標(biāo)簽

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

微軟Copilot+PC之后還有大招！牽手GPT-4o后能力簡直王炸！奧特曼也來build現(xiàn)場了！

51CTO技術(shù)棧 ? 2738瀏覽 ? 0回復(fù)
GPT-4o 的數(shù)學(xué)又雙叕進(jìn)步了？來 MathBench 看看新版 GPT-4o 到底強在哪！

戀戀青鳥 ? 3070瀏覽 ? 0回復(fù)
現(xiàn)在，所有人都能免費用GPT-4o了！

duhorse ? 4353瀏覽 ? 0回復(fù)
如何使用GPT-4o函數(shù)調(diào)用構(gòu)建一個實時應(yīng)用程序？

51CTO內(nèi)容精選 ? 3764瀏覽 ? 0回復(fù)
GPT-4o不香了

Crystalcxt ? 2966瀏覽 ? 0回復(fù)
超越GPT-4o，Claude 3.5一夜封王！10倍編碼速度逆天，全網(wǎng)最全實測來了

duhorse ? 3947瀏覽 ? 0回復(fù)
開發(fā)者終于可以定制自己的GPT-4o了！

51CTO技術(shù)棧 ? 2231瀏覽 ? 0回復(fù)
擊敗GPT-4o、僅次于o1！英偉達(dá)重磅開源超強大模型--Nemotron

Aceryt ? 2989瀏覽 ? 0回復(fù)
重磅開源Nemotron大模型：擊敗GPT-4o、僅次于o1！

51CTO技術(shù)棧 ? 1881瀏覽 ? 0回復(fù)
阿里重磅開源QwQ-32B：自我思考、糾正，數(shù)學(xué)能力擊敗o1模型

Aceryt ? 7255瀏覽 ? 0回復(fù)
微軟 Phi-4 震撼發(fā)布：14B 參數(shù)模型性能超越一眾大模型，數(shù)學(xué)推理性能提升顯著

Syrupup ? 2551瀏覽 ? 0回復(fù)
微軟發(fā)布Phi-4，最強小模型！參數(shù)極小、超GPT-4o

Aceryt ? 1779瀏覽 ? 0回復(fù)
擊敗99.9%的程序員！o3來了！AGI測試實現(xiàn)躍升！網(wǎng)友：推理scaling law太炸了！一文回顧OpenAI直播帶貨12天

51CTO技術(shù)棧 ? 2836瀏覽 ? 0回復(fù)
微軟：GPT-4o-mini只有8B，o1-mini僅100B

PaperAgent ? 1799瀏覽 ? 0回復(fù)
微軟開源最強小模型Phi-4，超GPT-4o、可商用

Aceryt ? 1915瀏覽 ? 0回復(fù)
清華團隊靠強化學(xué)習(xí)讓 7B 模型打敗 GPT-4o 數(shù)學(xué)推理

Aceryt ? 2087瀏覽 ? 0回復(fù)
DeepSeek-R1-Distill-Qwen-1.5B 在某些基準(zhǔn)測試中超越了 GPT-4o

Halo咯咯 ? 1.0w瀏覽 ? 0回復(fù)
音樂界的DeepSeek來了！全球首個音樂推理大模型Mureka O1上線，音樂領(lǐng)域要迎來大變革了？

算家計算 ? 1218瀏覽 ? 0回復(fù)
清華發(fā)布GLM 4！32B參數(shù)模型硬剛GPT-4o，性能驚艷

Halo咯咯 ? 1754瀏覽 ? 0回復(fù)

51CTO技術(shù)棧

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

中國開源大模型新成員：小米推理大模型首秀！ 19分鐘前發(fā)布
剛剛！一場直播讓宇樹成功正名！直播G1長跑操場40圈，6萬人點贊！真實跑步水平曝光：2m/s接近天工！ 5h前發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點：替代人干真活！ 1回復(fù)

微軟突然封鎖Cursor，全面禁用C、C++、C#擴展，網(wǎng)友：理解微軟，Cursor白嫖VSCode 0回復(fù)

王炸！MCP 架構(gòu)設(shè)計深度剖析 & 使用 Spring AI + MCP 四步教你實現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

上一篇：中國工商銀行軟件開發(fā)中心多模非標(biāo)準(zhǔn)貿(mào)易影像智能識別方案

下一篇：對齊馬斯克，楊立昆稱AGI十年內(nèi)將實現(xiàn)！談未來：AI不會讓人失業(yè)，人類總有解決不完的問題

社區(qū)精華內(nèi)容

目錄

^{<blockquote id="g1du6"><i id="g1du6"></i></blockquote>}

^{<thead id="g1du6"></thead>}

<cite id="g1du6"></cite>

<s id="g1du6"><li id="g1du6"><menuitem id="g1du6"></menuitem></li></s>