自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<tr id="soybi"></tr>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

谷歌首款混合推理Gemini 2.5登場，成本暴降600%！思考模式一開，直追o4-mini

作者：新智元 2025-04-18 10:36:42

谷歌發(fā)布首款混合推理模型Gemini 2.5 Flash，引入了革命性「思考預(yù)算」，可靈活控制推理深度，性能一舉擊敗Claude 3.7，比肩o4-mini。而且，關(guān)閉思考模式成本直降600%。

剛剛，谷歌重磅發(fā)布首個混合推理模型——Gemini 2.5 Flash。

與Claude類似，新模型的「思考預(yù)算」可以自定義，即可開啟/關(guān)閉Gemini 2.5的思考模式。

圖片

值得一提的是，關(guān)閉思考的成本直接暴降600%，而且性能還不輸Gemini 2.0 Flash。

具體來說，Gemini 2.5 Flash關(guān)閉思考輸出價格0.6美元/百萬token，開啟思考輸出價格3.5美元/百萬token。

圖片

當(dāng)然了，思考越久，模型性能也會隨之提升。

在GPQA知識問答中，新模型24k思考預(yù)算，性能提升了6%；對于代碼任務(wù)（LiveCodeBench），16k思考預(yù)算性能最佳。

	圖片

在多項(xiàng)基準(zhǔn)測試中，Gemini 2.5 Flash再次刷新SOTA。在大模型排行榜中，F(xiàn)lash預(yù)覽版以1392 ELO高分位居第二，與GPT-4.5-preview、Grok 3并駕齊驅(qū)。

圖片

在數(shù)學(xué)（AIME 2025/2024）、多模態(tài)推理（MMMU）、知識問答（GPQA）等基準(zhǔn)上，Gemini 2.5 Flash完全碾壓Claude 3.7 Sonnet，足以與最新o4-mini相媲美。

就模型每百萬token輸入/輸出價格來看，Gemini 2.5 Flash更具性價比。

圖片

在人類最后一次考試中，Gemini 2.5 Flash拿下12.1%高分，僅次于o4-mini

目前，F(xiàn)lash預(yù)覽版可以在Gemini中使用，API同時向開發(fā)者開放。

首款混合推理Gemini登場擊敗Claude 3.7

混合推理模型，就是專為需要在性能、成本、延遲之間找到完美平衡的開發(fā)者而設(shè)計(jì)。

Gemini 2.5 Flash不僅繼承了2.0 Flash的高速響應(yīng)特點(diǎn)，還引入了革命性的「思考模式」——可根據(jù)任務(wù)需求靈活調(diào)整推理深度。

圖片

Gemini 2.5系是「思考模型」，能夠在回答前先行推理。

模型不會立即輸出結(jié)果，而是先執(zhí)行「思考」流程，更好地理解提示詞，拆解復(fù)雜任務(wù)并規(guī)劃回答。

如下圖所示，相較于2.0 Flash，Gemini 2.5 Flash在復(fù)雜任務(wù)，如數(shù)學(xué)推理、科研分析中表現(xiàn)更優(yōu)異。

圖片

在LMArena其他評估中，比如Hard Prompts、編碼、長查詢，Gemini 2.5 Flash全部拿下第一。

圖片

另外從下圖中可看出，在同類模型中，2.5 Flash以超高性價比領(lǐng)跑，兼具最優(yōu)性能和極低成本的優(yōu)勢。

圖片

網(wǎng)友實(shí)測

在網(wǎng)友的實(shí)測中，2.5 Flash物理模擬能力足夠驚艷，小球會隨著多邊形變化精準(zhǔn)運(yùn)動。

圖片

圖片

而且，2.5 Flash還輕輕松松通過了4o-mini/o3無法通過的Galton Board（高爾頓板）測試。

圖片

圖片

它還能根據(jù)精靈圖，創(chuàng)建出自定義游戲城房間。

圖片

另一位網(wǎng)友用了最大24k預(yù)算，讓2.5 Flash設(shè)計(jì)出了一個《創(chuàng)：戰(zhàn)紀(jì)》風(fēng)格的游戲。

圖片

提示：Create Design a visually striking Tron-style game in a single HTML file, where AI-controlled light cycles compete in fast-paced, strategic battles against each other

如今Claude 3.7已經(jīng)完全沒有優(yōu)勢了，在設(shè)計(jì)登錄界面時，Gemini 2.5 Flash用時最短速度最快。

圖片

思考預(yù)算智能控制

不同使用場景在質(zhì)量、成本與延遲之間各有取舍。

為給開發(fā)者更大靈活性，2.5 Flash新增了「思考預(yù)算」功能。開發(fā)者可以通過設(shè)置預(yù)算（0 – 24576 Token），來控制模型在思考階段的推理深度。

低預(yù)算（甚至為0）：適合簡單查詢，保持2.0 Flash超低延遲和成本，性能更強(qiáng)
高預(yù)算：模型會進(jìn)行更深入的推理，生成更準(zhǔn)確、全面的答案。

需要強(qiáng)調(diào)的是，預(yù)算只是設(shè)定了2.5 Flash的思考上限；若prompt并不復(fù)雜，模型不會用滿全部預(yù)算。

圖片

開發(fā)者也可通過API參數(shù)，或在Google AI Studio與Vertex AI控制臺的滑塊控件，為思考階段指定具體的Token預(yù)算

更智能的是，模型會根據(jù)prompt復(fù)雜度，自動判斷所需推理量和思考時間，避免了預(yù)算的浪費(fèi)。

以下示例中，展示了2.5 Flash在默認(rèn)模式下，可能使用的推理量。

需要低推理量的提示詞：

示例1：

「Thank you」的西班牙語表達(dá)

示例2：

加拿大有多少個?。?/span>

需要中等推理量的提示詞：

示例1：

擲兩枚骰子，點(diǎn)數(shù)之和為7的概率是多少？

示例2：

我的健身房在周一、三、五9?15點(diǎn)以及周二、周六14?20點(diǎn)開放籃球自由場地。如果我每周工作5天、時間為9?18點(diǎn)，但想在工作日打5小時籃球，請為我制定一份可行的日程表。

需要高推理量的提示詞：

示例1：

一根懸臂梁，長度L=3 m，矩形截面寬b=0.1 m、高h(yuǎn)=0.2 m，材質(zhì)鋼 (E=200 GPa)。梁全長受均布載荷w=5 kN/m，且自由端承受集中載荷P=10 kN。請計(jì)算最大彎曲應(yīng)力σ_max。

示例 2：

編寫函數(shù)evaluate_cells(cells: Dict[str, str]) -> Dict[str, float]，用于計(jì)算電子表格單元格的數(shù)值。

每個單元格的內(nèi)容可能為：

一個數(shù)字（如「3」），或
一個公式，例如「=A1 + B1 * 2」，可使用「+、-、*、/」運(yùn)算符并引用其他單元格。

要求：

1. 解析并解決單元格間的依賴關(guān)系。

2. 處理運(yùn)算符優(yōu)先級（*/高于+-）。

3. 檢測循環(huán)依賴并拋出 ValueError("Cycle detected at <cell>")。

4. 不得使用eval()，只可使用Python內(nèi)置庫。

Gemini 2.5 Flash正式上線

當(dāng)前，Gemini 2.5 Flash預(yù)覽版API在Google AI Studio和Vertex AI中上線，可通過Gemini應(yīng)用專用下拉菜單找到它。

谷歌強(qiáng)烈建議嘗試thinking_budget（思考預(yù)算）參數(shù)，看看可控推理如何去解決更復(fù)雜的問題。

圖片

參考資料：

https://developers.googleblog.com/en/start-building-with-gemini-25-flash/

責(zé)任編輯：武曉燕來源：新智元

Gemini 2.5 o4-mini Claude 3.7

點(diǎn)贊

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<s id="yqmcd"></s>

^{<blockquote id="yqmcd"></blockquote>}

^{<blockquote id="yqmcd"></blockquote>}