Grok-3四檔定價(jià)揭秘:低至0.3美元/百萬(wàn)token,硬剛谷歌Meta
GenAI競(jìng)爭(zhēng),越來(lái)越激烈了。
據(jù)Similar Web統(tǒng)計(jì),在日活躍用戶方面,Grok與Gemini展開(kāi)了激烈競(jìng)爭(zhēng)。兩者都已經(jīng)超過(guò)50萬(wàn)日活躍用戶,差距不足5萬(wàn)。
就在昨天,谷歌面向開(kāi)發(fā)者推出全新套餐體系,其中標(biāo)準(zhǔn)套餐對(duì)個(gè)人開(kāi)發(fā)者免費(fèi)開(kāi)放,可免費(fèi)使用 Gemini 代碼助手。
談及API價(jià)格策略,AI巨頭各出奇招:
- Grok-3 推出2款模型,支持2種調(diào)用模式,衍生出 4 種定價(jià)套餐;
- Anthropic推出100美元的Max套餐,主打高端服務(wù);
- 谷歌Gemini 2.5 需付費(fèi)解鎖使用限制,以高性價(jià)比吸引用戶;
- Meta開(kāi)源Llama 3,成本優(yōu)勢(shì)顯著,平均每百萬(wàn)token僅需0.36 美元 。
Grok-3:4種模型,各取所需
xAI,正式向公眾開(kāi)放了Grok 3系列API!
目前,Grok 3和 Grok 3 Mini均處于Beta測(cè)試階段,支持常規(guī)模式與快速模式。
- Grok 3 適用于企業(yè)應(yīng)用場(chǎng)景,如數(shù)據(jù)抽取、編程、文本處理等。其價(jià)格為:每輸入100萬(wàn)token收費(fèi)3美元,每輸出100萬(wàn)token收費(fèi)15美元。
- Grok 3 MINI屬于輕量級(jí)模型,適用于對(duì)深度領(lǐng)域知識(shí)無(wú)需求的簡(jiǎn)單任務(wù)。價(jià)格為:每輸入100萬(wàn)token收費(fèi)0.3美元,每輸出100萬(wàn)token收費(fèi) 0.5 美元。
Grok-3和Grok-3-fast使用的是相同的基座模型,提供相同的響應(yīng)質(zhì)量。
它們的區(qū)別在于服務(wù)方式:Grok-3-fast運(yùn)行在更快的基礎(chǔ)設(shè)施上,響應(yīng)速度顯著高于標(biāo)準(zhǔn)版grok-3,但其輸出token的成本也更高。
Grok-3和grok-3-fast指向的是相同的模型。
- 如果需要低延遲的應(yīng)用,選擇grok-3-fast;
- 如果想降低成本,可以選擇grok-3。
對(duì)于grok-3-mini和grok-3-mini-fast也是如此。
它們本質(zhì)上是相同的模型,唯一的區(qū)別是響應(yīng)延遲。
可用模型列表:
grok-3-beta
(標(biāo)準(zhǔn)版):輸入3美元/百萬(wàn)token,輸出15美元/百萬(wàn)tokengrok-3-fast-beta
(標(biāo)準(zhǔn)版,快速響應(yīng)):輸入5美元/百萬(wàn)token,輸出25美元/百萬(wàn)tokengrok-3-mini-beta
(輕量版):輸入0.3美元/百萬(wàn)token,輸出0.5美元/百萬(wàn)tokengrok-3-mini-fast-beta
(輕量版,快速響應(yīng)):輸入0.6美元/百萬(wàn)token,輸出4美元/百萬(wàn)token
在文檔中,xAI展示了幾個(gè)示例。
比如對(duì)話補(bǔ)全,可以流式傳輸響應(yīng),用戶向xAI API端點(diǎn)發(fā)送請(qǐng)求。
API處理該請(qǐng)求后返回完整的響應(yīng)。
import osfrom openai import OpenAIclient = OpenAI( api_key="<YOUR_XAI_API_KEY_HERE>", base_url="https://api.x.ai/v1",)completion = client.chat.completions.create( model="grok-3-latest", messages=[ {"role": "system", "content": "You are a PhD-level mathematician."}, {"role": "user", "content": "What is 2 + 2?"}, ],)print(completion.choices[0].message)
import os
from openai import OpenAI
client = OpenAI(
api_key="<YOUR_XAI_API_KEY_HERE>",
base_url="https://api.x.ai/v1",
)
completion = client.chat.completions.create(
model="grok-3-latest",
messages=[
{"role": "system", "content": "You are a PhD-level mathematician."},
{"role": "user", "content": "What is 2 + 2?"},
],
)
print(completion.choices[0].message)
響應(yīng):
ChatCompletionMessage( cnotallow='2 + 2 equals 4.', refusal=None, role='assistant', audio=None, function_call=None, tool_calls=None)
ChatCompletionMessage(
cnotallow='2 + 2 equals 4.',
refusal=None,
role='assistant',
audio=None,
function_call=None,
tool_calls=None
)
AI巨頭,各顯神通
Gemini系列模型推出了免費(fèi)的Gemini 2.5 Pro、 2.0 Flash等最新模型。
而且除了使用的模型不同,以及部分功能每日請(qǐng)求次數(shù)的限制,免費(fèi)版幾乎和付費(fèi)版沒(méi)有什么不同
今天,Anthropic推出了Max套餐:最低100美元,專為那些重度使用Claude并且需要更多使用次數(shù),完成重要工作的用戶設(shè)計(jì)。
Llama 4 Maverick 相較于平均水平更為便宜,定價(jià)為每百萬(wàn)token為0.36美元。
- Llama 4 Maverick輸入令牌價(jià)格:每百萬(wàn)個(gè)令牌0.20美元
- Llama 4 Maverick輸出令牌價(jià)格:每百萬(wàn)個(gè)令牌0.82美元
在ARC-AGI的半私有評(píng)估中,Llama 4 Maverick非常具有性價(jià)比:
- ARC-AGI-1:每個(gè)任務(wù)只要0.0078美元
- ARC-AGI-2:每個(gè)任務(wù)只要0.0121美元
此前,o3被爆出在ARC-AGI測(cè)試中燒3萬(wàn)美元解決一道題,試錯(cuò)1024次!