AI圈卷瘋了!xAI、Anthropic同日上線API:Grok免費(fèi)公測,Claude 3.5 Haiku價格暴漲
就在剛剛,Anthropic宣布,Claude 3.5 Haiku已經(jīng)可以通過API訪問。
圖片
與此同時,就在今天,Grok API也官宣正式開啟公測。
圖片
Claude 3.5 Haiku正式開放API
Claude 3.5 Haiku現(xiàn)已在Anthropic的API、Amazon Bedrock和Google Cloud的Vertex AI上提供。
Anthropic的開發(fā)者關(guān)系運(yùn)營負(fù)責(zé)人Alex Albert發(fā)帖說,「該模型還更新了截至2024年7月的知識——是所有Claude模型中最新的。」
圖片
性能方面,Claude 3.5 Haiku可謂是表現(xiàn)不俗,已經(jīng)在接近Sonnet的表現(xiàn)了。
圖片
它在編程和代理任務(wù)上的表現(xiàn)也超越了除新款3.5 Sonnet外的所有此前Claude模型。
圖片
SWE-bench Verified測試衡量了模型解決實(shí)際軟件問題的能力
AI公司iGent的CEO評價道:「Claude 3.5 Haiku展現(xiàn)了令人印象深刻的推理和代碼生成能力,包括展示強(qiáng)大的多輪代碼優(yōu)化功能,使與代碼相關(guān)的錯誤減少了60%。它和其他體積更大的模型處于同一水平。」
憑借這些特性,Claude 3.5 Haiku非常適合面向用戶的產(chǎn)品、專業(yè)化子代理任務(wù),以及從大量數(shù)據(jù)(如購買歷史、定價或庫存記錄)中生成個性化體驗(yàn)。
基于此,Anthropic列舉了一些適用于Haiku的使用場景:
1. 代碼補(bǔ)全:Claude 3.5 Haiku提供快速、準(zhǔn)確的代碼建議和補(bǔ)全,能加速開發(fā)工作流。
2. 交互式聊天機(jī)器人:憑借增強(qiáng)的對話能力和快速響應(yīng),Claude 3.5 Haiku非常適合支持響應(yīng)迅速的聊天機(jī)器人,能夠處理大量用戶互動。這對需要大規(guī)模互動的客戶服務(wù)、電商和教育平臺尤為有價值。
3. 數(shù)據(jù)提取和標(biāo)注:Claude 3.5 Haiku能夠高效處理和分類信息,使其在快速數(shù)據(jù)提取和自動化標(biāo)注任務(wù)中表現(xiàn)出色。此功能對處理大量非結(jié)構(gòu)化數(shù)據(jù)的金融、醫(yī)療和研究機(jī)構(gòu)尤為實(shí)用。
4. 實(shí)時內(nèi)容審核:Claude 3.5 Haiku通過其改進(jìn)的推理和內(nèi)容理解能力,提供可靠的即時內(nèi)容審核。這對需要大規(guī)模維持安全、適當(dāng)內(nèi)容的社交平臺、在線社區(qū)和媒體組織而言非常有價值。
然而,隨著性能提升,Haiku的價格提升至之前的4倍!它現(xiàn)在的定價起步為每百萬輸入tokens $1,每百萬輸出tokens $5。
圖片
圖片
網(wǎng)友:能力不咋行,漲價第一名
看到這個價格,網(wǎng)友們紛紛吐槽「太貴了」!
「Jimmy Apples」感慨道:如今,Anthropic的光芒正在褪去。
比起隔壁的4o-mini,3.5 Haiku在很多基準(zhǔn)測試上的表現(xiàn)更差,但價格卻更貴。
圖片
而網(wǎng)友「John」則特地做了一個Claude 3.5 Haiku和Gemini 1.5 Flash的性能/價格對比。
從表格中不難看出,3.5 Haiku要花多幾十倍的錢,但換來的卻只有一點(diǎn)點(diǎn)性能提升。
圖片
圖片
網(wǎng)友「elvis」甚至還畫了更直觀的柱狀圖來體現(xiàn)Haiku夸張的漲價幅度——
圖片
并對比了Claude 3.5 Haiku和GPT-4o Mini、Gemini 1.5 Flash在MATH Benchmark和GPQA Diamond Benchmark兩個基準(zhǔn)測試上的表現(xiàn)——
圖片
可以看到,比起上一代模型,新版的3.5 Haiku在價格上提升了4倍之多。
而那些表現(xiàn)基本差不多(甚至更好)的同類模型,價格更是「斷崖式」地便宜。
圖片
當(dāng)然,網(wǎng)上也不乏有驚喜的歡呼聲。
圖片
Grok API開啟公測
如前所述,由馬斯克xAI推出的大模型Grok,也正式開啟API的公測了。
到2024年底,每月有25美金免費(fèi)額度,人人均可參與。
如果你之前已經(jīng)購買了預(yù)付費(fèi)額度,比如50美元,那么在11月和12月,你每月都能獲得75美元(25+50)的免費(fèi)額度
圖片
模型性能
根據(jù)其官方博客介紹:此次,xAI公開了一個全新的Grok模型,代號「grok-beta」,該模型目前正處于開發(fā)的最后階段。
圖片
該模型上下文長度為128000 token,這意味著Grok可以處理更長的文本輸入,理解更復(fù)雜的上下文關(guān)系。
圖片
此外,該模型不僅支持函數(shù)調(diào)用,也能支持系統(tǒng)提示詞。從而讓開發(fā)者能夠更靈活地控制模型的行為。
這意味著它可以與外部工具進(jìn)行高效的連接和交互,為各種復(fù)雜應(yīng)用場景的實(shí)現(xiàn)提供了可能。
借此機(jī)會,xAI還透露,除了純文本版本外。下周還將發(fā)布一個支持圖像輸入的多模態(tài)版本。
也就是說,以后Grok不僅能夠讀懂文字,也能看懂圖片了。
兼容OpenAI和Anthropic API
值得一提的是,考慮到開發(fā)者的使用體驗(yàn),xAI的REST API完全兼容Open AI和Anthropic的API,遷移起來也非常簡單。
如果你正在使用OpenAI的Python SDK,只需要做兩個簡單的改動:
- 將base_url改為https://api.x.ai/v1
- 使用在console.x.ai創(chuàng)建的xAI API密鑰
就這么簡單,你的應(yīng)用就能無縫切換到Grok了!
參考資料: