自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

百萬tokens低至1元!大模型越來越卷了

人工智能
對于開發(fā)者和企業(yè)來說,模型的使用成本是一個重要考量,大模型降價有利于吸引更多的開發(fā)者和企業(yè)客戶,擴大其生態(tài)圈。

在剛剛舉行的 ICLR 2024 大會上,智譜AI的大模型技術團隊公布了面向激動人心的AGI通用人工智能前景的三大技術趨勢,同時預告了GLM的后續(xù)升級版本。

前天,智譜大模型開放平臺(bigmodel.cn)上線了新的價格體系。入門級產(chǎn)品 GLM-3 Turbo 模型調(diào)用價格下調(diào)80%!從5元/百萬tokens降至1元/百萬tokens。1元可以購買100萬tokens。

調(diào)整后,使用GLM-3 Turbo創(chuàng)作一萬條小紅書文案(以350字計)將僅需約1元錢,足以讓更多企業(yè)和個人都能用上這款入門級產(chǎn)品。

來自智譜AI開放平臺官網(wǎng)

除了降價,官方還特別提供用戶 tokens 優(yōu)惠計劃——從今天起,新注冊開放平臺用戶贈送額度提升500%。開放平臺新注冊用戶獲贈從500 萬tokens提升至2500萬tokens(包含2000萬入門級額度和500萬企業(yè)級額度)。

GLM-3 Turbo(最大支持 128k)是大模型開放平臺最受歡迎的模型產(chǎn)品,不僅速度快,而且適用于對知識量、推理能力、創(chuàng)造力要求較高的場景,此次調(diào)價后更具競爭力,國內(nèi)其他128k級別大模型的調(diào)用價格大多從百萬tokens數(shù)元到幾十元不等。

企業(yè)級產(chǎn)品 GLM-4/GLM-4V 價格仍維持在 0.1元/千 tokens,百萬tokens的價格為100元,但作為一款能力逼近GPT-4的國內(nèi)領先大模型,這一價格還是比較能打。從公開的API 調(diào)用收費來看,OpenAI 最新模型 GPT-4 Turbo 每100萬tokens輸入/輸出價格分別是10/30美元。Claude 3 Opus 更貴,每百萬tokens輸入/輸出價格15/75美元。如果折合成人民幣,這些數(shù)字至少還要乘以7。

SuperBench榜單:GLM-4超過GPT-4系列模型位居第二

對于開發(fā)者和企業(yè)來說,模型的使用成本是一個重要考量,大模型降價有利于吸引更多的開發(fā)者和企業(yè)客戶,擴大其生態(tài)圈。華福證券最近發(fā)布報告稱,大模型成本優(yōu)化與算力需求并不是直接的此長彼消,而是互相搭臺、相互成就。定價的持續(xù)走低有望帶來更快的商業(yè)化落地,進而會衍生出更多的微調(diào)及推理等需求,將逐步盤活國內(nèi)AI應用及國產(chǎn)算力發(fā)展。

這次 API定價更新也體現(xiàn)出智譜AI覆蓋開發(fā)者用戶的決心——單次調(diào)用適合對實時性要求高的中小用戶;批量調(diào)用定價更低,則是為數(shù)據(jù)量大、對成本敏感的企業(yè)及用戶量身定制。作為國內(nèi)應用最為廣泛的開放平臺,智譜的開放平臺上已經(jīng)聚集了超過數(shù)十萬的企業(yè)和開發(fā)者,并且在持續(xù)快速增長,過去的半年每日的token消耗增長超過一百倍。比如官方開發(fā)的三個調(diào)用工具,網(wǎng)頁檢索、函數(shù)調(diào)用以及知識庫,自從1月上線以來調(diào)用次數(shù)已經(jīng)超過 3 億次。

技術的進步也為降低開發(fā)、運行 LLMs 成本提供了現(xiàn)實可能。例如,從基礎設施來看,隨著一些老款AI芯片(比如 Nvidia A100 )降價,大模型培訓成本下降了約60%。英偉達也優(yōu)化了軟件性能,幫助開發(fā)者更快訓練和運行大模型。研發(fā)人員也在模型架構(gòu)、模型壓縮以及GPU調(diào)用等方面探索到一些降本增效的辦法。

智譜曾表示,通過模型推理算子優(yōu)化、模型壓縮及硬件高效適配、高性能系統(tǒng)實現(xiàn)以及精細化集群調(diào)度等技術將 GLM-3 Turbo的推理成本壓縮到1/5。自大模型開放平臺上線以來,在模型效果和推理性能不斷提升的情況下,已累計降價超過百倍。除了降價,智譜AI還宣布包括GLM-3 Turbo 以及最先進基座大模型GLM-4在內(nèi)的GLM系列模型也將迎來更新,目前正在灰度測試中,很快將和廣大開發(fā)者和應用者見面。

責任編輯:趙寧寧 來源: 機器之心
相關推薦

2023-02-21 09:29:57

ChatGPT人工智能

2021-04-15 13:48:08

視頻監(jiān)控視頻分析智能安防

2017-12-26 15:34:55

2022-03-22 16:48:04

云技術開源應用云服務

2012-05-21 22:01:09

iOS

2021-08-24 00:14:10

手機工具游戲

2024-02-21 09:44:33

Rust前端

2022-05-17 09:17:45

JS 代碼越來越難讀

2021-08-03 11:09:41

智能手機功能技術

2017-10-27 12:28:14

云端遷移云計算

2022-05-27 11:44:53

JS代碼

2021-10-10 21:31:09

手機數(shù)據(jù)體積

2018-08-23 07:24:40

MEC多接入邊緣計算網(wǎng)絡邊緣

2010-07-08 09:03:20

openSUSE 11Fedora

2019-10-28 15:10:31

懶人剪輯運動相機移動應用

2021-05-18 15:12:06

開源軟件云服務

2021-04-02 13:00:51

大數(shù)據(jù)數(shù)據(jù)采集

2011-12-01 09:33:17

Google微軟

2020-09-02 09:25:23

遷移公共云數(shù)據(jù)

2019-12-26 09:42:54

互聯(lián)網(wǎng)免費收費
點贊
收藏

51CTO技術棧公眾號