百萬tokens低至1元!大模型越來越卷了
在剛剛舉行的 ICLR 2024 大會上,智譜AI的大模型技術團隊公布了面向激動人心的AGI通用人工智能前景的三大技術趨勢,同時預告了GLM的后續(xù)升級版本。
前天,智譜大模型開放平臺(bigmodel.cn)上線了新的價格體系。入門級產(chǎn)品 GLM-3 Turbo 模型調(diào)用價格下調(diào)80%!從5元/百萬tokens降至1元/百萬tokens。1元可以購買100萬tokens。
調(diào)整后,使用GLM-3 Turbo創(chuàng)作一萬條小紅書文案(以350字計)將僅需約1元錢,足以讓更多企業(yè)和個人都能用上這款入門級產(chǎn)品。
來自智譜AI開放平臺官網(wǎng)
除了降價,官方還特別提供用戶 tokens 優(yōu)惠計劃——從今天起,新注冊開放平臺用戶贈送額度提升500%。開放平臺新注冊用戶獲贈從500 萬tokens提升至2500萬tokens(包含2000萬入門級額度和500萬企業(yè)級額度)。
GLM-3 Turbo(最大支持 128k)是大模型開放平臺最受歡迎的模型產(chǎn)品,不僅速度快,而且適用于對知識量、推理能力、創(chuàng)造力要求較高的場景,此次調(diào)價后更具競爭力,國內(nèi)其他128k級別大模型的調(diào)用價格大多從百萬tokens數(shù)元到幾十元不等。
企業(yè)級產(chǎn)品 GLM-4/GLM-4V 價格仍維持在 0.1元/千 tokens,百萬tokens的價格為100元,但作為一款能力逼近GPT-4的國內(nèi)領先大模型,這一價格還是比較能打。從公開的API 調(diào)用收費來看,OpenAI 最新模型 GPT-4 Turbo 每100萬tokens輸入/輸出價格分別是10/30美元。Claude 3 Opus 更貴,每百萬tokens輸入/輸出價格15/75美元。如果折合成人民幣,這些數(shù)字至少還要乘以7。
SuperBench榜單:GLM-4超過GPT-4系列模型位居第二
對于開發(fā)者和企業(yè)來說,模型的使用成本是一個重要考量,大模型降價有利于吸引更多的開發(fā)者和企業(yè)客戶,擴大其生態(tài)圈。華福證券最近發(fā)布報告稱,大模型成本優(yōu)化與算力需求并不是直接的此長彼消,而是互相搭臺、相互成就。定價的持續(xù)走低有望帶來更快的商業(yè)化落地,進而會衍生出更多的微調(diào)及推理等需求,將逐步盤活國內(nèi)AI應用及國產(chǎn)算力發(fā)展。
這次 API定價更新也體現(xiàn)出智譜AI覆蓋開發(fā)者用戶的決心——單次調(diào)用適合對實時性要求高的中小用戶;批量調(diào)用定價更低,則是為數(shù)據(jù)量大、對成本敏感的企業(yè)及用戶量身定制。作為國內(nèi)應用最為廣泛的開放平臺,智譜的開放平臺上已經(jīng)聚集了超過數(shù)十萬的企業(yè)和開發(fā)者,并且在持續(xù)快速增長,過去的半年每日的token消耗增長超過一百倍。比如官方開發(fā)的三個調(diào)用工具,網(wǎng)頁檢索、函數(shù)調(diào)用以及知識庫,自從1月上線以來調(diào)用次數(shù)已經(jīng)超過 3 億次。
技術的進步也為降低開發(fā)、運行 LLMs 成本提供了現(xiàn)實可能。例如,從基礎設施來看,隨著一些老款AI芯片(比如 Nvidia A100 )降價,大模型培訓成本下降了約60%。英偉達也優(yōu)化了軟件性能,幫助開發(fā)者更快訓練和運行大模型。研發(fā)人員也在模型架構(gòu)、模型壓縮以及GPU調(diào)用等方面探索到一些降本增效的辦法。
智譜曾表示,通過模型推理算子優(yōu)化、模型壓縮及硬件高效適配、高性能系統(tǒng)實現(xiàn)以及精細化集群調(diào)度等技術將 GLM-3 Turbo的推理成本壓縮到1/5。自大模型開放平臺上線以來,在模型效果和推理性能不斷提升的情況下,已累計降價超過百倍。除了降價,智譜AI還宣布包括GLM-3 Turbo 以及最先進基座大模型GLM-4在內(nèi)的GLM系列模型也將迎來更新,目前正在灰度測試中,很快將和廣大開發(fā)者和應用者見面。