百萬tokens低至1元！大模型越來越卷了

作者：機器之心 2024-05-13 09:09:01

對于開發(fā)者和企業(yè)來說，模型的使用成本是一個重要考量，大模型降價有利于吸引更多的開發(fā)者和企業(yè)客戶，擴大其生態(tài)圈。

在剛剛舉行的 ICLR 2024 大會上，智譜AI的大模型技術團隊公布了面向激動人心的AGI通用人工智能前景的三大技術趨勢，同時預告了GLM的后續(xù)升級版本。

前天，智譜大模型開放平臺（bigmodel.cn）上線了新的價格體系。入門級產(chǎn)品 GLM-3 Turbo 模型調(diào)用價格下調(diào)80%！從5元/百萬tokens降至1元/百萬tokens。1元可以購買100萬tokens。

調(diào)整后，使用GLM-3 Turbo創(chuàng)作一萬條小紅書文案（以350字計）將僅需約1元錢，足以讓更多企業(yè)和個人都能用上這款入門級產(chǎn)品。

來自智譜AI開放平臺官網(wǎng)

除了降價，官方還特別提供用戶 tokens 優(yōu)惠計劃——從今天起，新注冊開放平臺用戶贈送額度提升500%。開放平臺新注冊用戶獲贈從500 萬tokens提升至2500萬tokens（包含2000萬入門級額度和500萬企業(yè)級額度）。

GLM-3 Turbo（最大支持 128k）是大模型開放平臺最受歡迎的模型產(chǎn)品，不僅速度快，而且適用于對知識量、推理能力、創(chuàng)造力要求較高的場景，此次調(diào)價后更具競爭力，國內(nèi)其他128k級別大模型的調(diào)用價格大多從百萬tokens數(shù)元到幾十元不等。

企業(yè)級產(chǎn)品 GLM-4/GLM-4V 價格仍維持在 0.1元/千 tokens，百萬tokens的價格為100元，但作為一款能力逼近GPT-4的國內(nèi)領先大模型，這一價格還是比較能打。從公開的API 調(diào)用收費來看，OpenAI 最新模型 GPT-4 Turbo 每100萬tokens輸入/輸出價格分別是10/30美元。Claude 3 Opus 更貴，每百萬tokens輸入/輸出價格15/75美元。如果折合成人民幣，這些數(shù)字至少還要乘以7。

SuperBench榜單：GLM-4超過GPT-4系列模型位居第二

對于開發(fā)者和企業(yè)來說，模型的使用成本是一個重要考量，大模型降價有利于吸引更多的開發(fā)者和企業(yè)客戶，擴大其生態(tài)圈。華福證券最近發(fā)布報告稱，大模型成本優(yōu)化與算力需求并不是直接的此長彼消，而是互相搭臺、相互成就。定價的持續(xù)走低有望帶來更快的商業(yè)化落地，進而會衍生出更多的微調(diào)及推理等需求，將逐步盤活國內(nèi)AI應用及國產(chǎn)算力發(fā)展。

這次 API定價更新也體現(xiàn)出智譜AI覆蓋開發(fā)者用戶的決心——單次調(diào)用適合對實時性要求高的中小用戶；批量調(diào)用定價更低,則是為數(shù)據(jù)量大、對成本敏感的企業(yè)及用戶量身定制。作為國內(nèi)應用最為廣泛的開放平臺，智譜的開放平臺上已經(jīng)聚集了超過數(shù)十萬的企業(yè)和開發(fā)者，并且在持續(xù)快速增長，過去的半年每日的token消耗增長超過一百倍。比如官方開發(fā)的三個調(diào)用工具，網(wǎng)頁檢索、函數(shù)調(diào)用以及知識庫，自從1月上線以來調(diào)用次數(shù)已經(jīng)超過 3 億次。

技術的進步也為降低開發(fā)、運行 LLMs 成本提供了現(xiàn)實可能。例如，從基礎設施來看，隨著一些老款AI芯片（比如 Nvidia A100 ）降價，大模型培訓成本下降了約60%。英偉達也優(yōu)化了軟件性能，幫助開發(fā)者更快訓練和運行大模型。研發(fā)人員也在模型架構(gòu)、模型壓縮以及GPU調(diào)用等方面探索到一些降本增效的辦法。

智譜曾表示，通過模型推理算子優(yōu)化、模型壓縮及硬件高效適配、高性能系統(tǒng)實現(xiàn)以及精細化集群調(diào)度等技術將 GLM-3 Turbo的推理成本壓縮到1/5。自大模型開放平臺上線以來，在模型效果和推理性能不斷提升的情況下，已累計降價超過百倍。除了降價，智譜AI還宣布包括GLM-3 Turbo 以及最先進基座大模型GLM-4在內(nèi)的GLM系列模型也將迎來更新，目前正在灰度測試中，很快將和廣大開發(fā)者和應用者見面。

責任編輯：趙寧寧來源：機器之心

大模型人工智能

自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

百萬tokens低至1元！大模型越來越卷了

百萬tokens低至1元！大模型越來越卷了