GPT-4「變懶」Bug被修復(fù),價格暴降80%!OpenAI連更5款新模型,性能狂飆
GPT-4又雙叒叕變強(qiáng)了!
今天,OpenAI正式發(fā)布了更新版的GPT-4 Turbo——gpt-4-0125-preview。
不僅大幅改善了模型「偷懶」的情況,而且還極大地提升了代碼生成的能力。
與此同時,OpenAI還發(fā)布了一系列模型和API更新,總體來說就是「更強(qiáng)的性能,更低的價格」。
- GPT-3.5 Turbo更新——gpt-3.5-turbo-0125。輸入價格大降50%,輸出價格下降25%。性能上也有升級。
- 「迄今為止最強(qiáng)」的審核模型text-moderation-007,幫助開發(fā)者有效地識別有害文本。
兩個新一代embedding模型:
- text-embedding-3-small,體積更小效率更高,價格直接砍到了原模型20%!支持512維和1536維兩種大小。
- text-embedding-3-large,性能相比之前模型大幅提升,高達(dá)3072維的嵌入向量,價格是小模型的6.5倍。
最后,OpenAI還強(qiáng)調(diào)稱,用戶通過API傳送的數(shù)據(jù),都不會被用于訓(xùn)練新的模型。
GPT-4更強(qiáng)了,變懶bug修復(fù)
自從去年11月份開發(fā)者大會發(fā)布GPT-4-Turbo以來,超過70%的GPT-4 API用戶已經(jīng)轉(zhuǎn)用了GPT-4-Turbo預(yù)覽版,從而能夠享受最新的知識戒指日期、更大的128k上下文窗口和更低的價格。
最新更新的GPT-4-Turbo 預(yù)覽模型——gpt-4-0125-preview在執(zhí)行任務(wù)(如代碼生成)方面比之前的預(yù)覽版要更強(qiáng),能夠減少模型有可能出現(xiàn)的「偷懶」現(xiàn)象。
新模型還修復(fù)了一個影響非英文UTF-8生成的漏洞。
對于那些希望自動升級到最新GPT-4-Turbo預(yù)覽版的用戶,OpenAI還推出了一個新的模型名別名gpt-4-turbo-preview,它將始終指向最新的GPT-4-Turbo預(yù)覽版模型。
在未來幾個月內(nèi),OpenAI還會推出具備視覺功能的GPT-4-Turbo正式版。
GPT-3.5-Turbo喜迎「降價增效」
下周,OpenAI即將推出新版的GPT-3.5-Turbo,型號為gpt-3.5-turbo-0125。
在過去的一年里,OpenAI已經(jīng)第三次下調(diào)GPT-3.5-Turbo的價格。
新模型的輸入價格下降了50%,現(xiàn)為0.0005美元/1k token;輸出價格下降了 25%,現(xiàn)為0.0015美元/1k token。
此外,模型還進(jìn)行了多項改進(jìn),比如提高了按要求格式響應(yīng)的準(zhǔn)確性,并修復(fù)了一個導(dǎo)致非英文語言函數(shù)調(diào)用出現(xiàn)文本編碼問題的漏洞。
在API中使用固定gpt-3.5-turbo模型名稱的用戶,將在這款新模型推出兩周后,自動從gpt-3.5-turbo-0613升級至gpt-3.5-turbo-0125版本。
全新嵌入模型2連發(fā):性能大漲價格狂降
OpenAI推出了兩款新的嵌入模型:體積更小、效率更高的text-embedding-3-small模型,以及更大、性能更強(qiáng)的text-embedding-3-large模型。
所謂嵌入(Embedding),就是將內(nèi)容(如文字或代碼)中的概念轉(zhuǎn)化為一串?dāng)?shù)字序列。
通過這種方式,機(jī)器學(xué)習(xí)模型和其他算法可以輕松理解不同內(nèi)容之間的關(guān)系,執(zhí)行聚類、檢索等操作。
嵌入技術(shù)為 ChatGPT 和 Assistants API 中的知識檢索功能,以及許多檢索增強(qiáng)生成(RAG)開發(fā)工具提供了強(qiáng)大動力。
「小」文本嵌入模型:text-embedding-3-small
text-embedding-3-small是OpenAI的新型高效嵌入模型,與2022年12月推出的前代產(chǎn)品text-embedding-ada-002相比,性能有了大幅提升。
- 性能更強(qiáng)
在多語言檢索(MIRACL)的常用基準(zhǔn)測試中,text-embedding-3-small的平均得分從31.4%提高到44.0%,在英語任務(wù)(MTEB)的常用基準(zhǔn)測試中,平均得分從61.0%提高到 62.3%。
- 價格實惠
text-embedding-3-small遠(yuǎn)比OpenAI之前的text-embedding-ada-002模型效率高,因此價格也大幅降低了5倍,從每千token的0.0001美元降至0.00002美元。
OpenAI不會停用text-embedding-ada-002,盡管OpenAI更推薦用戶使用新模型,客戶仍可選擇繼續(xù)使用上一代產(chǎn)品。
「大」文本嵌入模型:text-embedding-3-large
text-embedding-3-large是OpenAI的新一代大型嵌入模型,能夠生成高達(dá)3072維的嵌入向量。
text-embedding-3-large是OpenAI目前性能最強(qiáng)的模型——與text-embedding-ada-002相比,它在MIRACL上的平均得分從31.4%提升至54.9%,在MTEB上的平均得分從61.0%提升至 64.6%。
text-embedding-3-large的價格定為0.00013美元/1k token。
靈活調(diào)整嵌入向量
相比于小型嵌入,大型嵌入的存儲和檢索,如放置于向量存儲庫中,往往需要更高的成本,也消耗更多的計算資源、內(nèi)存和存儲空間。
OpenAI的兩款新嵌入模型均采用了一種特殊的訓(xùn)練技術(shù),使得開發(fā)者可以在嵌入的使用成本和性能之間做出權(quán)衡。
具體來說,開發(fā)者可以通過設(shè)定dimensions API參數(shù)來有效縮短嵌入向量的長度(也就是去掉數(shù)列末端的一些數(shù)字),而這樣做不會影響嵌入向量代表概念的核心特性。
例如,在MTEB基準(zhǔn)測試中,即使將text-embedding-3-large嵌入向量的長度縮減到 256,它的性能仍然超過了長度為1536的未經(jīng)縮減的text-embedding-ada-002嵌入向量。
這種做法極大地增加了使用上的靈活性。
比如說,當(dāng)開發(fā)者需要使用一個只支持最大1024維度嵌入向量的向量數(shù)據(jù)存儲時,可以選擇OpenAI性能最佳的嵌入模型text-embedding-3-large,并通過設(shè)置dimensions API參數(shù)為1024,從而將原本3072維的嵌入向量縮減下來,以較小的向量尺寸為代價換取了準(zhǔn)確度。
迄今最強(qiáng)的內(nèi)容審核模型
OpenAI提供的免費內(nèi)容審核API可以幫助開發(fā)者識別可能有害的文本。
作為OpenAI持續(xù)安全工作的一部分,OpenAI發(fā)布了迄今為止最強(qiáng)大的內(nèi)容審核模型text-moderation-007。
此前的text-moderation-latest和text-moderation-stable,也將重新指向這個新模型。
API后臺更新,更好的API密鑰管理
OpenAI正在推出兩項重要的平臺升級,旨在為開發(fā)者提供對他們的API使用情況更清晰的洞察,并加強(qiáng)對API密鑰的管理。
首先,開發(fā)者可以直接在API密鑰頁面設(shè)置不同的密鑰權(quán)限。
舉個例子,用戶可以為一個密鑰配置只讀權(quán)限,以便用于內(nèi)部的跟蹤數(shù)據(jù)面板,或者設(shè)置為僅限訪問某些特定的接口。
其次,一旦開啟了密鑰使用跟蹤功能,使用儀表盤和數(shù)據(jù)導(dǎo)出功能就能夠提供基于每個API 密鑰的詳細(xì)使用指標(biāo)。這樣一來,只需為不同的功能、團(tuán)隊、產(chǎn)品或項目分配獨立的 API 密鑰,就可以輕松地監(jiān)控到各自的使用情況。
在接下來的幾個月里,OpenAI計劃為開發(fā)者提供更多便利,讓他們能夠更好地監(jiān)控 API 使用情況并管理 API 密鑰,這一點對于大型組織來說尤其重要。
參考資料:
https://openai.com/blog/new-embedding-models-and-api-updates