編輯 | 言征
當(dāng)?shù)貢r(shí)間,1月25日,OpenAI發(fā)布了新的模型,同時(shí)降低了GPT-3.5 Turbo的價(jià)格,并為開發(fā)人員引入了管理API密鑰和了解API使用情況的新方法。
新模型包括:兩個(gè)新的嵌入模型、一個(gè)更新的GPT-4 Turbo預(yù)覽模型、一個(gè)升級(jí)的GPT-3.5 Turbo模型、一個(gè)新的文本審核模型。
模型默認(rèn)情況下,發(fā)送到OpenAI API的數(shù)據(jù)將不會(huì)用于訓(xùn)練或改進(jìn)OpenAI模型。
1、兩個(gè)新嵌入模型,價(jià)格下降
OpenAI將引入兩種新的嵌入模型:一種是更小、高效的 text-embedding-3-small 模型,另一種是更大、更強(qiáng)的text-embedding-3-large 模型。
embeddings使得機(jī)器學(xué)習(xí)模型和其他算法更容易理解內(nèi)容之間的關(guān)系,并執(zhí)行聚類或檢索等任務(wù)。它們?yōu)镃hatGPT和助手API中的知識(shí)檢索等應(yīng)用程序以及許多檢索增強(qiáng)生成(RAG)開發(fā)工具提供了動(dòng)力。
圖片
text-embedding-3-small是新一代的高效嵌入模型,與2022年12月發(fā)布的前代text-embeeding-ada-002模型相比進(jìn)行了重大升級(jí),性能更強(qiáng)。相較而言,多語言檢索常用基準(zhǔn)(MIRACL)的平均得分從31.4%增加到44.0%,而英語任務(wù)常用基準(zhǔn)(MTEB)的平均分?jǐn)?shù)從61.0%增加到62.3%。
降價(jià)方面,與text-embedding-ada-002相比,text-embetting-3small的價(jià)格降低了5倍,從每1k代幣的價(jià)格0.0001美元降至0.00002美元。
text-embedding-3-large是新的下一代更大的嵌入模型,可創(chuàng)建高達(dá)3072個(gè)維度的嵌入,它擁有更強(qiáng)的性能。
將text-embedding-ada-002與text-embeeding-3-large進(jìn)行比較:在MIRACL上,平均得分從31.4%增加到54.9%,而在MTEB上,平均分?jǐn)?shù)從61.0%增加到64.6%。
價(jià)格上,text-embedding-3-large定價(jià)為0.00013/1k tokens。
圖片
值得一提的是,這個(gè)兩個(gè)新的嵌入模型都原生支持縮短嵌入。
使用更大的嵌入,例如將它們存儲(chǔ)在矢量存儲(chǔ)中進(jìn)行檢索,通常會(huì)帶來更高的成本,比如:消耗更多的計(jì)算、內(nèi)存和存儲(chǔ)等等。
這兩個(gè)新嵌入模型都使用了這樣一種技術(shù)進(jìn)行訓(xùn)練,即允許開發(fā)人員權(quán)衡使用嵌入的性能和成本。具體來說,開發(fā)人員可以通過傳遞dimensions API參數(shù)來縮短嵌入(即從序列結(jié)尾移除一些數(shù)字),而不會(huì)丟失嵌入的概念表示屬性。例如,在MTEB基準(zhǔn)上,文本嵌入-3大嵌入可以縮短到256的大小,同時(shí)仍然優(yōu)于1536大小的未縮減的text-embedding-ada-002。
這使得使用非常靈活。例如,當(dāng)使用僅支持長度不超過1024個(gè)維度的嵌入的向量數(shù)據(jù)存儲(chǔ)時(shí),開發(fā)人員現(xiàn)在仍然可以使用我們最好的嵌入模型 text-embedding-3-large ,并為維度API參數(shù)指定1024的值,這將使嵌入從3072個(gè)維度縮短,犧牲一定的準(zhǔn)確性來換取更短、更小的向量。
2、更新的GPT-3.5 Turbo型號(hào)和更低的定價(jià)
下周,OpenAI將推出一款新的GPT-3.5 Turbo型號(hào)GPT-3.5-Turbo-0125,并將第三次降低GPT-3.5 Turbo的價(jià)格。新模型的輸入價(jià)格降低50%,降至0.0005美元/1K tokens,輸出價(jià)格降低了25%,降至0.0015美元/1K tokens。
該模型還將有各種改進(jìn),包括以請(qǐng)求的格式響應(yīng)的準(zhǔn)確性更高,以及修復(fù)導(dǎo)致非英語函數(shù)調(diào)用的文本編碼問題的錯(cuò)誤。
使用固定gpt-3.5-turbo型號(hào)別名的客戶將在該型號(hào)發(fā)布兩周后自動(dòng)從gpt-3.5-turbo-0613升級(jí)到gpt-3.5-durbo-0125。
3、更新GPT-4 Turbo預(yù)覽
自GPT-4 API發(fā)布以來,超過70%的GPT-4客戶請(qǐng)求已過渡到GPT-4 Turbo,因?yàn)殚_發(fā)人員利用了其更新的知識(shí)截止、更大的128k上下文窗口和更低的價(jià)格。OpenAI現(xiàn)在發(fā)布了一個(gè)更新的GPT-4 Turbo預(yù)覽模型,GPT-4-0125-preview。
此模型比以前的預(yù)覽模型更徹底地完成代碼生成等任務(wù),旨在減少模型無法完成任務(wù)的“懶惰”情況。
新模型還包括對(duì)影響非英語UTF-8代的錯(cuò)誤的修復(fù)。對(duì)于那些想要自動(dòng)升級(jí)到新的GPT-4 Turbo預(yù)覽版本的人,還推出了一個(gè)新的GPT-1-Turbo-preview型號(hào),它將始終指向最新的GPT4-Turbo預(yù)覽型號(hào)。
OpenAI還聲稱計(jì)劃在未來幾個(gè)月內(nèi)推出GPT-4 Turbo,并實(shí)現(xiàn)全面上市。
4、更新審核模型
免費(fèi)的Moderation API允許開發(fā)人員識(shí)別潛在的有害文本。作為正在進(jìn)行的安全工作的一部分,OpenAI將發(fā)布text-moderation-007,這是其迄今為止最強(qiáng)大的審核模型。
5、API使用和管理API密鑰的新方法
OpenAI正在推出兩項(xiàng)平臺(tái)改進(jìn),以使開發(fā)人員能夠更好地了解他們對(duì)API密鑰的使用和控制。
首先,開發(fā)人員現(xiàn)在可以從API密鑰頁面為API密鑰分配權(quán)限。例如,可以為密鑰分配只讀訪問權(quán)限以為內(nèi)部跟蹤面板供電,或者將其限制為僅訪問某些端點(diǎn)。
其次,使用情況儀表板和使用情況導(dǎo)出功能現(xiàn)在在啟用跟蹤之后公開API關(guān)鍵級(jí)別上的度量。這使得查看每個(gè)功能、團(tuán)隊(duì)、產(chǎn)品或項(xiàng)目級(jí)別的使用情況變得簡單,只需為每個(gè)功能、小組、產(chǎn)品或工程級(jí)別分別提供單獨(dú)的API鍵即可。
在接下來的幾個(gè)月里,OpenAI計(jì)劃進(jìn)一步提高開發(fā)人員查看API使用情況和管理API密鑰的能力。
原文鏈接:https://openai.com/blog/new-embedding-models-and-api-updates