OpenAI更新GPT-4等模型,新增API函數(shù)調(diào)用,價格最高降75%
前些天,OpenAI 的 CEO Sam Altman 在全球巡回演講中,透漏了 OpenAI 近期發(fā)展路線,主要分兩個階段,2023 年的首要任務(wù)是推出更便宜、更快的 GPT-4,更長的上下文窗口等;2024 年重點(diǎn)是多模態(tài)。
OpenAI 2023 年的這些目標(biāo)正在逐一實(shí)現(xiàn)。從 ChatGPT 推出至今,短短幾個月,OpenAI 在 GPT-3.5 Turbo、GPT-4 等這些模型的基礎(chǔ)上構(gòu)建了令人難以置信的應(yīng)用程序。當(dāng)?shù)貢r間 6 月 13 日,OpenAI 發(fā)布函數(shù)調(diào)用及其他 API 更新,具體包括:
- 在 Chat Completions API 中新增新的函數(shù)調(diào)用,能讓模型在需要的時候調(diào)用函數(shù)并生成對應(yīng)的 JSON 對象作為輸出;
- 更新和更可操縱版本的 GPT-4 和 GPT-3.5 Turbo;
- 16k 上下文版本的 gpt-3.5-turbo(標(biāo)準(zhǔn)的是 4k 版本);
- 最先進(jìn)的嵌入模型(embeddings model)成本降低了 75%;
- gpt-3.5-turbo 輸入 token 成本降低 25%;
- 宣布 gpt-3.5-turbo-0301 和 gpt-4-0314 型號的棄用時間表。
OpenAI 表示:API 中的 GPT-4 和 GPT-3.5 Turbo 模型現(xiàn)在支持調(diào)用用戶自定義函數(shù),允許模型使用用戶為其設(shè)計的工具。此外,用戶使用模型的價格降低了,OpenAI 也發(fā)布了一些新的型號版本(包括 16k 上下文 GPT-3.5 Turbo):
函數(shù)調(diào)用
現(xiàn)在開發(fā)人員可以向 gpt-4-0613 和 gpt-3.5-turbo-0613 描述函數(shù),并讓模型智能地選擇輸出一個包含調(diào)用這些函數(shù)所需參數(shù)的 JSON 對象。這是一種更可靠地將 GPT 的能力與外部工具和 API 連接起來的新方法。
模型經(jīng)過微調(diào),既可以檢測何時需要調(diào)用函數(shù)(取決于用戶的輸入),又可以使用符合函數(shù)簽名的 JSON 進(jìn)行響應(yīng)。函數(shù)調(diào)用使開發(fā)人員可以更可靠地從模型中獲取結(jié)構(gòu)化數(shù)據(jù)。例如,開發(fā)人員可以:
- 創(chuàng)建聊天機(jī)器人,通過調(diào)用外部工具來回答問題:
例如將諸如「給 Anya 發(fā)電子郵件,問問她下周五是否想喝咖啡」之類的查詢轉(zhuǎn)換為函數(shù)調(diào)用 send_email (to: string, body: string) ;或者將「波士頓的天氣怎么樣?」 轉(zhuǎn)換為 get_current_weather (location: string, unit: 'celsius' | 'fahrenheit')。
- 將自然語言轉(zhuǎn)換為 API 調(diào)用或數(shù)據(jù)庫查詢:
例如將「誰是我這個月的十大客戶?」轉(zhuǎn)換為內(nèi)部 API 調(diào)用 get_customers_by_revenue (start_date: string, end_date: string, limit: int);又或者將「Acme 公司上個月下了多少訂單?」轉(zhuǎn)化為 SQL 查詢 sql_query (query: string)。
- 從文本中提取數(shù)據(jù)結(jié)構(gòu):
例如定義一個名為 extract_people_data (people: [{name: string, birthday: string, location: string}]) 的函數(shù),用來提取維基百科中提到的所有人。
以上這些用例由 /v1/chat/completions 端點(diǎn)、functions 和 function_call 中的新 API 參數(shù)啟用,允許開發(fā)人員通過 JSON 模式向模型描述函數(shù),并選擇要求它調(diào)用特定函數(shù)。
函數(shù)調(diào)用示例
例如用戶詢問「現(xiàn)在波士頓的天氣怎么樣?」,經(jīng)過一系列處理后,最終模型輸出答案:「波士頓目前天氣晴朗,氣溫為 22 攝氏度?!?/span>
下圖對應(yīng)上圖中的第一步,包括請求和響應(yīng):
新模型
首先是 GPT-4:
- gpt-4-0613 包含了一個更新和改進(jìn)的函數(shù)調(diào)用模型。
- gpt-4-32k-0613 包括與 gpt-4-0613 相同的改進(jìn),以及擴(kuò)展的上下文長度,以理解更大的文本。
然后是 GPT - 3.5 Turbo:
- gpt-3.5-turbo-0613 包含與 GPT-4 相同的函數(shù)調(diào)用,以及通過系統(tǒng)消息更可靠的可操作性,開發(fā)人員可以利用這兩個特性更加有效地指導(dǎo)模型進(jìn)行響應(yīng)。
- gpt-3.5-turbo-16k 提供的上下文長度是 gpt-3.5-turbo 的 4 倍,價格是 gpt-3.5-turbo 的兩倍:每 1K 輸入 token 0.003 美元,每 1K 輸出 token 0.004 美元。16k 上下文意味著該模型現(xiàn)在可以在單個請求中支持大約 20 頁的文本。
模型棄用
3 月發(fā)布的 gpt-4 和 gpt-3.5-turbo 的初始版本將進(jìn)行棄用和升級。應(yīng)用程序?qū)⑹褂酶€(wěn)定的模型 gpt-3.5-turbo、 gpt-4 和 gpt-4-32k,這些模型將于 6 月 27 日自動升級。如果大家想對不同版本的模型進(jìn)行比較,可以使用 Eval 庫進(jìn)行公共和私有評估。
此外,那些需要過渡時間的開發(fā)人員可以繼續(xù)使用舊版本的模型 gpt-3.5-turbo-0301、gpt-4-0314 或 gpt-4-32k-0314,但在 9 月 13 號之后,在請求使用這些模型,將會失敗。想要了解更多模型棄用消息,可參考:
模型棄用查詢:https://platform.openai.com/docs/deprecations/
此外,本次更新價格更低了,Text-embedding-ada-002 是嵌入系統(tǒng)最流行的嵌入模型。如今,其成本降低了 75%,低至每 1K token 0.0001 美元。
最后,還有大家比較關(guān)注的 GPT - 3.5 Turbo,其為數(shù)百萬用戶提供了 ChatGPT 功能?,F(xiàn)今,gpt-3.5-turbo 的輸入 token 成本降低了 25%。開發(fā)人員現(xiàn)在使用這個模型,每 1K 輸入 token 只需 0.0015 美元,每 1K 輸出 token 只需 0.002 美元,這相當(dāng)于每美元大約 700 頁。