OpenAI突發(fā)新模型,GPT-3.5退役,大模型成本2年驟降99%
OpenAI突發(fā)新模型,全面取代老去的GPT-3.5。
GPT-4o mini,能力接近原版GPT-4,價格卻要便宜一個數(shù)量級:
- 每百萬輸入tokens,15美分(約1.09元人民幣)
- 每百萬輸出tokens,60美分(約4.36元人民幣)
在ChatGPT應(yīng)用中,GPT-3.5已經(jīng)完全退役,免費用戶已可使用GPT-4o mini模型。
對應(yīng)的API也已經(jīng)開放,支持128k輸入tokens(圖像和文本),更令人矚目的是支持16k輸出tokens。
相比之下,隔壁Claude 3.5 Sonnet幾天前剛剛升級8k輸出tokens。
以其低成本和低延遲特性,官方推薦用于多種場景:
- 鏈?zhǔn)交虿⑿谢鄠€模型調(diào)用
- 將大量上下文輸入給模型(如完整的代碼庫或?qū)υ挌v史記錄)
- 或通過快速、實時的文本響應(yīng)交互(如客服)
在未來幾天內(nèi),將開放GPT-4o mini微調(diào)。
CEO奧特曼表示,僅僅兩年前,世界上最好的模型還是GPT-3的text-davinci-003版本。
與今天相比表現(xiàn)差得多,還要貴上100倍。
或者換另一個說法,大模型成本在兩年內(nèi)下降了99%。
GPT-4級別小模型,便宜一個數(shù)量級
ChatGPT首發(fā)震撼世界,原版GPT-3.5模型功不可沒。
但盡管經(jīng)過一系列升級降價,系列最新型號GPT-3.5 Turbo也漸漸落后了。
競爭對手新出的小模型,以Anthropic的Claude 3 Haiku和谷歌Gemini Flash為代表,開始搶占市場。
GPT-4o mini就是專門來找回場子的。
在多項文本和多模態(tài)推理學(xué)術(shù)基準(zhǔn)測試中,GPT-4o mini都超過了其他小模型。
特別是在數(shù)學(xué)(MGSM、MATH)和代碼能力(HumanEval)上優(yōu)勢明顯,與其他小模型拉開一個檔次,只比GPT-4o完整版稍弱。
此外,它還在函數(shù)調(diào)用方面表現(xiàn)出強大的性能。
價格方面,也比Claude 3 Haiku和Gemini Flash要更便宜40%-60%。
作為模型開發(fā)的一部分,OpenAI與Ramp和Superhuman等公司合作,已將GPT-4o mini用于實際應(yīng)用,在“從文件中提取結(jié)構(gòu)化數(shù)據(jù)”和“對郵件通信記錄生成高質(zhì)量回復(fù)”等任務(wù)明顯優(yōu)GPT于 -3.5 Turbo。
此外幾周之前,新模型還化名GPT-mini登上大模型競技場供廣大網(wǎng)友測試檢驗。
目前收集到6000+用戶投票,與GPT-4 Turbo表現(xiàn)相當(dāng)。
不過感興趣的可以在大模型競技場體驗,目前版本為gpt-4o-mini-2024-07-18。
這一次OpenAI對模型做了更多的安全設(shè)置,第一個應(yīng)用了OpenAI指令層次結(jié)構(gòu)方法的模型,有助于提高模型抵抗越獄、Prompt注入和系統(tǒng)Prompt提取的能力。
簡單測試中,確實不能簡單的一句話套出系統(tǒng)提示詞了。
不過用上一系列復(fù)雜的越獄手段之后,還是沒防住。泄漏出來的系統(tǒng)提示詞倒也沒什么特殊的內(nèi)容。
不過很可惜,新模型還是搞不懂9.11和9.9哪個大……
One More Thing
此外奧特曼還在回復(fù)網(wǎng)友提問中透露,GPT-4o實時語音模式也就是《Her》,將于本月晚些時候Alpha測試,更晚一些正式發(fā)布。
不過也有網(wǎng)友略有點失望:我們要想要的是GPT-5,你卻給我GPT-4o mini。
同一天,DeepSeek與Mistral也都有了新進展。
一邊開源了 DeepSeek-V2-0628,直接摘得大模型榜單上開源大模型頭名。
另一邊則是推出了12B的小模型,同英偉達合作開發(fā),上下文長度為128K。
大家打起來啊打起來啊~~~