自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

開(kāi)發(fā)者終于可以定制自己的GPT-4o了! 原創(chuàng)

發(fā)布于 2024-8-22 13:40
瀏覽
0收藏

編輯 | 言征

出品 | 51CTO技術(shù)棧(微信號(hào):blog51cto)

OpenAI終于又Open了一把!開(kāi)發(fā)者可以免費(fèi)定制自己的GPT-4o了!

當(dāng)?shù)貢r(shí)間8月20日,OpenAI  推出了GPT-4o微調(diào)功能,截至9月23日,所有開(kāi)發(fā)者都可以使用自定義的數(shù)據(jù)集對(duì)GPT-4o進(jìn)行微調(diào),滿(mǎn)足特定用例的需求。

具體而言,這項(xiàng)微調(diào)功能可以通過(guò)一個(gè)小型數(shù)據(jù)集(小到幾十個(gè)示例),就能使模型能夠自定義響應(yīng)的結(jié)構(gòu)和語(yǔ)氣,或遵循復(fù)雜的特定領(lǐng)域指令,

1.首批嘗鮮的定制者們

OpenAI的合作伙伴Cosine推出了AI軟件工程助手Genie,可以幫自主識(shí)別和解決錯(cuò)誤,構(gòu)建和重構(gòu)代碼。它可以推理復(fù)雜的技術(shù)問(wèn)題,并以更高的準(zhǔn)確度和更少的token更改代碼。

這里的Genie就是借助了微調(diào)后的GPT-4o的模型,并且Genie在SWE-bench測(cè)評(píng)榜上獲得了SOTA的水平,位列第一。

開(kāi)發(fā)者終于可以定制自己的GPT-4o了!-AI.x社區(qū)圖片

text to SQL 也是業(yè)內(nèi)一個(gè)很熱的例子,Distyl也是通過(guò)微調(diào)GPT-4o的微調(diào)奪得了該領(lǐng)域BIRD-SQL的基準(zhǔn)測(cè)試的第一名,執(zhí)行準(zhǔn)確率高達(dá)71.83%,除了在SQL生成方面一騎絕塵,同時(shí)在查詢(xún)重構(gòu)、意圖分類(lèi)、思維鏈和自我修正等任務(wù)重表現(xiàn)出色。

2.如何操作?

對(duì)新功能感興趣的開(kāi)發(fā)人員可以訪(fǎng)問(wèn) OpenAI 的微調(diào)儀表板,單擊“創(chuàng)建”,然后 gpt-4o-2024-08-06 從基礎(chǔ)模型下拉菜單中進(jìn)行選擇。

開(kāi)發(fā)者終于可以定制自己的GPT-4o了!-AI.x社區(qū)圖片

不到一個(gè)月前,該公司允許開(kāi)發(fā)人員對(duì)該模型的更小、更快、更便宜的版本 GPT-4o mini 進(jìn)行微調(diào),但它的功能不如完整版 GPT-4o。

OpenAI 技術(shù)人員 John Allard 和 Steven Heidel 在公司官方網(wǎng)站的博客文章中表示:“從編碼到創(chuàng)意寫(xiě)作,微調(diào)可以對(duì)各個(gè)領(lǐng)域的模型性能產(chǎn)生巨大影響?!?/p>

3.即日起至 9 月 23 日提供免費(fèi)tokens

OpenAI指出,開(kāi)發(fā)人員僅使用訓(xùn)練數(shù)據(jù)中的幾十個(gè)示例就能取得很好的效果。

為了啟動(dòng)這項(xiàng)新功能,OpenAI 將每天免費(fèi)提供最多 100 萬(wàn)個(gè)tokens,供任何第三方組織(客戶(hù))用于微調(diào) GPT-4o,截至 2024 年 9 月 23 日。

眾所周知,tokens實(shí)際上就像 AI 模型的“母語(yǔ)”一樣發(fā)揮作用,并且是 OpenAI 和其他模型提供商用來(lái)確定模型攝?。ㄝ斎耄┗蛱峁ㄝ敵觯┬畔⒘康臏y(cè)量方法。

開(kāi)發(fā)人員/客戶(hù)對(duì) LLM 或 LMM(例如 GPT-4o)進(jìn)行微調(diào)前,需要將與組織、團(tuán)隊(duì)或個(gè)人用例相關(guān)的數(shù)據(jù)轉(zhuǎn)換為它可以理解的tokens,即對(duì)其進(jìn)行標(biāo)記化,OpenAI 的微調(diào)工具提供這些功能。

然而,這是有代價(jià)的:通常對(duì) GPT-4o 進(jìn)行微調(diào)每 100 萬(wàn)個(gè)令牌的成本為 25 美元,而運(yùn)行微調(diào)版本的推理/生產(chǎn)模型的成本為每百萬(wàn)個(gè)輸入tokens3.75 美元,每百萬(wàn)個(gè)輸出tokens 15 美元。

對(duì)于使用較小的 GPT-4o mini模型的用戶(hù),截至 9 月 23 日,每天有 200 萬(wàn)個(gè)免費(fèi)訓(xùn)練tokens可用。

此項(xiàng)服務(wù)擴(kuò)展到所有付費(fèi)使用層的開(kāi)發(fā)人員,確保廣泛使用微調(diào)功能。

有媒體分析,OpenAI此舉也是日益激烈的競(jìng)爭(zhēng)環(huán)境中做出的決策,畢竟谷歌、Anthropic等其他閉源供應(yīng)商,Nous Research 推出的Meta Llama3.1的新變體Hermes3等都紛紛打起了價(jià)格戰(zhàn)。

不過(guò),OpenAI有著自己獨(dú)特的優(yōu)勢(shì),開(kāi)發(fā)人員可以不必再費(fèi)心思去托管推理、也不必去他們的自己搭建的服務(wù)器上進(jìn)行訓(xùn)練。開(kāi)發(fā)者如果有需要,甚至可以將他們喜歡的服務(wù)器鏈接到OpenAI的API上。

4.微調(diào)是否會(huì)帶來(lái)新的數(shù)據(jù)安全問(wèn)題

OpenAI 強(qiáng)調(diào),即使為開(kāi)發(fā)人員擴(kuò)展了定制選項(xiàng),安全性和數(shù)據(jù)隱私仍然是首要任務(wù)。經(jīng)過(guò)微調(diào)的模型可以完全控制業(yè)務(wù)數(shù)據(jù),并且不存在輸入或輸出被用于訓(xùn)練其他模型的風(fēng)險(xiǎn)。

此外,該公司還實(shí)施了分層安全緩解措施,包括自動(dòng)評(píng)估和使用情況監(jiān)控,以確保應(yīng)用程序遵守 OpenAI 的使用政策。

然而,研究表明,微調(diào)模型可能會(huì)導(dǎo)致它們偏離護(hù)欄和保障措施,并降低其整體性能。組織是否認(rèn)為值得冒險(xiǎn)取決于他們自己——然而,OpenAI 顯然認(rèn)為值得,并鼓勵(lì)他們將微調(diào)視為一個(gè)不錯(cuò)的選擇。

5.這只是一個(gè)開(kāi)始

事實(shí)上,早在 4 月份,OpenAI 宣布為開(kāi)發(fā)人員提供新的微調(diào)工具(例如基于 epoch 的檢查點(diǎn)創(chuàng)建)時(shí)就表示,“我們相信,未來(lái)絕大多數(shù)組織將開(kāi)發(fā)針對(duì)其行業(yè)、業(yè)務(wù)或用例個(gè)性化的定制模型?!?/p>

今天發(fā)布的全新 GPT-4o 微調(diào)功能凸顯了 OpenAI 對(duì)這一愿景的持續(xù)承諾:每個(gè)組織都有自己的定制 AI 模型的世界。

正如OpenAI 官方博客中所說(shuō)的:“這只是一個(gè)開(kāi)始——我們將繼續(xù)投資擴(kuò)大 開(kāi)發(fā)人員的模型定制 選項(xiàng)?!?/p>

本文轉(zhuǎn)載自??51CTO技術(shù)棧??,作者:言征

?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請(qǐng)注明出處,否則將追究法律責(zé)任
已于2024-8-22 14:50:52修改
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
社區(qū)精華內(nèi)容

目錄