自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

重磅!為了狙擊Manus,OpenAI開源了首個Agent SDK 原創(chuàng)

發(fā)布于 2025-3-17 10:26
瀏覽
0收藏

在當(dāng)今數(shù)字化飛速發(fā)展的時代,人工智能(AI)已經(jīng)滲透到我們生活的方方面面。從簡單的語音助手到復(fù)雜的自動化系統(tǒng),AI的應(yīng)用場景不斷拓展。然而,對于開發(fā)者和企業(yè)來說,如何將AI技術(shù)轉(zhuǎn)化為實際可用的智能代理(agents),一直是他們面臨的挑戰(zhàn)。今天,OpenAI正式發(fā)布了首批構(gòu)建模塊,旨在幫助開發(fā)者和企業(yè)打造實用且可靠的智能代理。這些代理能夠獨(dú)立完成用戶委托的任務(wù),極大地提升工作效率。

一、智能代理的崛起:從概念到現(xiàn)實

在過去的一年中,OpenAI不斷引入新的模型能力,例如高級推理、多模態(tài)交互以及新的安全技術(shù),這些都為構(gòu)建復(fù)雜多步驟任務(wù)的智能代理奠定了基礎(chǔ)。然而,許多客戶反饋,將這些能力轉(zhuǎn)化為生產(chǎn)就緒的智能代理并非易事,往往需要大量的提示迭代和自定義編排邏輯,且缺乏足夠的可見性或內(nèi)置支持。

為了解決這些挑戰(zhàn),OpenAI推出了一系列全新的API和工具,專門用于簡化智能代理應(yīng)用的開發(fā)。這些工具不僅優(yōu)化了核心代理邏輯、編排和交互,還讓開發(fā)者能夠更加輕松地開始構(gòu)建智能代理。在未來幾周和幾個月內(nèi),OpenAI還將繼續(xù)發(fā)布更多工具和功能,進(jìn)一步簡化和加速在平臺上構(gòu)建智能代理應(yīng)用的進(jìn)程。

二、重磅推出:Responses API

重磅!為了狙擊Manus,OpenAI開源了首個Agent SDK-AI.x社區(qū)

Responses API是OpenAI為構(gòu)建智能代理而推出的新API基礎(chǔ)。它結(jié)合了Chat Completions API的簡潔性與Assistants API的工具使用能力。隨著模型能力的不斷發(fā)展,Responses API將為開發(fā)者構(gòu)建智能代理應(yīng)用提供更靈活的基礎(chǔ)。通過單一的Responses API調(diào)用,開發(fā)者可以利用多種工具和模型輪次解決日益復(fù)雜的任務(wù)。

(一)Responses API的亮點

Responses API支持新的內(nèi)置工具,如網(wǎng)絡(luò)搜索、文件搜索和計算機(jī)使用。這些工具旨在協(xié)同工作,將模型與現(xiàn)實世界連接起來,使其在完成任務(wù)時更具實用性。此外,它還帶來了多項可用性改進(jìn),包括統(tǒng)一的基于項目的界面設(shè)計、更簡單的多態(tài)性、直觀的流式事件以及SDK輔助工具,例如??response.output_text??,方便開發(fā)者輕松訪問模型的文本輸出。

Responses API專為希望輕松將OpenAI模型和內(nèi)置工具集成到其應(yīng)用中的開發(fā)者設(shè)計,無需復(fù)雜地整合多個API或外部供應(yīng)商。該API還簡化了在OpenAI上存儲數(shù)據(jù)的過程,開發(fā)者可以利用追蹤和評估等功能來評估代理性能。需要提醒的是,OpenAI默認(rèn)不會使用商業(yè)數(shù)據(jù)訓(xùn)練模型,即使數(shù)據(jù)存儲在OpenAI上。從今天起,該API對所有開發(fā)者開放,并且不單獨(dú)收費(fèi)——代幣和工具的費(fèi)用按照定價頁面上規(guī)定的標(biāo)準(zhǔn)費(fèi)率計費(fèi)。開發(fā)者可以查看Responses API快速入門指南,了解更多詳情。

(二)對現(xiàn)有API的影響

Chat Completions API

Chat Completions仍然是OpenAI最受歡迎的API,OpenAI將繼續(xù)全力支持其新模型和功能。對于不需要內(nèi)置工具的開發(fā)者,可以繼續(xù)放心使用Chat Completions。不過,Responses API是Chat Completions的超集,具有相同的卓越性能,因此對于新的集成,OpenAI建議從Responses API開始。

Assistants API

根據(jù)開發(fā)者對Assistants API測試版的反饋,OpenAI將關(guān)鍵改進(jìn)融入了Responses API,使其更加靈活、快速且易于使用。OpenAI正在努力實現(xiàn)Assistants和Responses API之間的完全功能對等,包括支持類似Assistant和Thread的對象以及代碼解釋器工具。一旦完成,OpenAI計劃在2026年中期宣布正式棄用Assistants API,并提供一個明確的從Assistants API遷移到Responses API的指南,以便開發(fā)者保留所有數(shù)據(jù)并遷移其應(yīng)用。在正式宣布棄用之前,OpenAI將繼續(xù)向Assistants API提供新模型。Responses API代表了在OpenAI上構(gòu)建智能代理的未來方向。

三、Responses API中的內(nèi)置工具

(一)網(wǎng)絡(luò)搜索

開發(fā)者現(xiàn)在可以利用網(wǎng)絡(luò)搜索獲取快速、最新且相關(guān)性強(qiáng)的答案,并附上清晰的引用來源。在Responses API中,當(dāng)使用??gpt-4o???和??gpt-4o-mini??時,網(wǎng)絡(luò)搜索可作為工具使用,并且可以與其他工具或函數(shù)調(diào)用結(jié)合。

const response = await openai.responses.create({
    model: "gpt-4o",
    tools: [ { type: "web_search_preview" } ],
    input: "What was a positive news story that happened today?",
});
console.log(response.output_text);

在早期測試中,開發(fā)者將網(wǎng)絡(luò)搜索應(yīng)用于多種場景,包括購物助手、研究代理和旅行預(yù)訂代理——任何需要及時從網(wǎng)絡(luò)獲取信息的應(yīng)用場景。例如,Hebbia利用網(wǎng)絡(luò)搜索工具,幫助資產(chǎn)管理公司、私募股權(quán)和信貸公司以及律師事務(wù)所從廣泛的公共和私有數(shù)據(jù)集中快速提取可操作的見解。通過將實時搜索能力整合到他們的研究工作流程中,Hebbia提供了更豐富、更具針對性的市場情報,并持續(xù)提升其分析的精確性和相關(guān)性,超越當(dāng)前的基準(zhǔn)。

網(wǎng)絡(luò)搜索在API中的表現(xiàn)與ChatGPT搜索所使用的模型相同。在SimpleQA基準(zhǔn)測試中,該測試評估LLM在回答簡短事實性問題時的準(zhǔn)確性,??GPT-4o???搜索預(yù)覽和??GPT-4o mini??搜索預(yù)覽分別獲得了90%和88%的準(zhǔn)確率。

重磅!為了狙擊Manus,OpenAI開源了首個Agent SDK-AI.x社區(qū)

網(wǎng)絡(luò)搜索生成的響應(yīng)中包含指向來源的鏈接,例如新聞文章和博客帖子,為用戶提供了進(jìn)一步了解的途徑。這些清晰的內(nèi)聯(lián)引用讓用戶以全新的方式與信息互動,同時內(nèi)容所有者也獲得了接觸更廣泛受眾的新機(jī)會。

任何網(wǎng)站或出版商都可以選擇在API的網(wǎng)絡(luò)搜索中出現(xiàn)。網(wǎng)絡(luò)搜索工具目前以預(yù)覽形式向所有開發(fā)者開放。此外,OpenAI還在Chat Completions API中通過??gpt-4o-search-preview???和??gpt-4o-mini-search-preview???為開發(fā)者提供了直接訪問其微調(diào)搜索模型的權(quán)限。??GPT-4o???搜索和??4o-mini??搜索的定價分別為每千次查詢30美元和25美元。開發(fā)者可以在Playground中體驗網(wǎng)絡(luò)搜索,并在文檔中了解更多詳情。

(二)文件搜索

開發(fā)者現(xiàn)在可以使用改進(jìn)后的文件搜索工具輕松從大量文檔中檢索相關(guān)信息。該工具支持多種文件類型、查詢優(yōu)化、元數(shù)據(jù)過濾和自定義重排,能夠快速、準(zhǔn)確地返回搜索結(jié)果。同樣,通過Responses API,只需幾行代碼即可完成集成。

const productDocs = await openai.vectorStores.create({
    name: "Product Documentation",
    file_ids: [file1.id, file2.id, file3.id],
});

const response = await openai.responses.create({
    model: "gpt-4o-mini",
    tools: [{
        type: "file_search",
        vector_store_ids: [productDocs.id],
    }],
    input: "What is deep research by OpenAI?",
});
console.log(response.output_text);

文件搜索工具可用于多種現(xiàn)實世界的應(yīng)用場景,包括幫助客戶支持代理輕松訪問常見問題解答(FAQ)、協(xié)助法律助理快速參考過往案例以及幫助編碼代理查詢技術(shù)文檔。例如,Navan在其AI驅(qū)動的旅行代理中使用文件搜索,能夠快速從知識庫文章(如公司的旅行政策)中為用戶提供精確答案。憑借內(nèi)置的查詢優(yōu)化和重排功能,Navan無需額外調(diào)整或配置即可建立強(qiáng)大的檢索增強(qiáng)生成(RAG)管道。通過為每個用戶群體設(shè)置專用的向量存儲,Navan能夠根據(jù)個人賬戶設(shè)置和用戶角色定制答案,為客戶及其員工節(jié)省時間,同時提供準(zhǔn)確、個性化的支持。

該工具在Responses API中對所有開發(fā)者開放。使用費(fèi)用為每千次查詢2.50美元,文件存儲費(fèi)用為每GB每天0.10美元,首GB免費(fèi)。該工具繼續(xù)在Assistants API中提供。此外,OpenAI還在向量存儲API對象中添加了一個新的搜索端點,以便直接查詢數(shù)據(jù)以供其他應(yīng)用和API使用。開發(fā)者可以在文檔中了解更多詳情,并在Playground中開始測試。

(三)計算機(jī)使用

為了構(gòu)建能夠在計算機(jī)上完成任務(wù)的代理,開發(fā)者現(xiàn)在可以使用Responses API中的計算機(jī)使用工具。該工具由與Operator相同的計算機(jī)使用代理(CUA)模型提供支持。這一研究預(yù)覽模型在OSWorld(用于完整計算機(jī)使用任務(wù))上取得了38.1%的成功率,在WebArena上取得了58.1%的成功率,在WebVoyager(用于基于網(wǎng)絡(luò)的交互)上取得了87%的成功率,均創(chuàng)下了新的行業(yè)記錄。

內(nèi)置的計算機(jī)使用工具可以捕獲模型生成的鼠標(biāo)和鍵盤動作,使開發(fā)者能夠通過將這些動作直接轉(zhuǎn)換為其環(huán)境中的可執(zhí)行命令來自動化計算機(jī)任務(wù)。

const response = await openai.responses.create({
    model: "computer-use-preview",
    tools: [{
        type: "computer_use_preview",
        display_width: 1024,
        display_height: 768,
        environment: "browser",
    }],
    truncation: "auto",
    input: "I'm looking for a new camera. Help me find the best one.",
});
console.log(response.output);

例如,開發(fā)者可以使用計算機(jī)使用工具自動化基于瀏覽器的工作流程,如對Web應(yīng)用進(jìn)行質(zhì)量保證或在遺留系統(tǒng)中執(zhí)行數(shù)據(jù)輸入任務(wù)。例如,Unify是一個用于增加收入的行動系統(tǒng),它使用代理來識別意圖、研究賬戶并與買家互動。通過使用OpenAI的計算機(jī)使用工具,Unify的代理可以訪問以前無法通過API獲取的信息——例如,使物業(yè)管理公司能夠通過在線地圖驗證企業(yè)是否擴(kuò)大了其房地產(chǎn)足跡。這種研究作為自定義信號,觸發(fā)個性化的推廣活動——賦予上市團(tuán)隊以精準(zhǔn)和規(guī)?;男问脚c買家互動的能力。

另一個例子是Luminai,它將計算機(jī)使用工具整合到大型企業(yè)的復(fù)雜運(yùn)營工作流中,這些企業(yè)通常缺乏API可用性和標(biāo)準(zhǔn)化數(shù)據(jù)。在與一家主要社區(qū)服務(wù)組織的最近試點中,Luminai僅用了幾天時間就自動化了申請?zhí)幚砗陀脩糇粤鞒獭@是傳統(tǒng)機(jī)器人流程自動化(RPA)在數(shù)月努力后仍難以實現(xiàn)的。

在去年推出Operator中的CUA之前,OpenAI進(jìn)行了廣泛的安全測試和紅隊測試,重點關(guān)注三個關(guān)鍵風(fēng)險領(lǐng)域:濫用、模型錯誤和前沿風(fēng)險。為了應(yīng)對通過CUA在API中將Operator的能力擴(kuò)展到本地操作系統(tǒng)所帶來的風(fēng)險,OpenAI進(jìn)行了額外的安全評估和紅隊測試。OpenAI還為開發(fā)者增加了緩解措施,包括防止提示注入的安全檢查、敏感任務(wù)的確認(rèn)提示、幫助開發(fā)者隔離其環(huán)境的工具以及增強(qiáng)對潛在政策違規(guī)行為的檢測。盡管這些緩解措施有助于降低風(fēng)險,但該模型仍可能在非瀏覽器環(huán)境中出現(xiàn)意外錯誤。例如,CUA在OSWorld(一個衡量AI代理在現(xiàn)實世界任務(wù)中表現(xiàn)的基準(zhǔn)測試)上的表現(xiàn)目前為38.1%,表明該模型尚未達(dá)到在操作系統(tǒng)上自動化任務(wù)的高度可靠性。在這種情況下,建議進(jìn)行人工監(jiān)督。有關(guān)OpenAI針對API特定安全工作的更多細(xì)節(jié),可以在更新的系統(tǒng)卡片中找到。

重磅!為了狙擊Manus,OpenAI開源了首個Agent SDK-AI.x社區(qū)

從今天起,計算機(jī)使用工具作為研究預(yù)覽在Responses API中向使用層級3-5的開發(fā)者開放。使用費(fèi)用為每百萬輸入代幣3美元,每百萬輸出代幣12美元。開發(fā)者可以在文檔中了解更多詳情,并查看示例應(yīng)用,了解如何使用該工具進(jìn)行構(gòu)建。

四、智能代理開發(fā)的利器:Agents SDK

除了構(gòu)建智能代理的核心邏輯并為其提供工具以使其有用之外,開發(fā)者還需要編排智能代理的工作流。OpenAI新推出的開源Agents SDK簡化了多智能代理工作流的編排,并在去年發(fā)布的Swarm實驗性SDK的基礎(chǔ)上進(jìn)行了顯著改進(jìn)。Swarm被開發(fā)者社區(qū)廣泛采用,并成功部署在多個客戶項目中。

(一)Agents SDK的改進(jìn)

  • 智能代理:易于配置的LLM,帶有清晰的指令和內(nèi)置工具。
  • 交接:智能地在代理之間轉(zhuǎn)移控制權(quán)。
  • 防護(hù)欄:可配置的安全檢查,用于輸入和輸出驗證。
  • 追蹤與可觀測性:可視化代理執(zhí)行軌跡,以便調(diào)試和優(yōu)化性能。

(二)Agents SDK的應(yīng)用場景

Agents SDK適用于多種現(xiàn)實世界的應(yīng)用場景,包括客戶支持自動化、多步驟研究、內(nèi)容生成、代碼審查和銷售前景分析。例如,Coinbase使用Agents SDK快速原型化并部署了AgentKit,這是一個工具包,使AI代理能夠與加密錢包和各種鏈上活動無縫互動。在短短幾個小時內(nèi),Coinbase將來自其開發(fā)者平臺SDK的自定義動作整合到一個功能齊全的代理中。AgentKit的精簡架構(gòu)簡化了添加新代理動作的過程,讓開發(fā)者能夠更多地專注于有意義的整合,而無需在復(fù)雜的代理設(shè)置中耗費(fèi)過多精力。

在短短幾天內(nèi),Box能夠快速創(chuàng)建代理,利用網(wǎng)絡(luò)搜索和Agents SDK,使企業(yè)能夠搜索、查詢并從Box內(nèi)部存儲的非結(jié)構(gòu)化數(shù)據(jù)以及公共互聯(lián)網(wǎng)來源中提取見解。這種方法不僅讓客戶能夠訪問最新信息,還能安全地搜索其內(nèi)部專有數(shù)據(jù),同時遵守其內(nèi)部權(quán)限和安全策略。例如,金融服務(wù)公司可以構(gòu)建一個自定義代理,調(diào)用Box AI代理,將存儲在Box中的內(nèi)部市場分析與網(wǎng)絡(luò)上的實時新聞和經(jīng)濟(jì)數(shù)據(jù)相結(jié)合,為其分析師提供全面的投資決策視角。

Agents SDK與Responses API和Chat Completions API兼容。只要其他提供商的模型提供類似Chat Completions的API端點,SDK也可以與之配合使用。開發(fā)者可以立即將其集成到他們的Python代碼庫中,Node.js支持也將很快推出。開發(fā)者可以在文檔中了解更多詳情。

在設(shè)計Agents SDK時,OpenAI團(tuán)隊受到了社區(qū)其他優(yōu)秀作品的啟發(fā),包括Pydantic、Griffe和MkDocs。OpenAI致力于將Agents SDK作為一個開源框架繼續(xù)發(fā)展,以便社區(qū)能夠在此基礎(chǔ)上進(jìn)行擴(kuò)展。

(三)示例代碼

以下是一個簡單的Python代碼示例,展示了如何使用Agents SDK構(gòu)建和運(yùn)行智能代理:

from agents import Agent, Runner, WebSearchTool, function_tool, guardrail

@function_tool
def submit_refund_request(item_id: str, reason: str):
    # Your refund logic goes here
    return "success"

support_agent = Agent(
    name="Support & Returns",
    instructinotallow="You are a support agent who can submit refunds [...]",
    tools=[submit_refund_request],
)

shopping_agent = Agent(
    name="Shopping Assistant",
    instructinotallow="You are a shopping assistant who can search the web [...]",
    tools=[WebSearchTool()],
)

triage_agent = Agent(
    name="Triage Agent",
    instructinotallow="Route the user to the correct agent.",
    handoffs=[shopping_agent, support_agent],
)

output = Runner.run_sync(
    starting_agent=triage_agent,
    input="What shoes might work best with my outfit so far?",
)
print(output)

重磅!為了狙擊Manus,OpenAI開源了首個Agent SDK-AI.x社區(qū)

五、展望未來:構(gòu)建智能代理平臺

OpenAI相信,智能代理將成為未來勞動力的重要組成部分,顯著提升各行業(yè)的生產(chǎn)力。隨著公司越來越多地尋求利用AI完成復(fù)雜任務(wù),OpenAI致力于提供構(gòu)建模塊,使開發(fā)者和企業(yè)能夠有效創(chuàng)建能夠產(chǎn)生實際影響的自主系統(tǒng)。

通過今天的發(fā)布,OpenAI引入了首批構(gòu)建模塊,賦予開發(fā)者和企業(yè)更輕松地構(gòu)建、部署和擴(kuò)展可靠、高性能的AI智能代理的能力。隨著模型能力越來越具有代理性,OpenAI將繼續(xù)投資于跨API的深度整合以及新工具的開發(fā),以幫助在生產(chǎn)環(huán)境中部署、評估和優(yōu)化智能代理。OpenAI的目標(biāo)是為開發(fā)者提供一個無縫的平臺體驗,用于構(gòu)建能夠幫助各行業(yè)完成各種任務(wù)的智能代理。OpenAI期待看到開發(fā)者接下來構(gòu)建的成果。開發(fā)者可以立即探索OpenAI的文檔,并關(guān)注即將發(fā)布的更多更新。

在這個充滿機(jī)遇的時代,OpenAI的這些新工具和API將為開發(fā)者提供強(qiáng)大的支持,助力他們將創(chuàng)意轉(zhuǎn)化為現(xiàn)實,推動AI技術(shù)在各個領(lǐng)域的廣泛應(yīng)用。讓我們拭目以待,看看這些智能代理將如何改變我們的未來!


本文轉(zhuǎn)載自公眾號Halo咯咯    作者:基咯咯

原文鏈接:??https://mp.weixin.qq.com/s/rOpvCY3opIkZ6F9LMH5M3w??

?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請注明出處,否則將追究法律責(zé)任
標(biāo)簽
收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦