自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<tfoot id="u5eju"><progress id="u5eju"></progress></tfoot>

^{<blockquote id="u5eju"></blockquote>}

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

OpenDevin自動化代碼生成工具評述

發(fā)布于 2024-5-31 16:23

瀏覽

0收藏

1.概念

OpenDevin整個系統(tǒng)分為前端和后端兩個主要部分。前端負(fù)責(zé)處理用戶交互和顯示結(jié)果，而后端負(fù)責(zé)處理業(yè)務(wù)邏輯和執(zhí)行 AI Agent。在計算機(jī)科學(xué)和人工智能領(lǐng)域，"智能體"（Agent）一詞通常用來指代那些在特定環(huán)境中展示出自治性、反應(yīng)性、社交性、主動性、推理性以及認(rèn)知性等智能特性的軟件或硬件實體。AI智能體是一個具備復(fù)雜推理、記憶和任務(wù)執(zhí)行能力的高級系統(tǒng)。

2.OpenDevin核心組件

AgentHub

OpenDevin是一個集成了多種智能體（Agent）實現(xiàn)的平臺，包括monologue_agent、codeact_agent、planner_agent、SWE_agent、delegator_agent和dummy_agent等。用戶可以根據(jù)自己的需求，自由選擇使用其中任何一個智能體。每個智能體都被設(shè)計成一個循環(huán)流程，通過調(diào)用agent.step()方法，在每次迭代中接收當(dāng)前狀態(tài)（State）作為輸入，并輸出相應(yīng)的動作（Actions）來執(zhí)行操作或命令。執(zhí)行動作后，智能體可能會接收到一些觀察（Observations）結(jié)果。在實現(xiàn)智能體的過程中，每個智能體類都需要實現(xiàn)step和search_memory這兩個方法。step方法用于執(zhí)行指令，而search_memory方法則用于從智能體的記憶中查詢信息。此外，OpenDevin還提供了一些輔助方法，如reset（重置智能體狀態(tài)）、register（注冊智能體）、get_cls（獲取智能體類）、list_agents（列出所有智能體）等，這些方法可以幫助用戶更好地管理和維護(hù)智能體的狀態(tài)以及注冊信息。

狀態(tài) （State）

狀態(tài)對象是智能體執(zhí)行任務(wù)時所依賴的重要信息的集合體。它主要包括以下三個方面的內(nèi)容：

智能體采取的動作的歷史記錄以及這些動作產(chǎn)生的觀察結(jié)果。這些觀察結(jié)果可能包括文件的內(nèi)容、命令的輸出等信息。
自智能體執(zhí)行最近一步動作以來，所發(fā)生的一系列動作和觀察結(jié)果的軌跡。這些信息有助于智能體追蹤和分析任務(wù)的執(zhí)行過程。
一個計劃（plan）對象，它包含了智能體的主要目標(biāo)。智能體可以通過AddTaskAction和ModifyTaskAction這兩個操作來添加和修改子任務(wù)，從而更好地實現(xiàn)其主要目標(biāo)。

動作（Actions）

Agent 有一系列可以執(zhí)行的動作列表，其中一些包括：

CmdRunAction：在沙盒化的終端中運行命令。
FileReadAction：讀取文件內(nèi)容。
ModifyTaskAction：更改子任務(wù)的狀態(tài)。
AgentThinkAction：允許 Agent 添加純文本到歷史記錄中的無操作。
AgentFinishAction：停止控制循環(huán)，允許用戶輸入新任務(wù)。

觀察（Observations）

Agent 在執(zhí)行動作后可能接收到的觀察結(jié)果列表如下：

CmdOutputObservation：命令執(zhí)行輸出。
BrowserOutputObservation：瀏覽 URL 后的輸出。
FileReadObservation：文件讀取操作的輸出。
AgentRecallObservation：Agent 回憶操作的輸出。
AgentErrorObservation：Agent 執(zhí)行操作時發(fā)生錯誤的輸出。

前后端布局如下：

OpenDevin自動化代碼生成工具評述-AI.x社區(qū)

OpenDevin自動化代碼生成工具評述-AI.x社區(qū)

3.OpenDevin的能力

OpenDevin支持多種Agent智能體的選擇。以CodeActAgent為例，它是一個開源的語言模型（LLM），它具有對文本操作進(jìn)行顯式優(yōu)化的能力。它使用可執(zhí)行的Python代碼來將LLM代理的動作統(tǒng)一到一個統(tǒng)一的操作空間中，稱為CodeAct。借助Python解釋器，CodeAct可以執(zhí)行代碼操作，并通過多輪交互動態(tài)修改之前的操作或根據(jù)新的觀察發(fā)出新的操作。CodeActAgent框架可以根據(jù)現(xiàn)有的若干Action-Observation對的軌跡預(yù)測下一步需要執(zhí)行什么Action，遵循業(yè)界流行的ReAct反思框架。ReAct的提示模版一般包含這些內(nèi)容的多次重復(fù)：

Thought: ...
Action: ...
Observation: ...
... (Repeat many times)

CodeAct的思想是: 由LLM生成的代碼和用戶發(fā)起的消息構(gòu)成Action，在環(huán)境中運行代碼就視為執(zhí)行了這個 Action，擴(kuò)大了 Agent 的 action space，用更少的交互次數(shù)完成更多的任務(wù)。在CodeAct的架構(gòu)中，Agent接收來自User和Environment的消息，互相之間進(jìn)行消息通信。同時使用CoT(Chain of Thoughts)思維樹將任務(wù)進(jìn)行切分，直接將執(zhí)行結(jié)果轉(zhuǎn)為自然語言總結(jié)。Agent會向 Environment 發(fā)出 Action，生成代碼并執(zhí)行；向 User 發(fā)送 Action 的生成自然語言回復(fù)。User會向Agent發(fā)送自然語言的請求或者反饋，同時接收 Agent 的 Action 的生成自然語言回復(fù)。而Environment會向 Agent 發(fā)送 Action 的執(zhí)行結(jié)果，因為他可以通過bash 命令行或 Python 解釋器執(zhí)行 Action 生成的代碼。以下是CodeAct框架的原理圖：

OpenDevin自動化代碼生成工具評述-AI.x社區(qū)

OpenDevin自動化代碼生成工具評述-AI.x社區(qū)

SWE-Agent是另一種有效的代碼生成智能體。它不僅支持簡單的代碼生成任務(wù)，還支持軟件維護(hù)（例如錯誤修復(fù)）和軟件演化（如功能添加）等更為復(fù)雜的程序改進(jìn)任務(wù)。其精心定制的 ACI（Agent-Computer Interface）極大地增強了 Agent 創(chuàng)建和編輯代碼文件、瀏覽完整代碼庫以及執(zhí)行程序的能力。SWE-agent的核心功能包括：搜索與導(dǎo)航、文件查看器、文件編輯器以及上下文管理。

SWE-agent 通過搜索與導(dǎo)航，能夠簡潔地列出所有包含搜索字符串的文件名，減少混淆。導(dǎo)航代碼庫需要找到適合當(dāng)前任務(wù)的文件和內(nèi)容。常見策略是查找可能有用的術(shù)語，如問題中提到的文件、函數(shù)或類定義。SWE-agent 引入了特殊命令 find file、search file 和 search dir，當(dāng)搜索文件名或文件/目錄中的字符串時，這些命令會輸出搜索結(jié)果的摘要

當(dāng)搜索到想查看的文件后，可以通過調(diào)用 open 命令打開路徑來使用交互式文件查看器。文件查看器一次最多顯示文件的 100 行窗口，Agent 可以使用 scroll down 和 scroll up 命令移動窗口，也可以使用 goto 命令跳至特定行。為了方便文件內(nèi)導(dǎo)航和代碼定位，SWE-agent 顯示打開文件的完整路徑、文件的總行數(shù)、當(dāng)前窗口前后的省略行數(shù)以及每行的行號（在可見行前添加）。

OpenDevin自動化代碼生成工具評述-AI.x社區(qū)

在進(jìn)行文件編輯的階段，SWE-agent不僅支持基本的文件瀏覽，還提供了高效的滾動和搜索功能。限制每次顯示的代碼行數(shù)為 100 行，旨在提高瀏覽效率且減少信息過載。

OpenDevin自動化代碼生成工具評述-AI.x社區(qū)

為了保持 Agent 上下文的簡潔性和充分性，SWE-agent 構(gòu)建了一系列詳細(xì)且復(fù)雜的提示詞模板。在每個步驟中都會接收到關(guān)于正確使用 bash 和 ACI 命令的指令、文檔和演示。若執(zhí)行代碼錯誤，SWE-agent 會要求重試，直到收到正確生成的響應(yīng)。一旦收到有效響應(yīng)，過去的錯誤信息將被省略，僅保留最初的。又或者，當(dāng)命令執(zhí)行成功但無輸出時，系統(tǒng)會提供明確的反饋，增強交互明確性。

SWE-agent的工作流程如下圖，整體上仍然使用了ReAct框架，通過反復(fù)采取行動和獲得反饋來與環(huán)境進(jìn)行工作。

OpenDevin自動化代碼生成工具評述-AI.x社區(qū)

在初始化階段，agent會創(chuàng)建一個實例，提供模擬的開發(fā)環(huán)境，并且將整個交互過程中所有的軌跡存儲到特定的工作目錄中。同時，每個實例都會被審查，以確定是否有任何實例不符合條件應(yīng)該被跳過。對選定的實例進(jìn)行環(huán)境重置，將其恢復(fù)到該實例的初始狀態(tài)，并獲取初始信息。

執(zhí)行階段，首先為 Agent 配置適當(dāng)?shù)膮?shù)并初始化其內(nèi)部模型，以準(zhǔn)備迎接下游任務(wù)。在一個交互循環(huán)中，Agent首先會根據(jù)當(dāng)前的文件狀態(tài)state和觀察結(jié)果observation，生成對應(yīng)的思考thought和行動action。在這個過程中，實例會根據(jù) Agent 提出的行動執(zhí)行相應(yīng)的命令，結(jié)果將被更新到觀察結(jié)果中。每次交互后， Agent 的行動、觀察結(jié)果和響應(yīng)的行為軌跡都會被保存。當(dāng) Agent 的行動中包含“submit”命令時，意味著問題已解決，同時保存補丁patch并標(biāo)記該問題為已完成done = True，交互循環(huán)隨之結(jié)束。

保存階段，Agent 在整個交互過程中生成的預(yù)測結(jié)果以及行動軌跡都會被記錄。

3.OpenDevin的體驗

OpenDevin可以在Windows、Linux等操作系統(tǒng)進(jìn)行部署，同時提供前端UI頁面。詳細(xì)的前后端部署流程請見 OpenDevin。使用Ollama部署大語言模型，并在如下的初始化頁面中選擇已經(jīng)部署好的各項服務(wù)。

用戶可以根據(jù)自己的偏好和需求，選擇不同的智能體Agent。不同Agent可以執(zhí)行的任務(wù)以及流程會有些不同。以下是分別使用SWE-agent和CoderAgent對同一個問題進(jìn)行回答的結(jié)果，兩者都使用codeqwen1.5-7B作為基座模型。可以看到SWE-agent將用戶輸入的任務(wù)拆解成編寫代碼、分不同語言實現(xiàn)以及寫入3個主要步驟，能完成一系列的任務(wù)而非只是對話問答。

OpenDevin自動化代碼生成工具評述-AI.x社區(qū)

OpenDevin自動化代碼生成工具評述-AI.x社區(qū)

使用SWE-agent作為agent，配合GPT4對問題的理解和生成文本能力，可以讓大語言模型完成項目級代碼的生成。下圖顯示了通過指令讓OpenDevin訪問github代碼庫，復(fù)制到本地并新建分支，完成文件的修改并且push到遠(yuǎn)程的一系列流程，大語言模型先后完成了任務(wù)拆解，規(guī)劃執(zhí)行并且調(diào)用各項工具的工作流程，展示了其能夠進(jìn)行自主生成代碼并提交的能力。

OpenDevin自動化代碼生成工具評述-AI.x社區(qū)

OpenDevin自動化代碼生成工具評述-AI.x社區(qū)

OpenDevin自動化代碼生成工具評述-AI.x社區(qū)

參考文獻(xiàn)

1. Devin: https://www.cognition-labs.com/introducing-devin

2. SWE-agent: https://github.com/princeton-nlp/SWE-agent

3. CodeAct-agent: [2402.01030] Executable Code Actions Elicit Better LLM Agents (arxiv.org)

4. OpenDevin/SWE-bench: Enhanced fork of SWE-bench, tailored for OpenDevin's ecosystem. (github.com)

5. Qwen/Qwen1.5-14B-Chat · Hugging Face

6. 2404.10225 (arxiv.org)

7. 2405.15793 (arxiv.org)

本文轉(zhuǎn)載自?? AI遇見云??，作者：魏至強

標(biāo)簽

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

手把手教你使用用AI自動化制作PPT

pangguiyu ? 2810瀏覽 ? 0回復(fù)
盤點六大Devin替代方案：自動化你的編程任務(wù)

51CTO技術(shù)棧 ? 5757瀏覽 ? 0回復(fù)
提速5倍震驚陶哲軒，80%數(shù)學(xué)步驟全自動化

duhorse ? 2728瀏覽 ? 0回復(fù)
如何構(gòu)建終極的AI自動化系統(tǒng)：多代理協(xié)作指南

ermulong ? 2964瀏覽 ? 0回復(fù)
革新GUI自動化：V-Zen模型引領(lǐng)多模態(tài)語言模型新紀(jì)元

AI論文解讀 ? 2854瀏覽 ? 0回復(fù)
3D資產(chǎn)生成領(lǐng)域福音：自動化所、北郵團(tuán)隊聯(lián)合打造材質(zhì)生成新范式

輕薄滴假象 ? 2413瀏覽 ? 0回復(fù)
OpenDevin自動化代碼生成工具評述

zhcs333 ? 5722瀏覽 ? 0回復(fù)
RePrompt：提示詞自動化優(yōu)化策略

大語言模型論文跟蹤 ? 4330瀏覽 ? 0回復(fù)
基于LangGraph多智能體技術(shù)，搭建AI寫作自動化系統(tǒng)

小虎哦哦 ? 3809瀏覽 ? 0回復(fù)
AI科學(xué)家：大模型全自動化撰寫科研論文

AIRoobt ? 3735瀏覽 ? 0回復(fù)
使用TAG和RAG實現(xiàn)摘要和標(biāo)簽的自動化來簡化客戶反饋分析

51CTO內(nèi)容精選 ? 2237瀏覽 ? 0回復(fù)
數(shù)據(jù)分析自動化：LIDA智能可視化的魔法！

Halo咯咯 ? 2095瀏覽 ? 0回復(fù)
借助LLM實現(xiàn)模型選擇和試驗自動化

51CTO內(nèi)容精選 ? 2058瀏覽 ? 0回復(fù)
Crawl4AI：AI驅(qū)動的網(wǎng)頁抓取神器，結(jié)合LLM實現(xiàn)自動化數(shù)據(jù)提取與處理

老蛀蟲 ? 4500瀏覽 ? 0回復(fù)
AMD發(fā)布科研Agent，論文自動化評分趨近頂會NeurIPS水平！

PaperAgent ? 1789瀏覽 ? 0回復(fù)
自動化漏洞修復(fù)：從基于模板的方法到AI代理的演變

51CTO內(nèi)容精選 ? 1244瀏覽 ? 0回復(fù)
如何利用人工智能和事件驅(qū)動設(shè)計實現(xiàn)播客推廣的自動化

51CTO內(nèi)容精選 ? 738瀏覽 ? 0回復(fù)
5個極其有用的 Python 自動化腳本

wx67f8a73a40259 ? 614瀏覽 ? 0回復(fù)
【人工智能】通過ChatGPT、Claude與通義千問 API 實現(xiàn)智能語料知識圖譜的自動化構(gòu)建（詳細(xì)教程）

唐克 ? 534瀏覽 ? 0回復(fù)

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

揭秘Google A2A協(xié)議：原理、應(yīng)用與未來 18h前發(fā)布
融合語言模型的多模態(tài)大模型研究 2025-04-08 00:32:18發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計深度剖析 & 使用 Spring AI + MCP 四步教你實現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇：【深度解析】自然語言生成中的“幻覺”現(xiàn)象

下一篇： OpenDevin自動化代碼生成工具評述

社區(qū)精華內(nèi)容

目錄

<blockquote id="1gisz"><delect id="1gisz"></delect></blockquote>