自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<xmp id="grgdt"><cite id="grgdt"><rp id="grgdt"></rp></cite></xmp>

<sub id="grgdt"></sub>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學堂

IT職業(yè)在線教育平臺

開源版AI程序員來了：GPT-4加持，能力比肩Devin，一天1.4k Star

輕薄滴假象

發(fā)布于 2024-4-3 12:16

瀏覽

0收藏

最近，有很多人在為 AI 代替自己的工作而擔憂。

上個月火遍 AI 圈的「首位 AI 程序員」Devin，利用大模型能力已經(jīng)掌握了全棧技能，僅需要人類給出自然語言指令，就可以自動完成復雜的代碼任務。

Devin 展示的能力非常驚艷，不過這款工具出自走閉源路線的創(chuàng)業(yè)公司，現(xiàn)在只有一小部分獲得了內(nèi)測名額的人才能使用。

本周二，來自普林斯頓大學 NLP 組的研究人員放出了 SWE-agent —— 一個開源版 AI 程序員，不到一天就獲得了上千的 GitHub Star 量。

開源版AI程序員來了：GPT-4加持，能力比肩Devin，一天1.4k Star-AI.x社區(qū)

SWE-agent 是一款用于自主解決 GitHub 存儲庫中問題的新系統(tǒng)。它在 SWE-bench 上獲得了與 Devin 相似的準確度，平均耗時為 93 秒。

開源版AI程序員來了：GPT-4加持，能力比肩Devin，一天1.4k Star-AI.x社區(qū)

項目網(wǎng)站：https://swe-agent.com/
GitHub：https://github.com/princeton-nlp/SWE-agent?

該項目的作者 John Yang 表示，相關(guān)論文的預印版也將在 4 月 10 號上傳。

從原理上看，SWE-agent 通過將大模型（例如 GPT-4）轉(zhuǎn)變?yōu)檐浖こ讨悄荏w，可以修復真實 GitHub 存儲庫中的錯誤和問題。

在完整的 SWE-bench 測試集上，SWE-agent 解決了 12.29% 的問題，實現(xiàn)了 SOTA 性能。

開源版AI程序員來了：GPT-4加持，能力比肩Devin，一天1.4k Star-AI.x社區(qū)

為了提供開發(fā)過程中的自動化，SWE-agent 通過與專用終端交互來工作，它可以打開、搜索文件內(nèi)容，使用自動語法檢查、編輯特定行，也可以編寫并執(zhí)行測試。

該項目的開發(fā)者精心設(shè)計了 UI 界面，并在 GitHub 上進行了介紹。

智能體 - 計算機接口 (ACI)

研究團隊設(shè)計了簡單的以大模型（LM）為中心的命令和反饋格式，使大模型能夠更方便地瀏覽存儲庫、查看、編輯和執(zhí)行代碼文件，這被稱為智能體 - 計算機接口 (ACI)。研究團隊還構(gòu)建了 SWE 智能體存儲庫，以便輕松迭代存儲庫級編碼智能體的 ACI 設(shè)計。

就像語言模型需要良好的提示工程（prompt engineering）一樣，良好的 ACI 設(shè)計在使用智能體時會帶來更好的結(jié)果。沒有經(jīng)過良好調(diào)整的 ACI 的基線智能體的表現(xiàn)比 SWE-agent 差得多。

SWE-agent 包含研究團隊在智能體 - 計算機接口設(shè)計過程中發(fā)現(xiàn)的非常有用的功能，包括：

1. 添加一個在發(fā)出編輯命令時運行的 linter，如果代碼語法不正確，則不會讓編輯命令通過。

2. 為智能體提供一個專門構(gòu)建的文件查看器。研究團隊發(fā)現(xiàn)此文件查看器在每輪僅顯示 100 行時效果最佳，并且該文件編輯器具有上下滾動以及在文件中執(zhí)行搜索的命令。

3. 為智能體提供專門構(gòu)建的全目錄字符串搜索命令。研究團隊發(fā)現(xiàn)該工具簡潔地列出匹配項非常重要 —— 只需列出至少有一個匹配項的每個文件。該研究表明，向模型顯示有關(guān)每個匹配的更多上下文對于模型來說太混亂了。

4. 當命令的輸出為空時，返回一條消息：「您的命令已成功運行，但未產(chǎn)生任何輸出」。

未來發(fā)布的論文將詳述更多信息。

安裝與使用

要使用 SWE-agent，首先要設(shè)置好如下條件：

1. 安裝 Docker，并在本地啟動 Docker；

2. 安裝 Miniconda，并使用 conda env create -fenvironment.yml 創(chuàng)建 swe-agent 環(huán)境；

3. 使用 conda activate swe-agent 激活；

4. 運行 ./setup.sh 創(chuàng)建 swe-agent docker 鏡像；

5. 在此存儲庫的根目錄下創(chuàng)建一個 keys.cfg 文件并填寫以下內(nèi)容：

OPENAI_API_KEY: 'OpenAI API Key Here if using OpenAI Model (optional)'
ANTHROPIC_API_KEY: 'Anthropic API Key Here if using Anthropic Model (optional)'
GITHUB_TOKEN: 'GitHub Token Here (required)'

SWE-agent pipeline 包含兩個步驟：

第一步：SWE-agent 接收輸入的 GitHub 問題，并返回嘗試修復它的拉取請求（pull request）；
第二步：評估拉取請求以驗證它確實解決了問題（目前僅適用于 SWE-bench 基準測試中的問題）。

如果想在整個 SWE-bench 上運行和評估，最簡單的方法是使用 x86 機器。

python run.py --model_name gpt4 \
  --data_path https://github.com/pvlib/pvlib-python/issues/1603 --config_file config/default_from_url.yaml

python run.py --model_name gpt4 \
  --per_instance_cost_limit 2.00 \
  --config_file ./config/default.yaml

如果想運行 SWE-bench 中的單個問題，可以使用 --instance_filter：

python run.py --model_name gpt4 \
  --instance_filter marshmallow-code__marshmallow-1359

本文轉(zhuǎn)自機器之心，作者：機器之心

原文鏈接:??https://mp.weixin.qq.com/s/1nQhMYYeMg7oRiABcaVZlw??

標簽

贊

收藏

回復

舉報

回復

相關(guān)推薦

一個命令工具讓GPT-4干掉Devin和RAG！Jim Fan：提示工程2.0沒必要了！

51CTO技術(shù)棧 ? 3024瀏覽 ? 0回復
谷歌美女程序員手搓矩陣乘法內(nèi)核

duhorse ? 4134瀏覽 ? 0回復
GPT-4 Turbo更新：視覺能力+無限制使用

echo_ning ? 3766瀏覽 ? 0回復
看懂網(wǎng)飛版「三體」！Reka Core登場：挑戰(zhàn)GPT-4、Claude 3

duhorse ? 2613瀏覽 ? 0回復
Meta 發(fā)布Llama 3，能力直逼GPT-4,一己之力拉高開源大模型水位

51CTO技術(shù)棧 ? 3900瀏覽 ? 0回復
他12歲就能寫代碼，為數(shù)百萬程序員引路~

wx65af60231fbe2 ? 2486瀏覽 ? 1回復
國產(chǎn)開源MoE指標炸裂：GPT-4級別能力，API價格僅百分之一

Crystalcxt ? 2412瀏覽 ? 0回復
OpenAI開源GPT-4 SAE，提供1600萬個解釋模式

Aceryt ? 3755瀏覽 ? 0回復
超越GPT-4o，Claude 3.5一夜封王！10倍編碼速度逆天，全網(wǎng)最全實測來了

duhorse ? 3947瀏覽 ? 0回復
一張圖生成繪畫全過程，兩天狂攬1.4k Star

輕薄滴假象 ? 2700瀏覽 ? 0回復
最強AI程序員砸飯碗：84秒跑通代碼，像人一樣思考！團隊僅5人

Crystalcxt ? 2040瀏覽 ? 0回復
【好禮贏不?！?024程序員嘉年華！在這里集結(jié)

AI.x社區(qū)官方賬號 ? 1.2w瀏覽 ? 15回復
PHP程序員學習AI的學習心得

龐然大悟 ? 1666瀏覽 ? 0回復
首個AI Agent程序員商業(yè)化，比ChatGPT Pro貴2倍

Aceryt ? 2009瀏覽 ? 0回復
小模型界o1來了：微軟推出Phi-4，數(shù)學推理能力太逆天！14B模型擊敗GPT-4o！還印證了AI墻的一個重要推斷

51CTO技術(shù)棧 ? 2076瀏覽 ? 0回復
擊敗99.9%的程序員！o3來了！AGI測試實現(xiàn)躍升！網(wǎng)友：推理scaling law太炸了！一文回顧OpenAI直播帶貨12天

51CTO技術(shù)棧 ? 2836瀏覽 ? 0回復
OpenAI砸碎了程序員的飯碗

AI論文解讀 ? 1576瀏覽 ? 0回復
世界第一位AI程序員Devin：20項任務只完成了3項！14項任務徹底失??！

51CTO技術(shù)棧 ? 1629瀏覽 ? 0回復
暴論：2025年，程序員必學技能就是 MCP

玄姐聊AGI ? 2996瀏覽 ? 0回復

輕薄滴假象

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

DeepSeek一口氣開源3個項目，還有梁文鋒親自參與，昨晚API大降價 2025-02-27 12:40:06發(fā)布
全球首個AI CUDA工程師來了！將PyTorch原生實現(xiàn)提速10-100倍 2025-02-21 13:20:31發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點：替代人干真活！ 1回復

王炸！MCP 架構(gòu)設(shè)計深度剖析 & 使用 Spring AI + MCP 四步教你實現(xiàn) Agent 智能體開發(fā) 0回復

Dify從入門到高階系列二：手把手教學！超詳細的Dify知識庫配置全攻略 0回復

Crawl4AI：GitHub榜首40K星標！LLM專屬極速開源爬蟲神器 0回復

只需5分鐘，教你用Python搭建MCP Server 0回復

上一篇：長文本之罪：Claude團隊新越獄技術(shù)，Llama 2到GPT-4無一幸免

下一篇：華為諾亞頻域LLM「帝江」：僅需1/50訓練成本，7B模型媲美LLaMA，推理加速5倍

社區(qū)精華內(nèi)容

目錄

<tfoot id="az1nm"></tfoot>

<sub id="az1nm"></sub>

<sub id="az1nm"><p id="az1nm"></p></sub>