自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<cite id="ussfv"></cite>

<style id="ussfv"></style>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

自動(dòng)化漏洞修復(fù)：從基于模板的方法到AI代理的演變原創(chuàng)

51CTO內(nèi)容精選

發(fā)布于 2025-3-21 08:06

瀏覽

0收藏

自動(dòng)化漏洞修復(fù)已經(jīng)從簡單的基于模板的方法發(fā)展到由LLM、代理、無代理和RAG范例驅(qū)動(dòng)的復(fù)雜AI系統(tǒng)。

如果你有軟件開發(fā)經(jīng)驗(yàn)，就會(huì)知道調(diào)試通常是工作中最耗時(shí)且最令人沮喪的部分。試想一下，如果人工智能可以幫你處理這些煩人的漏洞呢？

自動(dòng)化程序修復(fù)（Automated Program Repair，APR）的最新進(jìn)展使這一目標(biāo)日益成為現(xiàn)實(shí)。接下來，就讓我們來探索一下這項(xiàng)技術(shù)是如何發(fā)展的，以及它的發(fā)展方向吧。

基礎(chǔ)：傳統(tǒng)的漏洞修復(fù)方法

早期的自動(dòng)化漏洞修復(fù)方法依賴于相對(duì)簡單的原則。像GenProg這樣的系統(tǒng)就是應(yīng)用預(yù)定義的轉(zhuǎn)換規(guī)則來修復(fù)常見的模式，比如空指針檢查或數(shù)組邊界驗(yàn)證。雖然這種方法在當(dāng)時(shí)是創(chuàng)新之舉，但在處理復(fù)雜的代碼庫時(shí)，它很快就達(dá)到了極限。

1 # Example of a simple template-based fix
2 def fix_array_bounds(code):
3 # Look for array access patterns
4 pattern = r'(\w+)\[(\w+)\]'
5 
6 # Add bounds check
7 replacement = r'(\2 < len(\1) ? \1[\2] : null)'
8 
9 return re.sub(pattern, replacement, code)

總體來說，這些早期基于模板的系統(tǒng)面臨著下述重大挑戰(zhàn)：

有限的靈活性。它們只能解決與預(yù)定義模式匹配的錯(cuò)誤。?
計(jì)算成本過高。基于約束的方法通常要運(yùn)行數(shù)小時(shí)才能生成補(bǔ)丁。?
薄弱的適應(yīng)性。它們努力在大型動(dòng)態(tài)代碼庫中處理新穎或復(fù)雜的問題。?

當(dāng)Facebook試圖為它們的React代碼庫實(shí)現(xiàn)基于模板的修復(fù)時(shí)，系統(tǒng)在框架的組件生命周期模式和狀態(tài)管理復(fù)雜性方面遇到了困難。類似地，當(dāng)在Apache Commons庫上使用時(shí)，基于約束的方法通常要運(yùn)行數(shù)小時(shí)才能為中等大小的函數(shù)生成補(bǔ)丁。

LLM驅(qū)動(dòng)的修復(fù)興起

大型語言模型（LLM）的引入改變了自動(dòng)化漏洞修復(fù)的可能性。像GPT-4、Code Llama、DeepSeek Coder和Qwen2.5 Coder這樣的模型不只是修補(bǔ)語法錯(cuò)誤，它們還能理解代碼的語義意圖，并在復(fù)雜的代碼庫中生成上下文合適的修復(fù)。

概括來看，這些模型帶來了下述多種功能：

上下文感知推理。它們理解代碼不同部分之間的關(guān)系。?
自然語言理解。它們彌合了技術(shù)問題陳述和可操作修復(fù)之間的缺口。?
從模式中不斷學(xué)習(xí)。它們從大量的代碼中識(shí)別常見的漏洞模式。?

具體而言，每種模型都有其獨(dú)特的優(yōu)勢(shì)：

LLM?	核心優(yōu)勢(shì)?	理想用例?
GPT-4o?	高級(jí)推理和強(qiáng)大的代碼生成	要求精準(zhǔn)的企業(yè)項(xiàng)目
DeepSeek?	準(zhǔn)確性和成本效益的平衡	具有快速迭代需求的中小型團(tuán)隊(duì)
Qwen2.5?	強(qiáng)大的多語言代碼修復(fù)支持	跨越多種編程語言的項(xiàng)目
Code Llama?	強(qiáng)大的開源社區(qū)和可定制性	多種編程語言環(huán)境

現(xiàn)代APR系統(tǒng)的三個(gè)范式

基于代理的系統(tǒng)

基于代理的系統(tǒng)通過多代理協(xié)作利用LLM，每個(gè)代理專注于一個(gè)特定的角色，如故障定位、語義分析或驗(yàn)證。這些系統(tǒng)擅長通過任務(wù)專門化和增強(qiáng)協(xié)作來解決復(fù)雜的調(diào)試挑戰(zhàn)。

在此類系統(tǒng)中，最具創(chuàng)新性的實(shí)現(xiàn)包括以下幾種：

SWE-Agent——為大規(guī)模存儲(chǔ)庫調(diào)試而設(shè)計(jì)，它可以處理跨存儲(chǔ)庫依賴關(guān)系；?
CODEAGENT——集成LLM與外部靜態(tài)分析工具，優(yōu)化協(xié)同調(diào)試任務(wù)；?
AgentCoder——軟件工程任務(wù)的端到端模塊化解決方案；?
SWE-Search——采用蒙特卡羅樹搜索（MCTS）進(jìn)行自適應(yīng)路徑探索。?

其中，SWE-Search具有自適應(yīng)路徑探索能力，是一項(xiàng)重大進(jìn)步。它由一個(gè)用于探索的SWE代理、一個(gè)用于迭代反饋的Value代理和一個(gè)用于協(xié)作決策的Discriminator代理組成。與缺乏MCTS的標(biāo)準(zhǔn)代理相比，該方法的相對(duì)改善率為23%。

無代理系統(tǒng)

無代理系統(tǒng)通過消除多代理協(xié)調(diào)開銷來優(yōu)化APR。它們通過一個(gè)簡單的“三階段”模式來運(yùn)作：

層次定位。首先，確定有問題的文件，然后放大類或函數(shù)，最后確定特定的代碼行；?
上下文修復(fù)。生成具有適當(dāng)代碼更改的潛在補(bǔ)??；?
驗(yàn)證。使用重現(xiàn)測(cè)試、回歸測(cè)試和重新排序方法測(cè)試補(bǔ)丁。?

DeepSeek Coder憑借其存儲(chǔ)庫級(jí)別的預(yù)訓(xùn)練方法在這一類別中脫穎而出。與之前在文件級(jí)別操作的方法不同，DeepSeek使用存儲(chǔ)庫級(jí)別的預(yù)訓(xùn)練，通過創(chuàng)新的依賴解析算法更好地理解跨文件關(guān)系和項(xiàng)目結(jié)構(gòu)。

該模型利用了一種平衡的方法，在中間填充訓(xùn)練中使用50%的前綴-后綴-中間比例，提高了代碼完成和生成性能。結(jié)果不言自明——DeepSeek-Coder-Base-33B在首次發(fā)布時(shí)，在HumanEval上的平均準(zhǔn)確率達(dá)到50.3%，在MBPP基準(zhǔn)上的平均準(zhǔn)確率達(dá)到66.0%。

RAG系統(tǒng)

像CodeRAG這樣的檢索增強(qiáng)生成（RAG）系統(tǒng)將檢索機(jī)制與基于LLM的代碼生成混合在一起。這些系統(tǒng)結(jié)合了來自GitHub存儲(chǔ)庫、文檔和編程論壇的上下文信息，以支持修復(fù)過程。

這種系統(tǒng)的主要特點(diǎn)包括以下幾點(diǎn)：

上下文檢索：從外部知識(shí)來源中提取相關(guān)信息；?
自適應(yīng)調(diào)試：支持涉及領(lǐng)域?qū)＜一蛲獠緼PI集成的修復(fù)；?
基于執(zhí)行的驗(yàn)證：通過受控的測(cè)試環(huán)境提供功能正確性保證。?

當(dāng)在SWE基準(zhǔn)上進(jìn)行評(píng)估時(shí)，無代理系統(tǒng)的成功率達(dá)到50.8%，優(yōu)于基于代理的方法（33.6%）和檢索增強(qiáng)方法（30.7%）。然而，每個(gè)范例都有特定的優(yōu)勢(shì)，這取決于用例和存儲(chǔ)庫的復(fù)雜性。

新一代APR系統(tǒng)性能評(píng)估

評(píng)估APR系統(tǒng)需要跨多個(gè)維度測(cè)量性能：漏洞修復(fù)的準(zhǔn)確性、效率、可擴(kuò)展性、代碼質(zhì)量和適應(yīng)性。以下是三個(gè)關(guān)鍵基準(zhǔn)：

SWE -bench：全方位的基準(zhǔn)

SWE -bench在12個(gè)流行的Python存儲(chǔ)庫中測(cè)試真實(shí)GitHub缺陷的APR功能。它創(chuàng)建了具有解決問題任務(wù)的真實(shí)世界場景，這些任務(wù)需要深入的分析和代碼編輯中的高精度。解決方案是使用個(gè)別存儲(chǔ)庫中的特定測(cè)試用例進(jìn)行評(píng)估，以獲得客觀評(píng)級(jí)。

CodeAgentBench：專注于多代理框架

作為SWE -bench的擴(kuò)展，CodeAgentBench的目標(biāo)主要是多代理框架和存儲(chǔ)庫級(jí)調(diào)試功能。它主要從以下方面評(píng)估系統(tǒng)：

動(dòng)態(tài)工具集成——能夠與靜態(tài)分析工具和運(yùn)行時(shí)集成；?
代理協(xié)作——任務(wù)專門化和代理間通信；?
覆蓋范圍——復(fù)雜的測(cè)試用例和多文件挑戰(zhàn)。?

CodeRAG-Bench：測(cè)試檢索增強(qiáng)方法

CodeRAG-Bench專門評(píng)估集成了上下文檢索和生成管道的系統(tǒng)。它通過測(cè)量系統(tǒng)如何整合來自不同來源（如GitHub discussion和文檔）的信息來測(cè)試修復(fù)復(fù)雜漏洞的適應(yīng)性。

當(dāng)前的限制和挑戰(zhàn)

盡管取得了令人矚目的進(jìn)步，但APR系統(tǒng)仍然面臨以下重大障礙：

有限的上下文窗口——處理大型代碼庫（數(shù)千個(gè)文件）仍然具有挑戰(zhàn)性；?
準(zhǔn)確性問題——由于缺乏準(zhǔn)確的上下文敏感代碼生成，多行或多文件編輯有更高的錯(cuò)誤率；?
計(jì)算費(fèi)用——使大規(guī)模、實(shí)時(shí)調(diào)試變得困難；?
驗(yàn)證差距——當(dāng)前的基準(zhǔn)測(cè)試不能完全反映現(xiàn)實(shí)世界的復(fù)雜性。?

現(xiàn)實(shí)世界的應(yīng)用程序

將APR集成到行業(yè)工作流程中已經(jīng)顯示出顯著的好處，具體如下所示：

自動(dòng)化版本管理——在升級(jí)期間檢測(cè)和修復(fù)兼容性問題；?
安全漏洞修復(fù)——模式識(shí)別和上下文感知分析，以加快修補(bǔ)速度；?
測(cè)試生成——為未覆蓋的代碼路徑創(chuàng)建單元測(cè)試，并為復(fù)雜工作流創(chuàng)建集成測(cè)試。?

正在實(shí)施APR工具的公司匯報(bào)了下述結(jié)果：

與手動(dòng)調(diào)試相比，修復(fù)常見問題的時(shí)間減少了60%；?
測(cè)試覆蓋率增加40%；?
減少30%的回歸漏洞。?

諸多大型企業(yè)都正在采取行動(dòng)：

谷歌的Gemini Code Assist報(bào)告稱，常規(guī)開發(fā)人員的任務(wù)時(shí)間減少了40%；?
微軟的IntelliCode提供了上下文感知的代碼建議；?
Facebook的SapFix自動(dòng)修復(fù)生產(chǎn)環(huán)境中的漏洞。?

原文標(biāo)題：??Automated Bug Fixing: From Templates to AI Agents??，作者：Meghana Puvvadi、Santhosh Vijayabaskar

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請(qǐng)注明出處，否則將追究法律責(zé)任

標(biāo)簽

大型語言模型

贊

收藏

回復(fù)

舉報(bào)

社區(qū)頭條

回復(fù)

相關(guān)推薦

手把手教你使用用AI自動(dòng)化制作PPT

pangguiyu ? 2802瀏覽 ? 0回復(fù)
騰訊混元大模型在研發(fā)安全漏洞修復(fù)的實(shí)踐

381972426 ? 3149瀏覽 ? 0回復(fù)
盤點(diǎn)六大Devin替代方案：自動(dòng)化你的編程任務(wù)

51CTO技術(shù)棧 ? 5750瀏覽 ? 0回復(fù)
如何構(gòu)建終極的AI自動(dòng)化系統(tǒng)：多代理協(xié)作指南

ermulong ? 2959瀏覽 ? 0回復(fù)
OpenDevin自動(dòng)化代碼生成工具評(píng)述

zhcs333 ? 3025瀏覽 ? 0回復(fù)
OpenDevin自動(dòng)化代碼生成工具評(píng)述

zhcs333 ? 5714瀏覽 ? 0回復(fù)
RePrompt：提示詞自動(dòng)化優(yōu)化策略

大語言模型論文跟蹤 ? 4320瀏覽 ? 0回復(fù)
基于LangGraph多智能體技術(shù)，搭建AI寫作自動(dòng)化系統(tǒng)

小虎哦哦 ? 3804瀏覽 ? 0回復(fù)
探索Transformer的演變：從基礎(chǔ)到高級(jí)架構(gòu)

51CTO內(nèi)容精選 ? 2605瀏覽 ? 0回復(fù)
AI科學(xué)家：大模型全自動(dòng)化撰寫科研論文

AIRoobt ? 3718瀏覽 ? 0回復(fù)
使用TAG和RAG實(shí)現(xiàn)摘要和標(biāo)簽的自動(dòng)化來簡化客戶反饋分析

51CTO內(nèi)容精選 ? 2221瀏覽 ? 0回復(fù)
數(shù)據(jù)分析自動(dòng)化：LIDA智能可視化的魔法！

Halo咯咯 ? 2087瀏覽 ? 0回復(fù)
借助LLM實(shí)現(xiàn)模型選擇和試驗(yàn)自動(dòng)化

51CTO內(nèi)容精選 ? 2054瀏覽 ? 0回復(fù)
Crawl4AI：AI驅(qū)動(dòng)的網(wǎng)頁抓取神器，結(jié)合LLM實(shí)現(xiàn)自動(dòng)化數(shù)據(jù)提取與處理

老蛀蟲 ? 4494瀏覽 ? 0回復(fù)
基于谷歌Gemini多模態(tài)模型實(shí)現(xiàn)PDF文檔自動(dòng)化處理

51CTO內(nèi)容精選 ? 2288瀏覽 ? 0回復(fù)
辯論有助于從弱到強(qiáng)的泛化

AIRoobt ? 1655瀏覽 ? 0回復(fù)
AI 代理開發(fā)全攻略：從構(gòu)思到落地的實(shí)戰(zhàn)指南

Halo咯咯 ? 1262瀏覽 ? 0回復(fù)
如何利用人工智能和事件驅(qū)動(dòng)設(shè)計(jì)實(shí)現(xiàn)播客推廣的自動(dòng)化

51CTO內(nèi)容精選 ? 734瀏覽 ? 0回復(fù)
5個(gè)極其有用的 Python 自動(dòng)化腳本

wx67f8a73a40259 ? 612瀏覽 ? 0回復(fù)

51CTO內(nèi)容精選

這個(gè)用戶很懶，還沒有個(gè)人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

OpenUI：從構(gòu)思到UI僅需數(shù)秒 9h前發(fā)布
MCP安全噩夢(mèng)終結(jié)者：Agent框架如何重構(gòu)AI防護(hù)新范式？? 1天前發(fā)布

熱門推薦

模型上下文協(xié)議（MCP）開發(fā)實(shí)戰(zhàn)——構(gòu)建LangChain代理客戶端 0回復(fù)

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識(shí)庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

上一篇：當(dāng)敏捷團(tuán)隊(duì)遇見AI，新的實(shí)踐由此誕生

下一篇： AI浪潮下，對(duì)DeepSeek發(fā)展的哲學(xué)新思考

社區(qū)精華內(nèi)容

目錄

<big id="j5efp"><code id="j5efp"><option id="j5efp"></option></code></big>

<sub id="j5efp"></sub><sub id="j5efp"></sub>