國產(chǎn)Cursor靠譜!騰訊發(fā)布CodeBuddy深度評測
原創(chuàng)近期,騰訊云重磅發(fā)布了CodeBuddy軟件開發(fā)智能體Craft(2025年4月升級版) ,以 雙核驅(qū)動架構(gòu) (混元大模型+DeepSeek V3)與 MCP協(xié)議生態(tài) 為核心,重新定義對話式編程范式。Craft支持從需求拆解到多文件代碼生成、重構(gòu)、測試的全流程自主化開發(fā)3,在復(fù)雜工程場景中實現(xiàn) 無干預(yù)的代碼生成。同時,作為國內(nèi)首個兼容MCP協(xié)議的代碼助手,Craft可無縫串聯(lián)騰訊云生態(tài)服務(wù),實現(xiàn)跨平臺任務(wù)調(diào)度,為開發(fā)者提供 “全自動人機協(xié)同” 的沉浸式開發(fā)體驗。
編碼智能體
首先介紹下什么是編碼智能體:
編碼智能體可以基于需求(自然語言)理解項目代碼,并自動查找目標代碼進行改寫,也可生成全新的代碼項目。當用戶有一個具體需求,并且知道需求的改動范圍,編碼智能體可以自動感知上下文,并幫互助用戶快速且準確的實現(xiàn)需求代碼。
在業(yè)界中,像最新GitHub Copilot Agent、Cursor Agent(以前稱為Composer)、Devin等都是這類編碼智能體的產(chǎn)品化表現(xiàn)。在Cursor憑借Agent模式重新定義代碼生成運行的無干預(yù)生成,定義像Devin那樣的,騰訊云Code Buddy推出的Craft智能體以「對話式編程」和「多文件工程化協(xié)作」兩大突破,將這場技術(shù)競賽推向新高度。兩者的競爭不僅關(guān)乎功能差異,更映射出AI編程工具從「輔助工具」向「研發(fā)伙伴」的范式躍遷。
1. 范式革命:從單點到自主的編碼過程升級
2025年春季的AI編程工具市場迎來關(guān)鍵轉(zhuǎn)折點。在Cursor、GitHub Copilot 憑借Agent模式,重新定義了全流程自主生成、運行、修正,從而多輪反思達到工程項目解決需求和問題的目的。
4月份,騰訊云Code Buddy推出的Craft智能體,用于「多文件自主AI協(xié)同編碼生成」的產(chǎn)品交互突破。下圖展示了一個包含六個步驟的軟件開發(fā)工作流程圖,流程依次為:在Edit Chat提出需求并添加文件、需求理解與規(guī)劃、文件操作(讀取/新增/修改)、IDE實時編碼渲染、組織變更清單、接受或回退變更。
2. 功能對比:工程化深度決定工具上限
1)生成維度差異
Cursor Agent的強項在于本地IDE上控制內(nèi)核IDE的編碼心流,并串接了各個時機,如提供精準代碼生成、內(nèi)聯(lián)對話、以及喚起內(nèi)置的編碼智能體來調(diào)用AI能力完成編碼。
Craft是通過主流的IDE上實現(xiàn)通過「需求-拆解-執(zhí)行-驗證」四階段工作流,可完成如「為電商系統(tǒng)增加風控模塊」這類涉及20+文件的系統(tǒng)工程任務(wù)。用戶輸入自然語言需求后,Craft會自主規(guī)劃技術(shù)方案、檢索代碼庫、生成模塊間接口,并以diff視圖展示變更。這種「項目級AI架構(gòu)師」能力,使其在React組件重構(gòu)、微服務(wù)鏈路改造等場景優(yōu)勢顯著。
2)生態(tài)整合能力
Craft率先支MCP市場,可直接調(diào)用主流的MCP服務(wù),例如開發(fā)AI Agent時,開發(fā)者無需自行搭建服務(wù)器,通過MCP協(xié)議即可完成主流的MCP服務(wù)的工具的本地安裝和運行。在這種交互下,構(gòu)建如小程序、企業(yè)工程項目的時候可以具備端到端解決方案能力基建。
3)人機協(xié)作模式的Plan模式的創(chuàng)新
Craft的對話面板支持歷史記錄回溯與版本樹管理,解決了AI生成代碼的「面目全非」的難題。開發(fā)者可逐行采納/拒絕代碼變更,或在出現(xiàn)功能偏離時通過技術(shù)對話實時糾偏。同時Craft推出Plan模式,可以很好的解決需求描述不清楚的進階的計劃智能體輔助做好需求澄清工作。相較于Cursor的Agent直接生成,會更容易達成修改目標。
3. 實戰(zhàn)檢驗:五子棋案例中的工具效能
需求拆解到任務(wù)完成
提問內(nèi)容: 創(chuàng)建一個微信小程序,實現(xiàn)五子棋游戲。游戲應(yīng)包含完整的五子棋規(guī)則,包括黑白雙方輪流下子、連線判斷勝負、禁手規(guī)則等。同時,需要明確展示玩家何時會失敗,例如無合法位置可下、超時未下子等情況。請確保代碼結(jié)構(gòu)清晰,界面友好,用戶體驗流暢。
考察目標:生成的五子棋小程序,可在微信IDE中打開,并編譯運行成功。
1)Cursor的表現(xiàn)
調(diào)用了三個工具:
- 讀目錄,判斷是否空項目
- 寫目錄,為小程序創(chuàng)建工程
- 生成文件
最后生成了8個文件。
打開微信小程序,看下運行后的效果。
第一次并沒有能夠落子,點擊沒有反應(yīng),同時也報錯了。接下來我把錯誤貼到Cursor進一步讓他做完,看看是不是可以糾正正確并運行。
能落子,但無法很精準的落子到棋盤,并且游戲輸贏邏輯也不對,但至少報錯沒有了。我進一步去優(yōu)化問題。
優(yōu)化問題: 無法落子,請優(yōu)化下棋盤落子事件,并需要對準棋盤完成黑白子的五子棋游戲。
最終還是沒有辦法正常模擬五子棋游戲。
2)騰訊云Craft表現(xiàn)
首先開啟了Plan模式,并用相同的提問內(nèi)容。Plan模式下會詢問很多澄清,就像是一個產(chǎn)品經(jīng)理與開發(fā)者的需求澄清,拆解需求任務(wù),對于不清楚的問題,他會提問給你,你只需要回答即可。
當需求澄清清楚后Code Buddy還提供了mermaid代碼,我用mermaid online查看了一下描述的還不錯。
然后附上了每個操作的實現(xiàn)方案。你只需要點擊「開始」按鈕進入代碼生成階段。
生成了總共10個文件。
讓我看看運行效果。打開微信IDE,導(dǎo)入工程。直接運行成功,并且落子正確。
4. 實戰(zhàn)檢驗:用戶操作的流暢度和體驗
Craft
比較簡單,僅提供對話框和添加文件,結(jié)果展示也比較簡單。
Cursor
上述在Cursor均有所考慮。
在引用上下文層面非常全面。
支持將終端問題反饋直接添加到chat edit對話框中。
可以實現(xiàn)重新生成、展示代碼、收縮代碼展示。
5. 總結(jié)一下
總體上各插件在各方面存在一些差異性,Cusor屬于原生IDE, 交互生成體驗上可以超越插件本身,效果可以做到最優(yōu)。作為喜歡本地IDE的用戶會更傾向于選擇和使用,但20美金的定價和數(shù)據(jù)代碼外流也會勸退一些開發(fā)者。而騰訊出品的Craft能力,從應(yīng)用生成的質(zhì)量和效果上,算是目前不錯的平替。由于在插件層面無法超越,所以生成的體驗上中規(guī)中矩,細節(jié)處理上還有蠻多空間可以優(yōu)化。團隊基本上一天一個版本的節(jié)奏也是非常的賣力。Craft的Plan模式是一個很好的差異,在模型能力本身還無法完全比對最強claude模型的時候,通過Plan寫清楚擴展完整需求,為接下來的任務(wù)拆解提供了更精準的信息和方向,無疑是一個很好的想法。
維度 | CodeBuddy | Cursor |
簡單任務(wù)處理 | 能夠完成用戶需求 提供出Plan 模式,可以對用戶需求進行多次澄清和深度思考 ???????? | 在完成任務(wù)的基礎(chǔ)之上,中文結(jié)果和效果也有不錯的美化能力 ???????? |
復(fù)雜任務(wù)處理 | 可以實現(xiàn)整體需求,過程中會報錯,可以根據(jù)報錯解決 ???????? | 可以實現(xiàn)整體需求,完成度和整體效果,頁面效果更好 ???????? |
響應(yīng)時間和處理速度 | 最慢(125s),差不多弱Cursor 1/3 可能是因為 ???? | 最快(49.5s) ?????????? |
終端執(zhí)行 | 受限于IDE本身,體驗下降 ?????? | 可以在側(cè)欄運行效果,跳過,終止等操作 ?????????? |
多模型切換 | Defult、DeepSeek- V3 ?????? | 十幾個主流模型,提供Auto自動化切換能力 ?????????? |
用戶體驗與易用性 | Craft還有很多能力,交互體驗還有待提升 ?????? | Cursor 體驗+多模型效果最佳 ?????????? |
成本 | 免費 | $20 |