看不懂GitHub代碼?剛剛這個AI工具讓全球每個GitHub項目開口說話
還記得那個號稱全球首位 AI 軟件工程師 Devin 嗎?它的創(chuàng)造者Cognition Labs公司剛剛推出了一個名為 DeepWiki 的項目。簡單來說,這是一個目標(biāo)宏大的計劃:為全世界每一個 GitHub 代碼倉庫(Repo)提供可以實時交流、即時更新的文檔。
你可以把它想象成一個由 Devin 技術(shù)驅(qū)動的、專門針對 GitHub 的“深度研究”工具。
亮點:免費、免注冊、即刻可用
最關(guān)鍵的是,對于開源項目,這項服務(wù)完全免費,甚至無需注冊。
怎么用?非常簡單:
1. 訪問 deepwiki.com,探索已經(jīng)收錄的熱門開源項目的 Wiki。
2. 或者,更直接的方式:把你正在瀏覽的任何 GitHub 倉庫 URL 中的 github.com
替換成 deepwiki.com
,即可無縫跳轉(zhuǎn)到該倉庫的 DeepWiki 頁面。
能做什么?
對話式文檔: 你可以直接向代碼庫“提問”,DeepWiki 會嘗試理解你的問題并給出文檔級的解答。
深度研究 (Deep Research): 對于復(fù)雜問題,可以開啟此功能,讓 AI Agent 進行更深入的分析和回答。
按需索引: 如果你關(guān)心的公開倉庫還沒被收錄,可以請求 DeepWiki 為你索引。
私有倉庫支持: 對于私有倉庫,可以通過注冊 Devin 賬戶(devin.ai)來獲得服務(wù)。
輕松分享: 生成的 Wiki 頁面和問答結(jié)果都可以通過鏈接分享,方便團隊成員保持信息同步。
投入與規(guī)模
Cognition Labs 為了 DeepWiki 可謂投入巨大:
? 已索引約 3 萬個 GitHub 倉庫
? 處理了超過 40 億行代碼
? 索引過程的計算成本就超過了 30 萬美元
? 總計處理了超過 1000 億個 Token
據(jù)稱,平均索引一個倉庫的成本約為 12 美元,但目前對所有開源項目完全免費開放。
技術(shù)探秘:理解全局結(jié)構(gòu)與提交歷史
我們知道,LLM 理解局部代碼的能力已經(jīng)很強,但要掌握龐大代碼庫的全局結(jié)構(gòu)是真正的難點。DeepWiki 的核心技術(shù)正是為了解決這個問題:
1. 層級化系統(tǒng)分解: 它首先將代碼庫分解成一個層級化的高階系統(tǒng)(high-level systems)結(jié)構(gòu)。
2. 系統(tǒng)級 Wiki 生成: 然后為每一個識別出的系統(tǒng)生成對應(yīng)的 Wiki 頁面,構(gòu)建出整個項目的知識圖譜。
此外,DeepWiki 還利用了一個非常有價值的信號:代碼提交歷史 (commit history)。通過分析“哪些文件經(jīng)常被哪些開發(fā)者一同修改”(這可以表示成一個圖),DeepWiki 能夠挖掘出代碼庫中隱藏的模式、模塊邊界和開發(fā)者協(xié)作關(guān)系,這些都是理解復(fù)雜項目的關(guān)鍵信息。
寫在最后
目前,DeepWiki 網(wǎng)站上已經(jīng)有 3 萬個倉庫的 Wiki 可供探索。對于開發(fā)者來說,尤其是面對龐大、復(fù)雜的開源項目時,DeepWiki 無疑提供了一個強大的新工具,有望極大提升代碼理解效率,降低學(xué)習(xí)和參與門檻。
比較好奇DeepWiki背后使用的模型,哈哈!