還記得那個號稱全球首位 AI 軟件工程師 Devin 嗎?它的創(chuàng)造者Cognition Labs公司剛剛推出了一個名為DeepWiki的項目。簡單來說,這是一個目標宏大的計劃:為全世界每一個 GitHub 代碼倉庫(Repo)提供可以實時交流、即時更新的文檔
你可以把它想象成一個由 Devin 技術驅動的、專門針對 GitHub 的“深度研究”工具
亮點:免費、免注冊、即刻可用
最關鍵的是,對于開源項目,這項服務完全免費,甚至無需注冊
怎么用?非常簡單:
1. 訪問deepwiki.com,探索已經收錄的熱門開源項目的 Wiki
2. 或者,更直接的方式:把你正在瀏覽的任何 GitHub 倉庫 URL 中的
github.com
替換成deepwiki.com
,即可無縫跳轉到該倉庫的 DeepWiki 頁面
能做什么?
對話式文檔:你可以直接向代碼庫“提問”,DeepWiki 會嘗試理解你的問題并給出文檔級的解答
深度研究 (Deep Research):對于復雜問題,可以開啟此功能,讓 AI Agent 進行更深入的分析和回答
按需索引:如果你關心的公開倉庫還沒被收錄,可以請求 DeepWiki 為你索引
私有倉庫支持:對于私有倉庫,可以通過注冊Devin賬戶(devin.ai)來獲得服務
輕松分享:生成的 Wiki 頁面和問答結果都可以通過鏈接分享,方便團隊成員保持信息同步
投入與規(guī)模
Cognition Labs 為了 DeepWiki 可謂投入巨大:
? 已索引約3 萬個GitHub 倉庫
? 處理了超過40 億行代碼
? 索引過程的計算成本就超過了30 萬美元
? 總計處理了超過1000 億個Token
據稱,平均索引一個倉庫的成本約為 12 美元,但目前對所有開源項目完全免費開放
技術探秘:理解全局結構與提交歷史
我們知道,LLM 理解局部代碼的能力已經很強,但要掌握龐大代碼庫的全局結構是真正的難點。DeepWiki 的核心技術正是為了解決這個問題:
1.層級化系統(tǒng)分解:它首先將代碼庫分解成一個層級化的高階系統(tǒng)(high-level systems)結構
2.系統(tǒng)級 Wiki 生成:然后為每一個識別出的系統(tǒng)生成對應的 Wiki 頁面,構建出整個項目的知識圖譜
此外,DeepWiki 還利用了一個非常有價值的信號:代碼提交歷史 (commit history)。通過分析“哪些文件經常被哪些開發(fā)者一同修改”(這可以表示成一個圖),DeepWiki 能夠挖掘出代碼庫中隱藏的模式、模塊邊界和開發(fā)者協(xié)作關系,這些都是理解復雜項目的關鍵信息
目前,DeepWiki 網站上已經有3 萬個倉庫的 Wiki 可供探索。對于開發(fā)者來說,尤其是面對龐大、復雜的開源項目時,DeepWiki 無疑提供了一個強大的新工具,有望極大提升代碼理解效率,降低學習和參與門檻
比較好奇DeepWiki背后使用的模型,哈哈
?星標AI寒武紀,好內容不錯過?
用你的贊和在看告訴我~
求贊
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.