“源神”DeepSeek 又有新的開源動作了。4 月 14 日,DeepSeek 悄悄在其 GitHub 的 open-infra-index 庫中公布了其自研推理引擎的開源計劃。在公告中,DeepSeek 表示,他們并不會選擇直接開其內部完整且高度優化的代碼庫,而是將采取一種更側重協作、更具可持續性的策略,將其核心優化成果貢獻給現有的開源項目,尤其是作為其技術基礎的 vLLM。
DeepSeek 在其公告中首先對開源生態系統表達了誠摯的感謝,承認其在模型訓練(依賴 PyTorch 等框架)和推理引擎構建(早期基于 vLLM)方面都深受開源社區的裨益。隨著自研的 DeepSeek-V3、DeepSeek-R1 等模型展現出強大的能力,市場對其高效部署方案的需求與日俱增,促使 DeepSeek 思考如何將自身的進展回饋給社區。
圖丨公告原文(來源:GitHub)
然而,在評估了直接開源內部完整推理引擎的可行性后,DeepSeek 認為存在幾個關鍵障礙。首先是顯著的代碼庫分歧。其內部引擎源自一年多前的 vLLM 早期分支,經過長期針對 DeepSeek 模型的深度定制優化,已與 vLLM 主線或其他通用推理框架產生巨大差異。直接開源此版本不僅難以被社區廣泛應用和擴展,維護成本也極高。
其次是基礎設施強依賴。該引擎與 DeepSeek 內部的集群管理系統、特定的硬件配置和運維流程緊密耦合,外部用戶幾乎無法在標準環境下直接部署,需要進行大規模重構才能剝離這些依賴,這違背了開源項目通常追求的易用性原則。
最后是有限的維護帶寬。DeepSeek 坦言,作為一家以模型研發為核心的團隊,他們缺乏足夠的資源來長期維護一個需要持續投入、支持廣泛用例的大型開源項目。貿然發布可能導致項目后續支持不足,損害用戶體驗。
面對這些現實制約,DeepSeek 選擇了與現有開源項目(特別是 vLLM)緊密合作的路徑,以更靈活、更易于集成的方式分享其技術積累。具體策略包括提取可復用的獨立特性,將其模塊化后作為獨立的庫貢獻出來;以及直接分享優化細節,向 vLLM 等項目貢獻設計思想、實現方法甚至具體的代碼補丁。
這一合作策略獲得了社區的普遍理解和積極響應。vLLM 項目官方賬號在社交平臺 X 上明確表示支持,認為 DeepSeek“以正確的方式開源引擎”,即將改進帶回社區使人人受益,而非創建一個獨立的倉庫。技術社區的討論也傾向于認為,這種分享“know-how”和可集成模塊的方式,比發布一個難以維護的代碼“僵尸”更有價值。
圖丨相關推文(來源:X)
社區對 DeepSeek 貢獻內容的期待值很高。此前已有分析指出,vLLM 在吸收 DeepSeek 2 月的“開源周”所公布論文中的部分優化后,處理 DeepSeek 模型的性能已有顯著提升(約 3 倍)。
(來源:Red Hat)
而根據 DeepSeek 此前公布的推理系統內部測試結果,每個 H800 節點在預填充期間平均吞吐量達到 73.7k tokens/s 輸入(包括緩存命中),或在解碼期間達到 14.8k tokens/s 輸出。相比之下,有開發者使用 vLLM 在高并發下,使用 sharegpt 數據集時基準測試約為 5K total tokens/s,隨機 2000/100 測試達到 12K total token/s 的吞吐量。這表明推理性能優化領域仍有巨大提升空間。
值得注意的是,DeepSeek 在公告中特別澄清,本次宣布的開源路徑僅針對其推理引擎代碼庫。對于未來模型發布,公司將繼續秉持開放協作的態度,致力于在新模型推出前與社區及硬件伙伴同步推理優化工作,確保社區能在模型發布首日(Day-0)獲得最先進(SOTA)的推理支持(或許這項工作也是為不久后到來的 R2 做鋪墊)。其最終目標是構建一個同步生態,讓前沿 AI 能力能在多樣化硬件平臺上無縫落地。
參考資料:
1.https://github.com/deepseek-ai/open-infra-index/blob/main/OpenSourcing_DeepSeek_Inference_Engine/README.md
2.https://developers.redhat.com/articles/2025/03/19/how-we-optimized-vllm-deepseek-r1#mla__multi_token_prediction__and_parallelism_optimizations
3.https://x.com/vllm_project/status/1911669255428542913?ref_src=twsrc%5Etfw%7Ctwcamp%5Etweetembed%7Ctwterm%5E1911669255428542913%7Ctwgr%5E2c28928084e90824cea080020bfca45fcf9e9ccb%7Ctwcon%5Es1_&ref_url=https%3A%2F%2Fanalyticsindiamag.com%2Fai-news-updates%2Fdeepseek-to-open-source-its-inference-engine%2F
運營/排版:何晨龍
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.