網易首頁 > 網易號 > 正文申請入駐

解密Manus：靠垂直整合，搶在了AI大廠前頭

2025-03-10 16:43:41　來源: 直面派

北京舉報

分享至

AI圈正迎接新一輪的技術爆發期，DeepSeek以深度推理模型R1震撼海內外，OpenAI、Anthropic、谷歌、阿里、字節、百度等紛紛推進自家大模型的新動態。模型層之外，應用層也開始多了些新變化。

最近的創新來自一家由中國90后創始團隊推出的新產品——一款號稱通用AI Agent的應用工具Manus。

Manus的官網（https://Manus.im/usecases）給出了一些例子可以供我們更加直觀的了解Manus的能力，可以看到它的功能在官方演示中確實特別強大，目前Manus的使用需要提前獲取邀請碼。

有必要簡單介紹一下Manus。與傳統AI助手相比，類似豆包、Kimi、DeepSeek這些，其局限于信息檢索與建議交互，而Manus首次實現“自主執行復雜任務→交付完整成果”的閉環能力，填補了當前市場空白?。

另外一點是通用性定義的突破：跨領域處理復雜任務（如股票分析、旅行規劃、代碼生成等），打破垂直賽道AI的局限性?，這是驚艷的前兩點。第三點是Manus是繼中國團隊做出來DeepSeek之后的又一力作，定位為“手腦并用”的通用助手，強調“輸入需求→輸出結果”的無中介執行模式，命名源自拉丁語“Mens et Manus”（意為手腦并用），技術理念主張“Less structure, more intelligence”，減少預設流程依賴，強化模型自主進化能力。

01 Manus的優缺點

總結一下Manus的核心優勢：

全流程自主執行：從需求分析（如簡歷篩選）、任務拆解（如房產選購規劃）到成果交付（生成Excel/PPT報告）無需人工干預?。

多工具鏈整合：支持瀏覽器操作、編程工具調用、跨平臺數據抓取，實現復雜操作（如自動解壓簡歷包并分析）?。

覆蓋教育（教學材料生成）、金融（股票關系分析）、人力資源（候選人分級）、企業服務（自動化周報）等多領域?。

跨領域協同：可同時處理比如簡歷篩選與房產選購兩類異構任務，體現通用Agent特性?。

多Agent協作系統：規劃、執行、驗證三模塊分立，云端虛擬機并行處理任務，提升容錯率?。

上面是Manus的優勢，同樣Manus也有一些劣勢：

依賴預設流程框架：部分任務需在瀏覽器與操作系統間的“受限環境”執行，無法適配未預定義的應用程序?。

執行穩定性問題：用戶反饋存在崩潰前生成虛假結果（如偽造邀請碼）等不可控行為?。

高炒作熱度導致早期用戶預期與實際能力落差，部分場景仍需人工修正輸出結果?。

企業端部署成本：云端虛擬機運行模式對算力需求較高，限制中小型企業使用?。

自主簽署合同的法律效力尚未明確，隱私數據跨平臺調用可能引發合規爭議?。

職場替代焦慮：80%中低頻白領工作（如簡歷篩選、報表生成）面臨被低成本AI替代的風險?。

02 Manus究竟做了哪些技術創新？

說完優缺點之后，我們再重點看一下使得Manus這么強的背后技術創新，究竟是什么。

1. 多智能體協作系統（Multi-Agent Collaboration）

三層架構設計：

規劃代理（Planning Agent）：采用蒙特卡洛樹搜索（MCTS）算法動態拆解任務優先級，支持實時調整執行路徑（例如在簡歷篩選中優先處理學歷匹配度）。

執行代理（Execution Agent）：整合200+工具接口（瀏覽器、Office套件等），通過瀏覽器自動化引擎模擬人類操作（點擊、滾動、表單填寫），但受限于未開放API的CS架構應用。

驗證代理（Validation Agent）：部署對抗性測試模塊，檢測邏輯矛盾（如財務數據與行業基準偏差超5%時觸發復核流程）。

多重簽名系統（Multisig System）：由多個獨立模型協同處理子任務，通過交叉驗證提升結果可靠性（例如股票分析中，3個模型獨立計算行業關聯度，取置信度最高值）。

2. 動態訓練與優化機制

實時反饋迭代：用戶可通過“動態培訓”功能修正輸出格式（如指定PPT模板）或調整執行路徑（如跳過特定網站數據抓?。?，模型即時更新策略。

崩潰恢復技術：任務中斷時自動生成替代方案（如簡歷解析失敗后改用關鍵詞匹配模式），并保留進度至本地緩存。

3. 工具鏈深度整合

瀏覽器沙箱技術：在隔離環境中運行跨平臺操作（如自動登錄招聘網站抓取簡歷），避免用戶隱私數據泄露。

記憶偏好系統：持續學習用戶習慣（如合同模板偏好），占用云端存儲資源形成個性化執行策略。

4. 性能驗證體系

GAIA基準測試(https://zhuanlan.zhihu.com/p/669652697)突破：在三級測試中分別達86.5%/70.1%/57.7%，超越OpenAI的DeepResearch模型，接近人類水平（90%）。

真實場景驗證：在Upwork平臺完成設計類任務（如Logo生成）、Kaggle競賽中實現數據分析自動化，驗證跨領域執行能力。

如果上面Manus的技術創新讓你眼前一亮，這個時候你是不是會有一個疑問，為什么是Manus？其他AI廠商，尤其是科技大廠為什么沒有做出這樣的成果，是其他廠商不具備這樣的能力嗎？目前來看，原因或許有以下幾種因素：

1. ?技術路徑依賴?

?模型規模優先策略?：OpenAI等廠商聚焦于擴大模型參數量（如追求GPT-5），未將工具調用能力作為核心研發方向?。

?規則工程慣性?：傳統AI產品依賴預設流程（如客服對話樹），難以適應Manus倡導的“Less structure, more intelligence”理念?。

2. 工程化挑戰

?多工具接口適配成本?：需為瀏覽器、辦公軟件等開發專用驅動，大廠不愿干臟活累活，其他小廠商又缺乏生態整合能力（如Manus團隊耗時2年完成200+工具接口開發）?。

?長周期任務管理難題?：傳統模型受限于會話式交互，難以實現“用戶離線后持續執行跨日任務”的異步工作機制?。

3. 市場定位差異

?B端服務壁壘?：微軟Copilot等產品聚焦Office場景，缺乏跨領域泛化能力（如同時處理簡歷篩選與股票分析）?。

?倫理風險規避?：頭部廠商忌憚自主決策引發的法律爭議（如合同簽署效力），選擇保守技術路線?。

03 Manus的后續改進和行業影響

針對目前Manus表現出的一些缺點，我們認為它未來的改進點如下：

增強環境適應性：突破瀏覽器/操作系統的“夾層”限制，實現更底層的系統權限調用?。

降低算力依賴：通過模型壓縮與邊緣計算結合，推動中小型企業普及?。

優先落地場景：企業自動化辦公（智能客服、合同審核）、教育個性化教學（動態生成課件）?。

開源生態建設：開放部分模型接口，吸引開發者構建插件生態（如第三方工具集成）?。

建立AI執行審計機制：對自主決策過程留痕，明確錯誤結果的責任歸屬?。

數據安全規范：限制敏感信息（如簡歷、財務報表）的跨平臺流轉權限?。

但不容忽視的是，Manus的出現肯定會對其他廠商帶來一些影響：倒逼OpenAI等廠商加速從“對話式交互”轉向“任務執行型”產品開發的節奏，加速Agent技術迭代?；推動多模態交互（文字/圖表/代碼混合輸出）、工具調用API集成成為AI產品新基準?。

根據Manus計劃，后續官方還將開源推理模塊，有望借此催生基于其技術棧的二次開發社區?。

Manus需求爆火，還可能帶動邊緣計算設備需求激增，使得AI終端部署從云端向本地延伸?，一批國產硬件廠商也有望從中受益。

AI的發展速度正推動各行各業重新洗牌，未來不是屬于資產的時代，也不是屬于權力的時代，未來將是屬于科技的時代。

歡迎在評論區留言~
如需開白請加小編微信：dongfangmark

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.