AI圈正迎接新一輪的技術爆發期,DeepSeek以深度推理模型R1震撼海內外,OpenAI、Anthropic、谷歌、阿里、字節、百度等紛紛推進自家大模型的新動態。模型層之外,應用層也開始多了些新變化。
最近的創新來自一家由中國90后創始團隊推出的新產品——一款號稱通用AI Agent的應用工具Manus。
Manus的官網(https://Manus.im/usecases)給出了一些例子可以供我們更加直觀的了解Manus的能力,可以看到它的功能在官方演示中確實特別強大,目前Manus的使用需要提前獲取邀請碼。
有必要簡單介紹一下Manus。與傳統AI助手相比,類似豆包、Kimi、DeepSeek這些,其局限于信息檢索與建議交互,而Manus首次實現“自主執行復雜任務→交付完整成果”的閉環能力,填補了當前市場空白?。
另外一點是通用性定義的突破:跨領域處理復雜任務(如股票分析、旅行規劃、代碼生成等),打破垂直賽道AI的局限性?,這是驚艷的前兩點。第三點是Manus是繼中國團隊做出來DeepSeek之后的又一力作,定位為“手腦并用”的通用助手,強調“輸入需求→輸出結果”的無中介執行模式,命名源自拉丁語“Mens et Manus”(意為手腦并用),技術理念主張“Less structure, more intelligence”,減少預設流程依賴,強化模型自主進化能力。
01 Manus的優缺點
總結一下Manus的核心優勢:
全流程自主執行:從需求分析(如簡歷篩選)、任務拆解(如房產選購規劃)到成果交付(生成Excel/PPT報告)無需人工干預?。
多工具鏈整合:支持瀏覽器操作、編程工具調用、跨平臺數據抓取,實現復雜操作(如自動解壓簡歷包并分析)?。
覆蓋教育(教學材料生成)、金融(股票關系分析)、人力資源(候選人分級)、企業服務(自動化周報)等多領域?。
跨領域協同:可同時處理比如簡歷篩選與房產選購兩類異構任務,體現通用Agent特性?。
多Agent協作系統:規劃、執行、驗證三模塊分立,云端虛擬機并行處理任務,提升容錯率?。
上面是Manus的優勢,同樣Manus也有一些劣勢:
依賴預設流程框架:部分任務需在瀏覽器與操作系統間的“受限環境”執行,無法適配未預定義的應用程序?。
執行穩定性問題:用戶反饋存在崩潰前生成虛假結果(如偽造邀請碼)等不可控行為?。
高炒作熱度導致早期用戶預期與實際能力落差,部分場景仍需人工修正輸出結果?。
企業端部署成本:云端虛擬機運行模式對算力需求較高,限制中小型企業使用?。
自主簽署合同的法律效力尚未明確,隱私數據跨平臺調用可能引發合規爭議?。
職場替代焦慮:80%中低頻白領工作(如簡歷篩選、報表生成)面臨被低成本AI替代的風險?。
02 Manus究竟做了哪些技術創新?
說完優缺點之后,我們再重點看一下使得Manus這么強的背后技術創新,究竟是什么。
1. 多智能體協作系統(Multi-Agent Collaboration)
三層架構設計:
規劃代理(Planning Agent):采用蒙特卡洛樹搜索(MCTS)算法動態拆解任務優先級,支持實時調整執行路徑(例如在簡歷篩選中優先處理學歷匹配度)。
執行代理(Execution Agent):整合200+工具接口(瀏覽器、Office套件等),通過瀏覽器自動化引擎模擬人類操作(點擊、滾動、表單填寫),但受限于未開放API的CS架構應用。
驗證代理(Validation Agent):部署對抗性測試模塊,檢測邏輯矛盾(如財務數據與行業基準偏差超5%時觸發復核流程)。
多重簽名系統(Multisig System):由多個獨立模型協同處理子任務,通過交叉驗證提升結果可靠性(例如股票分析中,3個模型獨立計算行業關聯度,取置信度最高值)。
2. 動態訓練與優化機制
實時反饋迭代:用戶可通過“動態培訓”功能修正輸出格式(如指定PPT模板)或調整執行路徑(如跳過特定網站數據抓?。?,模型即時更新策略。
崩潰恢復技術:任務中斷時自動生成替代方案(如簡歷解析失敗后改用關鍵詞匹配模式),并保留進度至本地緩存。
3. 工具鏈深度整合
瀏覽器沙箱技術:在隔離環境中運行跨平臺操作(如自動登錄招聘網站抓取簡歷),避免用戶隱私數據泄露。
記憶偏好系統:持續學習用戶習慣(如合同模板偏好),占用云端存儲資源形成個性化執行策略。
4. 性能驗證體系
GAIA基準測試(https://zhuanlan.zhihu.com/p/669652697)突破:在三級測試中分別達86.5%/70.1%/57.7%,超越OpenAI的DeepResearch模型,接近人類水平(90%)。
真實場景驗證:在Upwork平臺完成設計類任務(如Logo生成)、Kaggle競賽中實現數據分析自動化,驗證跨領域執行能力。
如果上面Manus的技術創新讓你眼前一亮,這個時候你是不是會有一個疑問,為什么是Manus?其他AI廠商,尤其是科技大廠為什么沒有做出這樣的成果,是其他廠商不具備這樣的能力嗎?目前來看,原因或許有以下幾種因素:
1. ?技術路徑依賴?
?模型規模優先策略?:OpenAI等廠商聚焦于擴大模型參數量(如追求GPT-5),未將工具調用能力作為核心研發方向?。
?規則工程慣性?:傳統AI產品依賴預設流程(如客服對話樹),難以適應Manus倡導的“Less structure, more intelligence”理念?。
2. 工程化挑戰
?多工具接口適配成本?:需為瀏覽器、辦公軟件等開發專用驅動,大廠不愿干臟活累活,其他小廠商又缺乏生態整合能力(如Manus團隊耗時2年完成200+工具接口開發)?。
?長周期任務管理難題?:傳統模型受限于會話式交互,難以實現“用戶離線后持續執行跨日任務”的異步工作機制?。
3. 市場定位差異
?B端服務壁壘?:微軟Copilot等產品聚焦Office場景,缺乏跨領域泛化能力(如同時處理簡歷篩選與股票分析)?。
?倫理風險規避?:頭部廠商忌憚自主決策引發的法律爭議(如合同簽署效力),選擇保守技術路線?。
03 Manus的后續改進和行業影響
針對目前Manus表現出的一些缺點,我們認為它未來的改進點如下:
增強環境適應性:突破瀏覽器/操作系統的“夾層”限制,實現更底層的系統權限調用?。
降低算力依賴:通過模型壓縮與邊緣計算結合,推動中小型企業普及?。
優先落地場景:企業自動化辦公(智能客服、合同審核)、教育個性化教學(動態生成課件)?。
開源生態建設:開放部分模型接口,吸引開發者構建插件生態(如第三方工具集成)?。
建立AI執行審計機制:對自主決策過程留痕,明確錯誤結果的責任歸屬?。
數據安全規范:限制敏感信息(如簡歷、財務報表)的跨平臺流轉權限?。
但不容忽視的是,Manus的出現肯定會對其他廠商帶來一些影響:倒逼OpenAI等廠商加速從“對話式交互”轉向“任務執行型”產品開發的節奏,加速Agent技術迭代?;推動多模態交互(文字/圖表/代碼混合輸出)、工具調用API集成成為AI產品新基準?。
根據Manus計劃,后續官方還將開源推理模塊,有望借此催生基于其技術棧的二次開發社區?。
Manus需求爆火,還可能帶動邊緣計算設備需求激增,使得AI終端部署從云端向本地延伸?,一批國產硬件廠商也有望從中受益。
AI的發展速度正推動各行各業重新洗牌,未來不是屬于資產的時代,也不是屬于權力的時代,未來將是屬于科技的時代。
歡迎在評論區留言~
如需開白請加小編微信:dongfangmark
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.