靠數(shù)字同事解放生產(chǎn)力的時(shí)候未到
撰文/孟會(huì)緣
編輯/陳鄧新
排版/Annalee
DeepSeek的風(fēng)還沒過,AI賽道又來了一個(gè)國產(chǎn)新爆款Manus。
自3月5日晚正式發(fā)布以來,與這個(gè)全球首款通用AI Agent相關(guān)的消息,不斷在各大互聯(lián)網(wǎng)上刷屏:“發(fā)布4小時(shí)后官網(wǎng)訪問量突破千萬”“在微博、B站等社交媒體一夜爆紅”“A股AI智能體指數(shù)單日暴漲超6%”“相關(guān)概念股批量漲停”“邀請(qǐng)碼被炒到數(shù)千至上萬元”……
同時(shí),各方也在關(guān)注,目前還未全面推出市場(chǎng),只有測(cè)試版的Manus,到底能否復(fù)制DeepSeek的走紅之路,成為國產(chǎn)AI智能體的一塊新豐碑。
但隨著網(wǎng)絡(luò)上曝光的Manus測(cè)試樣本不斷增多,該產(chǎn)品也快速陷入到口碑崩盤、虛假突破、饑餓營銷的重重迷局之中。
破圈意義遠(yuǎn)大于實(shí)際能力
這段時(shí)間,通過官方演示和多方實(shí)測(cè),業(yè)界對(duì)這款全球首款通用AI Agent,到底具備怎樣的能力有了新的認(rèn)知。
從官方演示中,Manus已經(jīng)開始自主完成簡(jiǎn)歷篩選、分析股票等復(fù)雜的任務(wù)。全程無須人工后期優(yōu)化,可直接交付完整成果,遠(yuǎn)超OpenAI同類產(chǎn)品,還創(chuàng)下了GAIA基準(zhǔn)測(cè)試新紀(jì)錄。
而在全網(wǎng)泛濫的測(cè)評(píng)內(nèi)容中,從篩選簡(jiǎn)歷、寫報(bào)告,到做PPT、股票分析,Manus的使用者似乎只需發(fā)送一個(gè)任務(wù)或文件,就能迅速調(diào)用各類工具,實(shí)現(xiàn)編寫和執(zhí)行代碼、瀏覽網(wǎng)頁、操作應(yīng)用等,還能根據(jù)用戶需求來拆解任務(wù),進(jìn)行極度復(fù)雜的任務(wù)規(guī)劃和執(zhí)行。
這也是Manus和DeepSeek最大的不同。
如果說DeepSeek是“知識(shí)型最強(qiáng)大腦”,專注于語言模型的極致優(yōu)化,擅長知識(shí)推理、文本生成、數(shù)學(xué)計(jì)算和代碼優(yōu)化,如法律合同潤色、學(xué)術(shù)論文撰寫、復(fù)雜語義解析等。
上一個(gè)AI爆款DeepSeek
那Manus就是“執(zhí)行型打工人”,核心能力是調(diào)用工具鏈自動(dòng)執(zhí)行復(fù)雜任務(wù)并交付成果,如“爬取財(cái)報(bào)→編寫代碼→部署網(wǎng)站”的端到端自動(dòng)化流程。
在C端的應(yīng)用表現(xiàn)上,能實(shí)現(xiàn)跨領(lǐng)域協(xié)同的Manus,看起來才是那個(gè)可以解放普通人雙手,像人一樣進(jìn)行思考和行動(dòng)?的完美替代品。
業(yè)內(nèi)人士分析稱:“Manus本質(zhì)上相當(dāng)于把deepseek R1、cline、cloud studio等功能糅合在一起,是一個(gè)比較成熟且可操作性比較強(qiáng)的AI Agent,但是它的核心能力依然建立在底層大模型與工具鏈的協(xié)同調(diào)用上。”
這也導(dǎo)致Manus的口碑褒貶不一:追捧者看好其生產(chǎn)力,通過自動(dòng)化處理財(cái)報(bào)分析、電商運(yùn)營等任務(wù),能達(dá)到降本增效的目的;批評(píng)者則痛斥其突發(fā)性錯(cuò)誤、隱性成本飆升,以及在復(fù)雜流程中可能出現(xiàn)的失控風(fēng)險(xiǎn)。
Manus口碑褒貶不一
基于Manus現(xiàn)階段的實(shí)際表現(xiàn),將之視為“數(shù)字化輔助工具人”比“全能替代者”更加恰當(dāng)。
對(duì)此,華源證券認(rèn)為,Manus的破圈意義遠(yuǎn)大于它目前的實(shí)際能力。
因?yàn)樗屖袌?chǎng)見識(shí)到了AI應(yīng)用2.0時(shí)代下,任務(wù)式AI/Agent應(yīng)該實(shí)現(xiàn)的目標(biāo)是:能夠執(zhí)行長任務(wù)步驟、具備異步自主執(zhí)行能力(部署在云端虛擬機(jī),與用戶的工作流程互不干預(yù))。
這都是完全不同于1.0時(shí)代的聊天機(jī)器人的用戶體驗(yàn)和能力邊界,所以有理由相信這是一個(gè)不可小視的產(chǎn)業(yè)趨勢(shì)節(jié)點(diǎn)。
Manus變體才是大殺器
市場(chǎng)對(duì)Manus的實(shí)際能力有分歧,但其存在之于產(chǎn)業(yè)的意義更大。
正如前文所說,Manus并非依賴底層模型的顛覆性突破,而是通過工程化手段整合現(xiàn)有技術(shù)(如大模型、Agent框架、工具鏈等),像“搭積木”般構(gòu)建出完整的任務(wù)執(zhí)行閉環(huán)。
Hugging Face的產(chǎn)品負(fù)責(zé)人Victor Mustar
使用Manus編寫了一個(gè)飛機(jī)小游戲
國內(nèi)初創(chuàng)公司DeepWisdom的MetaGPT團(tuán)隊(duì),僅用3小時(shí)就利用開源框架復(fù)刻出了OpenManus;開源社區(qū)CAMEL-AI團(tuán)隊(duì)“0天”就復(fù)刻出了Manus的通用智能體OWL……Manus范式對(duì)各家的最主要啟示,或許就是Agent(智能體)的門檻并不高。
這種模式下,Agent開發(fā)的關(guān)鍵在于高效整合現(xiàn)有資源,而不是從零開始技術(shù)攻關(guān)。
換句話說,是“如何用好現(xiàn)有技術(shù)”,而非“發(fā)明新技術(shù)”。通過工程整合、開源協(xié)作與用戶體驗(yàn)優(yōu)化,中小團(tuán)隊(duì)完全可能打造出實(shí)用的Agent產(chǎn)品。
問題是,隨著市面上有關(guān)Manus的測(cè)試樣本逐漸增多,其在使用過程中暴露的局限性,也揭示了該賽道的深層技術(shù)壁壘。
相關(guān)報(bào)道顯示,科技媒體TechCrunch利用Manus測(cè)試了包括訂外賣,預(yù)訂餐廳位置,買機(jī)票等一系列任務(wù),但是無一例外都發(fā)生了錯(cuò)誤,導(dǎo)致任務(wù)中止或任務(wù)完成質(zhì)量不高。
平安基金經(jīng)理翟森也在接受財(cái)聯(lián)社采訪時(shí)表示,已經(jīng)第一時(shí)間看過賣方、自媒體等渠道的演示,效果確實(shí)很驚艷。但由于尚在測(cè)試期,可能存在資源不足的問題,目前一個(gè)任務(wù)代理的生成任務(wù)需要花費(fèi)以小時(shí)計(jì)的時(shí)間。
測(cè)試樣本不斷增多
這意味著想要實(shí)現(xiàn)真正的跨領(lǐng)域協(xié)同,仍需突破核心技術(shù)瓶頸——多領(lǐng)域知識(shí)的動(dòng)態(tài)融合與語義對(duì)齊。
其中,既要突破領(lǐng)域壁壘帶來的認(rèn)知鴻溝,又要在實(shí)時(shí)交互中保持上下文一致性,同時(shí)還要兼顧任務(wù)目標(biāo)的優(yōu)先級(jí)動(dòng)態(tài)調(diào)度,以及資源的優(yōu)化分配,最終在復(fù)雜場(chǎng)景下確保決策的準(zhǔn)確性、時(shí)效性和可解釋性。
這對(duì)像Manus這樣的實(shí)用型Agent產(chǎn)品,在知識(shí)圖譜構(gòu)建、上下文感知算法、多模態(tài)交互協(xié)議及動(dòng)態(tài)推理框架等方面,提出了更加系統(tǒng)性的要求。
而Manus的測(cè)試實(shí)踐結(jié)果,也為該賽道揭示了一個(gè)未來的關(guān)鍵趨勢(shì):AI Agent的競(jìng)爭(zhēng)正從單一產(chǎn)品功能轉(zhuǎn)向生態(tài)構(gòu)建能力。
短期來看,垂直領(lǐng)域必然將出現(xiàn)更多"Manus變體",即利用開源框架快速封裝場(chǎng)景化Agent;長期而言,真正實(shí)現(xiàn)跨領(lǐng)域協(xié)同,需突破智能體操作系統(tǒng)的誕生和人機(jī)協(xié)作范式的重構(gòu)這兩大拐點(diǎn)。
當(dāng)Agent不再是執(zhí)行預(yù)設(shè)流程的工具,而是能自主理解跨領(lǐng)域任務(wù)語義的"數(shù)字同事",解放打工人生產(chǎn)力的那一天也就真的來了。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.