就在今天,2025年3月6日,manus開(kāi)始火遍AI圈,之前大佬們紛紛表示2025年是AI agent的元年,果然,很快就得到了應(yīng)驗(yàn)。
Manus。這款被譽(yù)為全球首款通用AIAgent的產(chǎn)品,以其強(qiáng)大的自主執(zhí)行能力和全面的應(yīng)用場(chǎng)景,正在引領(lǐng)AI技術(shù)的新潮流。讓我們一起揭開(kāi)Manus的神秘面紗,看看它如何改變我們的工作和生活。
Manus的誕生與定位
Manus,這個(gè)名字源自拉丁語(yǔ)“mens et manus”,意為“手腦并用”。它不僅僅是一個(gè)AI助手,而是一個(gè)能夠自主執(zhí)行復(fù)雜任務(wù)的智能體。Manus的核心在于其強(qiáng)大的工具調(diào)用能力和自主規(guī)劃能力,能夠像人類一樣思考和行動(dòng),直接交付完整的任務(wù)成果。
強(qiáng)大的自主執(zhí)行能力
Manus的最大亮點(diǎn)在于其自主執(zhí)行復(fù)雜任務(wù)的能力。與傳統(tǒng)AI助手不同,Manus不僅能回答問(wèn)題,還能主動(dòng)調(diào)用瀏覽器、代碼編輯器、數(shù)據(jù)分析工具等,完成從規(guī)劃到執(zhí)行的全流程。無(wú)論是市場(chǎng)調(diào)研、文件處理、旅行規(guī)劃還是專業(yè)的數(shù)據(jù)分析,Manus都能輕松應(yīng)對(duì)。
應(yīng)用場(chǎng)景的多樣性
Manus的應(yīng)用場(chǎng)景極為廣泛,涵蓋了多個(gè)領(lǐng)域:
- 市場(chǎng)調(diào)研
快速調(diào)研市場(chǎng)動(dòng)態(tài),生成詳細(xì)報(bào)告。
- 文件處理
批量處理簡(jiǎn)歷、合同、財(cái)務(wù)報(bào)告等。
- 旅行規(guī)劃
根據(jù)用戶需求定制個(gè)性化旅行手冊(cè)。
- 數(shù)據(jù)分析
深入分析股票、市場(chǎng)情緒等,提供可視化報(bào)告。
Manus采用了多代理架構(gòu),能夠在獨(dú)立的虛擬機(jī)中運(yùn)行。通過(guò)規(guī)劃代理、執(zhí)行代理和驗(yàn)證代理的分工協(xié)作,大幅提升對(duì)復(fù)雜任務(wù)的處理效率。Manus的自主學(xué)習(xí)能力使其能夠不斷優(yōu)化工作流程,適應(yīng)用戶的需求變化。運(yùn)行方式與此前 Anthropic 發(fā)布的 Computer Use 類似,完全運(yùn)行在獨(dú)立虛擬機(jī)中。同時(shí)可以在虛擬環(huán)境中調(diào)用各類工具——編寫(xiě)和執(zhí)行代碼、瀏覽網(wǎng)頁(yè)、操作應(yīng)用等,直接交付完整成果。Manus相較于傳統(tǒng)AI助手,具備顯著優(yōu)勢(shì)。它不僅能夠提供想法,還能將想法付諸實(shí)踐,真正解決問(wèn)題。其采用的Multiple Agent架構(gòu),將任務(wù)拆解為規(guī)劃、執(zhí)行、驗(yàn)證三個(gè)子模塊,由多個(gè)獨(dú)立代理協(xié)同完成,避免任務(wù)間的干擾,確保任務(wù)處理的高效性和準(zhǔn)確性。
能力評(píng)測(cè) GAIA是一個(gè)用于評(píng)估下一代大型語(yǔ)言模型(LLMs)的基準(zhǔn)測(cè)試,這些模型因增加了工具使用、高效提示、訪問(wèn)搜索等功能而具備了增強(qiáng)能力。它由超過(guò)450個(gè)非平凡的問(wèn)題組成,每個(gè)問(wèn)題都有一個(gè)明確的答案,需要不同程度的工具使用和自主性來(lái)解決。GAIA的目的是測(cè)試AI助手在處理復(fù)雜任務(wù)時(shí),的能力這些問(wèn)題需要高級(jí)推理、多模態(tài)理解、編碼能力和工具使用,例如網(wǎng)絡(luò)瀏覽。 Level 1
特點(diǎn):Level 1的問(wèn)題通常不需要工具,或者最多只需要一個(gè)工具,且不超過(guò)5個(gè)步驟就能解決。這些問(wèn)題相對(duì)簡(jiǎn)單,主要測(cè)試模型的基本理解和推理能力。
能力要求:Level 1的問(wèn)題主要考察模型對(duì)簡(jiǎn)單指令的理解和執(zhí)行能力,例如回答事實(shí)性問(wèn)題或進(jìn)行簡(jiǎn)單的計(jì)算。
Level 2
特點(diǎn):Level 2的問(wèn)題通常涉及更多的步驟,大約在5到10步之間,并且需要結(jié)合不同的工具來(lái)解決。這些問(wèn)題的復(fù)雜性增加,需要模型具備更強(qiáng)的推理和規(guī)劃能力。
能力要求:Level 2的問(wèn)題要求模型能夠使用多種工具,并在不同工具之間進(jìn)行切換,以完成復(fù)雜的任務(wù)。例如,可能需要模型先進(jìn)行網(wǎng)絡(luò)搜索,然后對(duì)搜索結(jié)果進(jìn)行分析和總結(jié)。
Level 3
特點(diǎn):Level 3的問(wèn)題代表了近乎完美的通用助手的能力,需要執(zhí)行任意長(zhǎng)度的動(dòng)作序列,使用任意數(shù)量的工具,并且能夠訪問(wèn)整個(gè)世界。這些問(wèn)題通常非常復(fù)雜,需要模型具備高度的自主性和創(chuàng)造性。
能力要求:Level 3的問(wèn)題要求模型能夠處理非常復(fù)雜的任務(wù),這些任務(wù)可能涉及多個(gè)領(lǐng)域的知識(shí)和技能。例如,可能需要模型進(jìn)行長(zhǎng)時(shí)間的研究、分析和規(guī)劃,以解決一個(gè)實(shí)際世界中的復(fù)雜問(wèn)題。
根據(jù)官方網(wǎng)站信息,在GAIA基準(zhǔn)測(cè)試(評(píng)估通用AI助手解決真實(shí)世界問(wèn)題的能力)中,Manus在所有三個(gè)難度級(jí)別上都取得了新的最先進(jìn) (SOTA) 表現(xiàn)。此外,Manus在權(quán)威的GAIA基準(zhǔn)測(cè)試中創(chuàng)下新紀(jì)錄,性能遠(yuǎn)超OpenAI的同類產(chǎn)品。
團(tuán)隊(duì)寄語(yǔ): 在產(chǎn)品發(fā)布之后,Manus團(tuán)隊(duì)的Hyan在Superlinear Academy上介紹了Manus的產(chǎn)品哲學(xué):“我們堅(jiān)信并踐行l(wèi)ess structure more intelligence的哲學(xué):當(dāng)你的數(shù)據(jù)足夠優(yōu)質(zhì)、模型足夠強(qiáng)大、架構(gòu)足夠靈活、工程足夠扎實(shí),那么computer use、deep research、coding agent等概念就從產(chǎn)品特性變?yōu)榱俗匀挥楷F(xiàn)的能力。
把任務(wù)留給Manus,把時(shí)間專注于 更有創(chuàng)造性的 工作,在任務(wù)過(guò)程中,可實(shí)時(shí)通過(guò)移動(dòng)
端查看任務(wù)執(zhí)行狀態(tài),當(dāng)你回來(lái)時(shí),Manus將呈現(xiàn)令人滿意的結(jié)果。”
未來(lái)展望
Manus的出現(xiàn)標(biāo)志著AI技術(shù)進(jìn)入了一個(gè)新的階段。隨著技術(shù)的不斷進(jìn)步和應(yīng)用場(chǎng)景的拓展,我們有理由相信,Manus將成為未來(lái)工作和生活的重要助手。無(wú)論是企業(yè)還是個(gè)人,都將從中受益。
結(jié)語(yǔ)
Manus的問(wèn)世,不僅展示了AI技術(shù)的無(wú)限潛力,也為我們提供了一個(gè)全新的視角來(lái)看待未來(lái)的工作方式。讓我們共同期待Manus在未來(lái)為我們帶來(lái)更多的驚喜和便利!Manus的出現(xiàn),標(biāo)志著人機(jī)協(xié)作進(jìn)入了一個(gè)新的范式,它可能是通向通用人工智能(AGI)的一個(gè)重要窗口。
以上,既然看到這里了,如果覺(jué)得不錯(cuò),隨手點(diǎn)個(gè)贊、在看、轉(zhuǎn)發(fā)三連吧,如果想第一時(shí)間收到推送,也可以給我個(gè)星標(biāo)?~謝謝你看我的文章,我們,下次再見(jiàn)。
鏈接:https://manus.im/
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.