99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

深度實測Manus,這就是AI Agent行業的DeepSeek時刻

0
分享至

文 | 闌夕

Manus刷屏一天,從開始的一夜成名,到中間的一碼難求,再到質疑它的宣發一擲千金,整個過程里,FOMO情緒和直覺警惕交纏不休,是很有意思的傳播學樣本。

其實AI行業這幾年來一直都是「炸裂驅動型」的資訊模式,了解的都已經祛魅了,不了解的卻還會少見多怪,但是有一說一,天天這么炸裂下來,客觀上也會存在真的炸裂蒙混其中。

而我對Manus的評價就是,它確實屬于真·炸裂的那一桌,稱得上AI Agent行業的DeepSeek時刻,不過有個補丁,結尾時我再疊上。

先看Manus的一個演示效果:

讓它開發一款文字互動游戲,可以扮演谷歌公司的CEO,通過體驗公司歷史上的重要決策,既能獲得游戲的樂趣,也可以順便了解公司的文化。



用了差不多一個小時,Manus把谷歌CEO模擬器的網頁游戲開發好了,完成度很高,點擊開始游戲,還會讓你自選難度,接著就會面對谷歌發展史上的每一次轉變節點,你的選擇會決定公司資源的變化,并影響最終的游戲結局。

在一個小時里,用一句話,做一個游戲出來,這就是AI Agent的能力。

它和傳統的對話式AI不同,不再只是提供信息層的答案,而是能夠操作電腦完成更加具體的工作任務,包括但不限于寫程序、做網頁、整報告、篩簡歷等等等等,它能夠完全自主的解決過程中遇到的各種困難,并交付工作結果,當然也有例外,這個例外我們后面再說。

目前主流的AI Agent服務不多,而且普遍很貴,比如ChatGPT Operator需要200美元一個月Pro會員才能使用,還有主打編程市場的AI工程師產品Devin,每個月的費用更是要500美元。

Manus的開發商是中國大模型團隊Monica,目前是免費測試階段,單任務成本壓縮到了2美元,是OpenAI的1/10,同時在基準測試的排行榜上已經超過OpenAI拿下了全球最強。

我在拿了邀請碼后,已經在幾個小時之內耗盡了Manus的單日計算資源,確實非常興奮,效果也非常震撼。

展示幾個實測案例吧:

首先我讓它幫我做一張linktree風格的個人主頁,Manus把這個任務拆成了8個步驟,先在全網搜集我的資料信息,包括我在各個平臺的鏈接以及代表作,然后基于linktree的設計風格開始編寫網頁代碼,半個小時之后,它交付了這么一個作品給我。

簡單,但是完美符合要求,交互也都沒問題,寫輪眼級的復制效果,如果想做得更美觀,還可以繼續寫提示詞讓它修改。

第二個測試,是我用Manus幫一個工程師群友解決實際問題,他在工廠里負責維護的阿特拉斯機械臂出了點小問題,找售后的話費用要花幾千塊錢,不如自己想辦法找補,他又懶得看文檔,于是直接給了我一段話,讓Manus看看怎么處理。



注意啊,這個需求理論上普通的對話式AI也能接住,但會需要更多的交互流程,比如你得把文檔喂給它,一步一步的得到答案,但是Manus不需要這些,它會自己去阿特拉斯官網下載文檔,讀完之后找到解決問題所需的關鍵內容,仔細分析,創建程序,最后的代碼我發給了朋友,有點小瑕疵但手工修改之后完全可用,直接省掉了一次售后呼叫的次數。

第三個測試,是我的微博讀者提議,讓Manus去做一個國家的極簡編年史,我增加了漫畫表選和網頁設計的要求,最后交付的作品配色有點難繃——AI沒有審美,這點必須反復強調——但是這時Manus的服務器已經宕機了,暫時沒法修改,所以我也就把半成品展示出來吧。



可以看到,Manus將英國的歷史分成了10個不同的時代,并基于時代風貌繪制了SVG圖片,最后呈現在HTML的網頁端,可以說是人機協同的樣板間了,無論是作為課外教案還是作品預覽,都有極其便捷的上手門檻。

最后一個案例,是我讓Manus做一款消消樂游戲,但是圖標得用原神的角色,它先是開始研究消消樂的游戲機制和實現方法,接著試圖搜集原神的圖片素材,這個時候就出現例外了,它第一次發出了接管請求,原因也很讓人無語,它的運行邏輯被一個網盤給堵住了,沒法注冊賬號,所以下載不了資源,想讓我幫它去下載。

看來再強大的AI,也會被網盤的會員攔在門外。

本著盡可能讓AI Agent獨立完成工作的原則,我沒有這么做,而是稍微改了一下需求,讓Manus改用科技公司的logo來做游戲圖標,因為開放版權的SVG素材全網都是,所以這下Manus跑起來就沒什么問題了,很快就做完了一個帶積分的消消樂游戲,玩起來也算順暢。



不過也能看到,在解決這類相對復雜的問題時,Manus在細節方面的缺失還是有的,這也和人類(我)參與過少有關,比如對屏幕的適配問題,需要給它更多的說明,Manus的修改響應也不慢,但因為同樣遇到了服務器宕機的麻煩,這個任務暫時沒有繼續精進下去。

我覺得這幾個實測例子已經可以非常清晰的表明,AI Agent在現階段的能力和不足,Manus已經不是那種只能操作瀏覽器的產品了,它本身具有沙盒環境,能在完成工作之前自行進行測試,驗收合格再做交付,但也限于互聯網的數據邊界,如果網絡上的資源不夠,它是沒有辦法生產資源自給自足的。

我還做了一些偏文書類的測試,也可以用來對比AI Agent的特點:

比如我讓Manus根據B站最熱門的10個星見雅(游戲角色)視頻,給出她的操作技巧。



Manus是真的足足看完了10個視頻——花了一個多小時的時間——再去把各個UP主的小作文精煉成了我要的材料,而且相當準確,同樣的任務如果交給聯網的大模型去做,雖然也能完成,但幻覺的產生概率很高,在「老實」程度上不及AI Agent靠譜。

再如讓Manus去研究PolyMarket的套利可能,雖然我確實有那么一絲期待,想得到一個穩賺不賠的投資指南——別笑——Manus倒是兢兢業業的做足了功課,列出了四個套利機會,讓我只要在PolyMarket看到符合條件的項目出現,就能無腦按規則下注。



從回放來看,Manus每次都是從最基礎的信息開始切入,先了解PolyMarket是什么,再分析預測市場的游戲玩法,接著結合平臺規則構建風險策略,標準的實習生作風,任勞任怨,踏實耐用。

對了,回放這個設計,在我看來也是Manus的亮點之一,它有點像推理模型暴露思維鏈的選擇,很多時候,AI的思考過程要比答案供給更能給人啟發,Manus的每一個任務都有回放功能,且可被分享出去,它在解決問題的途中所展現出來的手段,完全稱得上是另一種形式的智能資產,可以扮演人類的老師。

所以話說回來,我評價Manus是AI Agent行業的DeepSeek時刻,這里需要打一個補丁,是DeepSeek-V2時刻,2024年5月,DeepSeek開源V2版本的模型,這是它第一次出圈,因為價格非常便宜,但是因為模型本身的能力一般,所以當時很多人只是覺得DeepSeek要來打價格戰了,感到意外但不重視,熱度也沒有持續太久。

直到DeepSeek-V3和R1的連續發布,大家這才發現事情完全不一樣,一夜之間整個大模型市場的成本邏輯都被顛覆了。

最初,沒有人在意這場災難,這不過是一場山火,一次旱災,一個物種的滅絕,一座城市的消失,直到這場災難和每個人息息相關。——「流浪地球」

我的意思是,AI技術的發展是連續性的,而在這條跌宕起伏的曲線上,每一次的信號強度都決定了后面的突破深度,就像DeepSeek沒有V2就不會有V3,更不會有R1,我對Manus的看法沒有變化,在把AI Agent服務從專業場景帶向通用場景的歷史轉折點,它就是開山立派的創始品牌。

從用例來看,作為AI Agent的功能性非常強大,對于拆解任務的熟練度很高,CoA(代理鏈)的觀測感覺和看CoT(思維鏈)很像,能「看到」AI在多個方案里評估并尋求最優解。

理論上應該是內置了海量的CoA來做承接,就和DeepSeek這類推理模型也是提前消化了足夠豐富的CoT之后才會推向大眾市場,盡可能的覆蓋到了主流需求,從官網的Use Case就能看到。

有什么問題可以在評論區留言,或者說出你們想讓Manus完成哪些任務,我可以幫著測試。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
波音財報披露其商用飛機積壓訂單超5600架!這是個什么概念呢?

波音財報披露其商用飛機積壓訂單超5600架!這是個什么概念呢?

翻開歷史和現實
2025-04-27 18:23:51
白話拆解|“愿意穿耐克不等于愿意造耐克!”共和黨“金主”怒了

白話拆解|“愿意穿耐克不等于愿意造耐克!”共和黨“金主”怒了

國際在線
2025-04-27 15:10:20
知三當三,醫療系統的大瓜來了!副主任窩邊草吃禿了,還有官小姐

知三當三,醫療系統的大瓜來了!副主任窩邊草吃禿了,還有官小姐

小娛樂悠悠
2025-04-27 10:52:20
瀕臨出局!丁俊暉手感冰冷慘遭11連鞭,1-11落后布雷切爾!

瀕臨出局!丁俊暉手感冰冷慘遭11連鞭,1-11落后布雷切爾!

直播吧
2025-04-27 22:52:10
京東重磅消息!將招聘10萬名全職騎手,全部繳納五險一金,所有費用都由公司承擔

京東重磅消息!將招聘10萬名全職騎手,全部繳納五險一金,所有費用都由公司承擔

每日經濟新聞
2025-04-27 19:14:11
全民雙休要來?網傳五一后逐步落地雙休!看似不經意,實則布大局

全民雙休要來?網傳五一后逐步落地雙休!看似不經意,實則布大局

火山詩話
2025-04-27 08:31:39
斯諾克名宿:我很同情很可憐丁俊暉,布雷切爾的全攻打法令人驚嘆

斯諾克名宿:我很同情很可憐丁俊暉,布雷切爾的全攻打法令人驚嘆

楊華評論
2025-04-27 12:16:15
兩場12:4難逃慘敗命運!世錦賽16進8國手兩連敗或成定局!

兩場12:4難逃慘敗命運!世錦賽16進8國手兩連敗或成定局!

阿柒體訊
2025-04-28 00:18:14
“世界上最孤獨動物”斑鱉冒頭曬背 國內僅存一只 它被稱為“水中大熊貓”|封面深鏡

“世界上最孤獨動物”斑鱉冒頭曬背 國內僅存一只 它被稱為“水中大熊貓”|封面深鏡

封面新聞
2025-04-27 17:44:03
女性“高潮針”上熱搜,咨詢實測“多地預約爆滿”不實 醫生提醒無科學依據還有致死案例

女性“高潮針”上熱搜,咨詢實測“多地預約爆滿”不實 醫生提醒無科學依據還有致死案例

紅星新聞
2025-04-27 17:40:33
澤川“葬禮外交”談了什么?為何俄方立即宣布接受無條件停火?

澤川“葬禮外交”談了什么?為何俄方立即宣布接受無條件停火?

史政先鋒
2025-04-27 15:46:46
利物浦隊史首人!斯洛特處子賽季奪冠,重新激活薩拉赫,名宿狂贊

利物浦隊史首人!斯洛特處子賽季奪冠,重新激活薩拉赫,名宿狂贊

奧拜爾
2025-04-28 01:31:07
關于做好2025年“五一”假期前后新冠病毒感染等重點傳染病防治工作的通知

關于做好2025年“五一”假期前后新冠病毒感染等重點傳染病防治工作的通知

健康報
2025-04-27 09:52:12
1979年對越自衛反擊戰:一副軍長貪功冒進瞎指揮,連長主動帶隊投降

1979年對越自衛反擊戰:一副軍長貪功冒進瞎指揮,連長主動帶隊投降

燭下青史
2025-04-26 22:12:04
中央層面整治形式主義為基層減負專項工作機制辦公室 中央紀委辦公廳公開通報3起整治形式主義為基層減負典型問題

中央層面整治形式主義為基層減負專項工作機制辦公室 中央紀委辦公廳公開通報3起整治形式主義為基層減負典型問題

新華社
2025-04-27 16:27:25
杭州市綜合行政執法局副局長邵偉華接受審查調查

杭州市綜合行政執法局副局長邵偉華接受審查調查

界面新聞
2025-04-27 17:40:28
撐不住了,沃爾瑪恢復中國供應鏈,但美國電商卻開始統一漲價了

撐不住了,沃爾瑪恢復中國供應鏈,但美國電商卻開始統一漲價了

阿鳧愛吐槽
2025-04-27 12:45:22
李兆基追悼會:李澤楷一人不穿黑,徐子淇李家誠表情截然不同!

李兆基追悼會:李澤楷一人不穿黑,徐子淇李家誠表情截然不同!

古希臘掌管松餅的神
2025-04-27 16:45:54
朱立倫、謝龍介赴警分局自首,強調沒有做錯

朱立倫、謝龍介赴警分局自首,強調沒有做錯

參考消息
2025-04-27 10:53:26
神舟二十號乘組人員確定!時隔22年,60歲楊利偉還有機會再飛天嗎

神舟二十號乘組人員確定!時隔22年,60歲楊利偉還有機會再飛天嗎

胖福的小木屋
2025-04-26 23:51:22
2025-04-28 01:44:49
闌夕 incentive-icons
闌夕
最具觀點的互聯網商業評論
2304文章數 73911關注度
往期回顧 全部

科技要聞

充1秒跑2.5公里,寧德時代比亞迪華為激戰

頭條要聞

用馬斯克理念改造生產線 95后女生創業1年銷售額上億

頭條要聞

用馬斯克理念改造生產線 95后女生創業1年銷售額上億

體育要聞

我們來自北極圈,我們有全球最恐怖的主場!

娛樂要聞

華表獎獲獎名單!張譯二影帝惠英紅勇影后

財經要聞

2千億!核電開閘 國常會核準10臺新機組

汽車要聞

蔚來李斌的"十年磨一劍" 從看得見 到看不見

態度原創

手機
旅游
本地
時尚
公開課

手機要聞

華為 Mate XT 非凡大師推送 HarmonyOS 5 花粉 Beta 版

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

本地新聞

云游湖北 | 漢川文旅新體驗:千年陶藝邂逅湖光

5條適合春天的裙子、褲子!溫柔顯瘦美到爆炸!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 宁明县| 涪陵区| 崇礼县| 兴安县| 汉中市| 呼图壁县| 江永县| 屯门区| 武陟县| 崇文区| 通化县| 富锦市| 韶山市| 永顺县| 西和县| 周至县| 嘉义市| 北京市| 岳普湖县| 通榆县| 屯留县| 天祝| 西城区| 瓮安县| 隆安县| 老河口市| 武穴市| 余干县| 扎兰屯市| 山东| 宁陕县| 新丰县| 平山县| 砚山县| 卢氏县| 呼伦贝尔市| 莎车县| 宁乡县| 拜城县| 公安县| 天祝|