這幾天 Manus 很火,一碼難求。今天早上,在 hidecloud 那里手快搶到了一個碼,花了幾乎一整天做測試。跟各位分享下真實的體感。
Manus 是真正的 AI 實習生
Manus 是 monica 公司出品的一個 AI 工具。來自拉丁語, Mens et Manus,意思是手腳并用。
我們都理解 AI 大模型有非常出色的思考和數據分析能力了,但如今 ChatBot 為主的大模型工具,還是停留在對話、信息互通的層面。AI 下一步當然就是長出手腳。manus 是其中的嘗試。
簡單說, Manus 采用了 Multiple Agent 架構,運行方式與此前 Anthropic 發布的 Computer Use 類似,完全運行在獨立虛擬機中。
每次會話,就相當于打開一臺電腦,讓 AI 去幫我們操作一些事情。包括但不限于: 編寫和執行代碼、瀏覽網頁、操作應用等,從而直接交付完整成果。
這些任務是可以多樣化的,不只是能做一件,而且 AI 會自行拆解任務。
步驟拆解的過程,第一次看的時候非常驚艷,看到 AI 自己打開代碼編輯器寫代碼、打開瀏覽器查資料,有種進入了科幻電影中的奇妙爽感。
比如這是一個游戲的開發任務拆解。
這是一個研究報告的拆解。
我們常說 AI 是個人助理、是實習生。目前 Manus 就是試圖做這種事情。ChatGPT 是大腦,DeepSeek 是性能需求更小的大腦, Manus 就是接上大腦的手腳(可能還包括一些小腦的工作)。
真實的效果如何呢?
我讓 Manus 完成了 9 個任務。(由于目前使用限額,有很多新 idea 還沒有嘗試。過幾天有新的發現,會再分享。)
9 個任務正好覆蓋了研究報告、內容創作、產品制作和生活指南四個類別。
我給每個任務做出了個人很主觀的評分。可以先說一下總分:
接下來是詳細的任務情況。其中的鏈接有全部的過程回放,各位都可以復制粘貼到瀏覽器自行查看。以證明內容均是可靠真實的。
任務 1:
「找到目前 AI 產品的公允評測,并且根據各個 AI 產品的情況,以 表格 形式展示。」
Markdown 的格式很鮮明,可讀性強,這種格式上的處理的確比各個 ChatBot 的效果更好。不知道為啥總給人一種專業性高一些的感覺。
評分:8/10
回放地址:https://manus.im/share/ZNoSJ68LEBb7nWncKmh2Sl?replay=1
任務 2:
「制作一份詳盡的、可讀性強的中文互聯網的播客行研報告,以 PPT 形式展示。」
這份報告的內容還算詳實,同上,也比別的 ChatBot 做的似乎更專業一些。其中會自動生成一些簡要的統計圖形作為參考,這也是跟其它 ChatBot 不一樣的一點。
其中有一些信息會有重復,還有一些錯誤。不過不妨礙這也是比較全面的一篇綜述類的報告,作為切入來了解一個行業,效果會很好。
另外,生成的報告是 mdx 格式,讓它把文檔轉為 PDF 時,會話崩掉了。
評分:8/10
報告地址:
https://pages.manus.im/?sId=7ArLJdjCLFd2GBT3HI5fni&filename=podcast_report.mdx
回放地址:https://manus.im/share/7ArLJdjCLFd2GBT3HI5fni?replay=1
任務 3
「我是半拿鐵的主播劉飛,我要做一期播客的逐字稿,主題是博世的歷史故事,幫助我整理一份詳盡的稿件,我來做錄制。」
作為主播,最感興趣的自然是,能不能幫我搜集資料。這是非常實在的生產力,我在這方面是有最強的使用意愿和付費意愿的。
首先,不知為何,任務始終結束不了,始終合并不成。(注意僅這一步已進行的時間超過了 3 小時)
不過階段性內容已經生產了,我把每個階段的內容大致讀了一下。
從稿件的表達方式和實際可用性而言,跟現在的 AI 生成文稿一樣,AI 味比較重,是沒法拿來直接當逐字稿的。但是,作為一份綜述的底稿,已經超過絕大多數能搜到的文章了,完全能夠成為我接下來做播客的前期準備工作之一。
它有一點很精彩的在于,拆解的搜索關鍵詞。普通的 AI 搜索引擎,也許沒有這么結構化、條理清晰。
這一點會讓我很興奮。
評分:9/10
回放地址:https://manus.im/share/WCOZchs9jkjngR9QqsCd1B?replay=1
任務 4
「有關 Manus 的目前進展、各方的評價,幫我寫一篇在 2000 字左右的公眾號文章,并且起一個有意思的標題」
同樣的,作為公眾號作者,我也期待能夠直接幫我合成一篇文章。
這篇文章的可用性很不錯,有層次,有正反面對比,有最新的信息,等等。比我對照的各大平臺的文章更詳盡更全面,可能因為搜索能力和整合能力的增強?
而且比較奇怪,這篇文章比起博世那篇,AI 味兒要淡很多。
評分:8/10
回放地址:https://manus.im/share/Yl0k37xabyMnImtdECPh6j?replay=1
任務 5
「我是產品經理和播客主播劉飛,幫我制作一個內容豐富的個人主頁。」
怎么說呢,制作個人主頁這塊子,還是有點薄弱。我沒有橫向對比其它 AI 生成個人主頁的工具,Manus 的效果目前看還是很失望的。
就結構而言,勉強是可用的一個模板。還需要不少的修訂才行。
本來以為會根據我的公開信息和平時創作的文章、播客來做一些補充,結果發現沒有任何填充。
于是我把過去歷史的文章發給對方,結果就崩了...
評分:5/10
回放地址:https://manus.im/share/lh4FxoBw6YYEdBQ0WnbHQJ?replay=1
任務 6
「完成一個 2048 游戲,游戲里的美術設計都使用合乎邏輯的海賊王角色和海賊王的元素。」?
這個游戲界面剛打開的時候,著實有點驚艷,其中的元素識別都很精確,像從東海小嘍啰到海賊王羅杰的這個排序。以及游戲的積分叫做貝利。
可惜,這個游戲玩不起來,每次移動鍵盤,就會反復跳躍。讓 Manus 進行查殺 bug,也不順利,始終不能玩的狀態。
之所以還給分數,就是感覺多調試幾次,也許會成功。但同樣的,程序也崩了...
評分:4/10
回放地址:https://manus.im/share/uBuCuwFsnRLTXbDmROuegX?replay=1
任務 7
「做一個簡單的滑雪游戲,玩家控制躲避障礙物,操作方向和加減速,同時符合真實的物理規律。背景要美觀漂亮。」
同樣的,也是打開的時候很驚艷,其中的元素:雪山、松樹、分數、速度,以及滑雪者(俯視圖?)都是有的。
只不過玩起來也有挺多問題,玩家角色不在正常的雪道上,而且從屏幕消失后,會再隨機從一個地方出現。這感覺很詭異。障礙物雖然少,但很難躲避,如圖里所示,速度實在太快。
不過我也覺得調試過后,也許就能玩了。只是,這個會話也崩了...
評分:4/10
回放地址:https://manus.im/share/us0fPQAT4On6XnGwM0uwcV?replay=1
任務 8
「我住在杭州,想去日本滑雪,準備每年去 4 次,幫我指定一個 5 年的滑雪計劃,包括詳細的行程信息和建議。」
這里本意是想讓 Manus 給出詳盡的建議,直接可參考的那種,但不知為何,這次給的比較偷懶。
一來,推薦的雪場不是很符合初學者到進階的邏輯。二來,說了 5 年計劃,結果給了 1 年的,說之后 4 年您就按照之前的建議來好了。
評分:5/10
回放地址:https://manus.im/share/us0fPQAT4On6XnGwM0uwcV?replay=1
任務 9
「我準備開始玩所有魂系游戲,幫我指定一個游玩順序,以及游玩的詳細建議」
很全面,梳理了新手友好的路線、劇情連貫性的路線,甚至包括時間有限的玩家的路線(只玩三款經典)。還有平臺的建議,以及心態建議:擁抱死亡、應對挫折、學會防御、管理體力等等。
也許是因為搜索得到的信息比較全面?試用過別的 ChatBot,還是結構不太全面,沒有這個文檔更有條理。
評分:9/10
回放地址: https://manus.im/share/M0YoPZajIPnhwic1ebgGFP?replay=1
結語:未來可期
不知看完這些具體任務的完成,各位的感受如何。
我有幾點感受。先說不好的。
第一,實在是太慢太卡太不穩定了。
從時間來說,平均一次操作要在半小時以上,有的困難點的項目,瀏覽器打開速度很慢,信息整合很慢,然后幾個小時過去了。
慢倒也還好,我們做領導的,畢竟給實習生要一些寬容。
只是,我目前的幾個會話,多數都在宕機狀態了,就是在反復聊天后,會顯示錯誤,并強行關閉會話。
也因為這樣,每天的額度還沒試過幾個任務,就超標了。
在回放里面可以看到,無奈之下,我只能用另一個主題的會話,來繼續做新的項目。比如滑雪計劃和滑雪游戲是放在一個會話里做的。
第二,產出的質量效果還不夠穩定。
除了服務器的不穩定,產出的結果,有的還不錯,有的則很不穩定。這可能因為產品剛剛上線,還沒有多少迭代,也沒有多少用戶的真實使用案例。
所以對 Manus 的期待是,有好的結果,還是每一次結果都是好的,是完全不同的。希望這個實習生,一上手就能特別有專業度,也是不顯示的。
但是,這不妨礙樂觀的方面。
首先,剛剛說的很多問題,都是技術上可以解決的,比如卡頓、太慢。在輸出結果不穩定的問題上,長期的產品迭代,也必然會有優化。我會相信 Manus 在年內,應該至少在結果來看,能做到 75 分以上的水準。
你可能會說,啊,從信息搜集和整理報告來說,DeepSeek 和 Claude 不也都能比較好地完成嗎?或者是搜索能力的差異,或者是輸出篇幅、輸出結構的差異,這些似乎都不是技術門檻?
其實關鍵的區別就在于:Manus 用的是虛擬機。虛擬機就意味著,原則上 AI 能像我們日常操作一樣獲取信息,而不是通過固定的接口。
舉個例子,未來 Manus 也許可以接手我們手里的 Photoshop 和 PowerPoint,提供更多輸出的可能性。再比如,目前的搜索引擎得到的結果質量不好的原因在于,很多內容平臺都是封閉的,那么虛擬機是不是有能力在保護安全和隱私的情況下,以用戶的賬號去獲取公眾號、小紅書和知乎的信息,來補充輸入呢?
這些場景代表著很不一樣的價值。正因如此,Manus 給了很多身邊 AI 創業者信心,也給了應用場景可以參考、可以學習的方向。
樂觀的地方在于,AI 的入口肯定不是 ChatBot。Manus 這樣的產品初步展示了未來的一個可能性。
科技產品的發展一定是往人性更懶惰的方向去的。可以回顧張小龍當年的經典一頁。
跟 AI 聊天,反復確認,聽取建議自己去做事情,都不如讓 AI 把剩下的很多事情做了。
免費郵箱取代個人建站,微信又取代郵箱,是不可逆的道路。AI 上手,接管更多我們日常的工作,也是不可逆的路。
對于 Manus 當下的批評是容易的,但能否看到其中的機會,看到未來 AI 進化的方向,是需要一點眼光的。從交互方式而言,對人類最自然的,就是自然語言。自然語言,一定會取代代碼、關鍵詞搜索和手工的圖表繪制,這是我篤信的。自然語言指揮 AI,AI 去完成這些機械的工作,正是 Manus 這樣的產品形態看。
那 Manus 這樣的通用場景的產品,就像十幾年前用微信時的卡頓、幾年前在網上購物的不方便一樣,還需要時間的證明。
總的來說,我個人的體驗,還是會車開了遠光燈——眼前一亮。這是今年初,在 DeepSeek 之后最驚喜的產品,也是最值得體驗的產品。那種看著 AI 在自己干活的體驗,也許會像我們第一次看到電燈的體驗。
未來,我們的世界都會燈火輝煌。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.