文:王智遠 | ID:Z201440
Manus火了后,大家開始關注一個新概念:
通用agent。
有人覺得,這東西會徹底改變未來技術的發展方向,還能顛覆大模型產品和人類交互方式;還有人幻想,以后只要說一句提示詞,AI能搞定一切,完全不用自己動手。
不過,我覺得,通用智能體不是新概念,Manus也不是全球第一個AI通用智能體。
他們只是把自家產品定義為,一款連接思維、行動的通用人工智能代理,特點是能搞定各種復雜的任務,不僅能思考,還能直接給出結果。
所以,別被碎片化的消息給糊弄了。只要稍微查一查,就會發現早在2024年,網上已經有不少關于通用Agent的信息。
01
通用智能體(General Artificial Intelligence Agent)到底是什么?我舉個例子:
你是一名市場部同學,老板突然要求:明天上午10點前,要一份新產品在小紅書的推廣分析報告;過去,你得先登錄后臺導數據、整理成圖表、放進PPT,再檢查格式,最后交給老板,整個過程繁瑣又耗時。
如果有一個通用agent,只要把數據下載下來,交給它,然后說:幫我整理成一份報告,把數據對比部分可視化,明早10點前交給老板。
接下來,通用agent會自動分析數據、生成圖表、總結結果并提出建議,最后準時把報告交到你手上;理想情況下,它甚至能幫你列一個待辦清單,告訴你要做什么,剩下的繁瑣任務都由它完成。
通用agent讓人從重復性工作中解放出來,專注于更重要的事情。
我讓AI幫我查了一下它的完整定義。AI說:
一種很聰明的AI,不像只會干一件事的“專才”。它能理解復雜需求,規劃步驟、調用工具,是自動完成多種任務的“多面手”,完全像真人一樣應對靈活場景,真正實現從單一功能到全面助力的跨越。
通用智能體有很多不同形態。第一種,我想到了釘釘AI助理。
用過釘釘的朋友應該知道,你對AI助理說:查詢一下我和張三關于A方案的聊天記錄,并把關鍵部分提煉出來形成文字,形成代辦事項。
它會自動搜索對話,提取關鍵內容,整理成清晰的總結,還能把需要跟進的任務直接加入待辦清單,完全不用自己動手去翻。
我認為,這種工具挺有潛力。你想,作為企業里的常用工具,幾乎每個人工作時都得用,而大家在用的過程中,自然會產生和沉淀大量的數據。
這樣一來,AI助理作用就很明顯了:
它能把零散的數據整理成有用的信息,再通過各種工具直接串聯起來,變成你可以直接用的東西。這樣不僅個人工作效率提高了,公司整體協作也會更順暢。
但是它也有一定劣勢。
對比Manus這樣的產品形態來看,Manus更像一個“智能體的串聯者”。它能夠把不同專長的智能體串聯起來,通過一個核心智能體來協調這些能力。
釘釘AI助理目前還做不到這一點。它更多是單獨完成一些具體任務,比如:搜索聊天記錄、安排日程等,這些功能有些目前還沒有形成深度的聯動。
換句話說,釘釘AI助理目前更像是一個高效的「單兵」,而Manus則像是一個指揮多個專家協同作戰的“團隊領袖”。
所以,從應用場景的深度和關聯性來看,Manus橫向能力深,尤其在多任務協作或者復雜流程處理時,而釘釘目前集中在企業內部的基礎效率提升上,未來如果能在任務串聯和智能化協作上進一步突破,可能會更有競爭力。
02
第二種產品形態來自于Deep Research、豆包、Kimi、通義夸克以及GROK3這類大模型對話產品未來的演變。
為了更好地理解這一點,我拿Deep Research介紹。
Deep Research是ChatGPT內嵌的一款增強能力,也算是一種工具,專門為自動化復雜的在線多步驟任務而設計。它不僅在語言風格上和DeepSeek高度相似,連功能也相近。
它能從海量的數據里快速找到有用的信息,還能幫你分析、總結,甚至生成報告;你可以把它看成一個特別聰明的研究助手,只要提需求,它就能搞定大部分繁瑣的工作。
舉個例子:
你是一名創業者,想知道未來三年健康食品市場的趨勢。只要告訴它這個要求,它就會去查找資料,整理出重點,比如市場規模、消費者喜歡什么、技術怎么發展等等,最后給你一份報告。
但這不是最關鍵的。
最重要的是,在做報告時,不僅能寫出文字,還能做出表格、代碼,甚至是思維導圖,這樣你就能更清楚地看懂這些信息。
不過,它的可視化能力更像1.0版本,功能有了,體驗還不夠“驚艷”。為什么是1.0版本呢?有三點:
一,基礎功能實現了,細節還不夠完善。目前我看到報告,大多以Markdown格式為主,內容以文字和簡單的結構化數據為主。換句話說,內容呈現方式相對“樸素”,缺乏更直觀的視覺設計。
二,它還不太會把圖片、圖標這些多媒體元素加進去;三,它的交互性也不夠強。
我前幾天讓Kimi幫我生成一個表格,它很快就做出來,但想修改一下里面的內容,卻沒辦法直接操作,最后只能一次次給提示詞,一次次生成。
這并不意味著它們潛力有限。1.0版本是一個開始,以后,當我們用Kimi、豆包、DeepSeek等工具時,它們的多模態能力會越來越強,交互也會更厲害。
你可以對它說:幫我寫一段話,然后直接做成一張海報圖片。它就會馬上生成一張設計好的圖片,你保存下來就能直接當海報用。
所以,這些產品的發展,大概會經歷四個階段:
第一個階段,簡單搜索和對話工具,主要幫你找信息、回答問題。第二個階段,變成一個“工具箱”,能敲代碼、做表格。
第三個階段,全能型選手,把文字、圖片、圖表能力融合在一起,讓體驗更豐富。
第四階段是一個通用Agent,具備高度的自主性和適應性,能夠根據需求自動調整任務流程,甚至猜到你下一步需要什么,真正成為一個通用的智能助手。
這,就是大模型要做的事情。它們如何進階,就看每個企業對它們的核心價值怎么定義了。
03
接下來,談談第三種,這個看法受Flowith啟發。
Flowith是一個畫布式創作平臺,用起來很直觀,像在白板上寫字一樣。
你可以在上面創建很多節點,每個節點代表一個問題或主題,還能把它們連起來,形成一張思維網絡,這種設計讓我們可以同時處理多個任務。
Flowith 2.0版本把AI創作、知識管理和服務都整合在一起,它還有很多實用功能,比如:生成思維導圖,還能調用Midjourney,支持GPT-4、Claude-3等AI模型。
Flowith還有個“智能體市場”,你可以分享自己設計的AI工作流程,別人也能用,這樣大家能互相學習和進步。
我講這么多,到底想表達什么呢?
這類產品會從一個很簡單的入口開始。然后,根據創始人對AI產品的理解,會逐漸發展成一個完整的任務流或工作流。
在這個工作流上,我們可以做任何自己想做的事情。最后,對話框會變成一個通用的智能助手。也就是說,你只要提出一個問題,它就能幫你打通所有環節,完成任務。
第四個看法來自于:Taskade AI Agents。
通俗地說,Taskade AI Agents是一個項目管理中的智能助手團隊,它們用AI驅動,自動完成一些重復或繁瑣的工作,讓你在團隊協作和項目管理上省心省力。
你現在要計劃一個公司年會。得寫宣傳文案、整理預算數據、分配任務給同事,還要盯著進度。全靠自己做,要忙暈。
Taskade AI Agents 像請來的虛擬助手,你說“寫一段年會邀請文案”,它馬上生成一段給你改改就能用;把雜亂的預算表格丟給它,它就整理得整整齊齊。
告訴它“把場地布置任務分給小李”,它自動分配,還能提醒截止時間。你問“年會還缺啥準備”,它還能根據情況給你建議。你就像跟一個聰明的小秘書在聊天一樣,而且,你還能“訓練”它,讓它更懂你,干活更貼心。
所以,你在這個平臺建立任務的那一刻,Taskade AI Agents會立刻幫你想出一些點子,把它做成任務、拆成具體步驟。
這有點像 Notion,但又不一樣,區別在于:
Notion像一個靈活筆記本,得自己搭建結構和輸入內容;而 Taskade AI Agents 是“活的”,它會主動幫你生成內容、分任務、預測下一步。
還有Taskade更偏向團隊協作和項目管理,AI 助手直接嵌在里面;而 Notion 更像全能工具,適合個人筆記、數據庫,但自動化沒那么強。
不管怎么說,它像一個通用Agent,從建立任務那一刻起就全程陪著你,一直到任務結束,幫你把每一步都安排得妥妥當當。
04
第五種通用Agent 產品形態是:Zapier AI Agents。
它是做什么的呢?
你隨便說一句:幫我把新客戶名單整理好,發郵件跟進,它就能立刻從你的表單里挑出名單、寫好郵件并發出去。
這種體驗特別絲滑,主要體現在它的聊天框上,跟我們平時用 Kimi或豆包聊天的感覺差不多,但它有個特別的地方:
我說一句話,它不光是回復,是直接變成行動;它能在超過 7,000個應用中都能用,自動處理各種繁瑣的業務任務,只要動動嘴就能搞定。
和Taskade AI Agents比起來,區別很明顯。
Taskade的AI助手像專心在自家項目管理平臺里干活的,而Zapier AI Agents是個跨平臺的“萬能助手”,擅長把分散在不同應用里的工作串起來自動化。
簡單說,從下命令那一刻起,就像個不知疲倦的助手,把任務從頭管到尾。
它的客戶群也挺廣,官方提到有超過5萬家企業通過AI功能改變了工作方式。在應用場景上,它覆蓋創業者、中大型團隊、營銷和電商從業者等各種類型。
最后提到的一種新形態,是我今年2月份在騰訊報告中看到的。報告的名字叫《DataLab:A Unified Platform for LLM-Powered Business Intelligence》。
它主要講了什么呢?
DataLab是一個利用人工智能技術的智能平臺,它能夠整合企業中各種復雜的數據處理和分析任務。數據專家們可以通過簡單的對話,告訴平臺需求,然后會自動生成所需的內容和圖表。
簡單來說,DataLab是一個非常智能的工具,它能夠讓數據處理工作變得簡單而高效。
我看完報告,理解的是:DataLab目標構建一個大型的LLM(大型語言模型)平臺,并整合多個智能體。智能體各有專長,比如有擅長編寫SQL語句,有擅長生成圖表,還有擅長數據分析。
最終,你只要對著一個Chatbot(聊天機器人)提問,比如:“給我展示今年銷售額最高的產品的柱狀圖。”平臺就會立即調動資源,給你生成所需的圖標。
總的來看,我認為,Agent即將進入一個新的發展階段。
一些代理會采用自上而下的方式運作,它們從項目、任務開始,利用一個聊天機器人(chatbot)將多個智能體連接起來,讓用戶在一個平臺上使用自己的產品。
要么把Agent變成一個AI助理,用戶可以將各種任務交給它,讓它來管理和執行;還有采取自下而上的方法,即從簡單搜索、記錄小習慣開始,逐步構建起一個完整的自動化系統。
說白了,以前一個大模型對話框不夠用了,現在要用一個對話框,調動多種工具,并解決復雜的任務。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.