通用 Agent(智能體)的火爆,仍在繼續。
引爆這一領域的明星初創公司Manus AI,近期被曝出完成了新一輪7500萬美元融資,估值在短短不到2個月內,飆升至5億美元。
被Manus打開未來想象空間的通用 Agent市場,正在吸引一眾科技大廠的入局。最新加入進來的是百度。
近日,百度對外推出了類通用 Agent產品“心響”。百度之前,字節搶跑一眾國內科技大廠,率先上線了自家的Agent產品“扣子空間”。
相比傳統Agent產品,通用Agent本質區別在于其定位從“工具”向“伙伴”的角色轉變,能夠處理復雜、多步驟的任務場景。
背靠大廠已有的產品生態,字節和百度共同盯上了同一目標,即借 AI Agent尋找自家 AI 產品體系的新增長點:字節試圖將通用Agent概念嵌入工作流,尋找專業場景的落地應用;百度則想要在普通消費者中率先破局。
兩者都在嘗試打破各自內部的生態壁壘,構建更廣泛的AI Agent生態體系,將通用Agent概念徹底打入用戶的心智。
然而,受限于大模型技術的成熟度,包括字節、百度在內的所有參與者,都不得不在探索的路上,不斷地捫心自問:AI Agent的真正應用場景是什么?
01
追逐AI Agent的場景答案
在找尋差異化應用場景的道路上,字節與百度在這一問題上選擇了不同的路徑。
字節的扣子空間主要入口為網頁端,更易于接觸日常辦公場景下的軟件資源;百度的心響主要面向手機端,目前仍只支持安卓系統,意圖將自身產品打入用戶的日常場景體驗之中。
字節希望用 AI 深度嵌入工作流已成為業界共識??圩涌臻g“和Agent一起開始你的工作”這句宣傳語精準地貫穿了產品邏輯。
扣子空間的最大目標:生產力全面提升。其MCP擴展中,飛書云文檔、多維表格和電子表格尤為令人關注。如果能夠與飛書平臺進行高度整合的話,打通生態間壁壘,扣子空間將會成為企業效率的“智能中樞”。
我們讓扣子空間作為一位藝術類型公眾號撰稿者,搜集日本藝術家的文字與圖片信息,制作成一份文字與藝術作品圖片交叉的稿件。
在實際測試中,它對提示詞的遵循能力優異,能夠自動檢索網頁、制作可視化報告,流程流暢幾乎沒有卡頓,給出了一份完整的、規規矩矩的文字報告以及作品時間軸。
字節希望把Agent當作辦公過程中的“AI實習生”,主動幫助用戶處理文件檢索、表格制作、報告生成等任務。其背后的邏輯是:在企業私域內,聰明的AI輔助工具才更容易產生價值。
百度則選擇進一步降低使用門檻,從更廣泛的普通C端用戶切入,其產品心響專為移動端設計,在實際測試中的產品邏輯有些不同:“把難題留給心響,把時間留給生活。"
從功能模塊的設計來看,心響相對于字節的扣子空間一個最大的區別是“靈感廣場”模塊。在該模塊內,百度的產品設計者集成了大量的任務模版:晚安故事集、AI繪本、AI相親等等。
不過,百度的C端策略既聚焦于用戶習慣的培養,也有在一定程度上限制了產品的想象空間的嫌疑。技術上來看,心響給了外界一個明顯的感受:主模型的指令遵循能力似乎并不如字節扣子空間那樣精準,它的思維更加發散。
相比于扣子空間迅捷的內容生成速度,百度的心響在響應速度上顯得相對緩慢的多,生成過程耗時更長。
然而,與扣子空間嚴格遵循提示詞、輸出規整的報告不同,心響在生成結果時額外設計了交互元素和視覺優化,在輸出中融入更多細節和附加價值。
這樣的產品邏輯,非常適配于日常場景,因為用戶往往被認為在與AI的交互中,提示詞工程的經驗較弱,甚至很多時候自己都不清楚自己想要的是什么。
02
大廠摸著Manus過河
盡管產品體驗上仍有不完美之處,令字節、百度們爭搶推出相應Agent產品的的一大原因,則離不開其在商業變現上的天花板足夠高。
要知道,競爭打到現在,無論國外的OpenAI,還是國內的字節、百度,其在大模型上都處于虧錢投入階段。如何尋找到足夠強的付費變現模式,無疑是一眾大模型廠商的當務之急。
Manus成功拿下7500萬美元融資的現身說法,讓科技大廠看到了進軍Agent領域的一絲曙光。最近OpenAI的一份預期收入報告,則讓這絲曙光變得更明亮了些。
據The Information報道,OpenAI預測至2029年,AI Agent及其他新產品的銷售額將超越ChatGPT,推高總營收至 1250 億美元,2030年總營收有望達到1740億美元。Agent,正被視為繼對話式大模型產品之后的下一個大金礦。
而且,對于字節和百度這樣生態龐大的公司而言,在各自的生態體系下,借助需要外部MCP交互的Agent,還可以達到盤活現有產品矩陣的效果。
但是,MCP本身不足以實現“世界的互通互聯”。其需要大模型在多模態(尤其是推理能力)以及成本價格方面,給予支持。這能也反過來說明,為什么是此時此刻,字節和百度才有能力推出“扣子空間”和“心響”。
根據The Information報道,Manus僅僅在Claude大模型的調用上,兩周內就燒掉了超過百萬美元。AI Agent的基礎工作流中的必要部分——多步推理涉及多次模型調用,處理復雜任務時需結合文本、圖像等多模態數據,導致計算量激增,消耗大量GPU資源,說得直白點:AI智能體需要強算力資源、高多模態能力、強推理能力、低成本價格。
進入2025年,推理模型尤其是視覺推理領域的進步,使得Agent在實際產品中的部署變得技術上可行且經濟上可持續。字節與百度在多模態大模型領域的早期投入開始有了回報,AI Agent的基礎產品形態有了現實支撐。
近期,百度發布了文心4.5 Turbo及 X1 Turbo,強調推理性能與成本優化。代碼智能體文心快碼更是接入MCP,李彥宏本人直接提出“創新的核心在于成本下降”。
字節同樣在4月中旬更新了豆包1.5·深度思考模型,同樣主打一個多模態和性價比。據晚點LatePost報道,扣子空間對比了六款國內大模型,最終還是選用了自家的豆包作為基座模型技術支撐,原因是后者推理成本較低,大規模調用可行性高。
03
大廠尋找新“增長點”旅途坎坷
AI Agent概念雖然打得火熱,但其定義正被泛化、濫用。通用Agent的資本故事里每一個字都異常美妙,市場潛力巨大,其仍然面臨多重技術挑戰,包括高任務失敗率、上下文理解不足、數據安全風險及潛在的偏見放大問題。例如,無論是Manus、還是字節的扣子空間、百度的心響,這些產品在復雜任務中的可靠性仍說不上有多高。
從較短的時間尺度上來看,AI Agent在復雜任務中的表現仍難以配得上“通用”二字。但如果將目光放得更長遠,其作為大廠們AI產品體系的新增長點的潛力無法被忽視。
沒有大廠愿意冒著落后的風險,而不選擇跟進。這一點深刻地體現在了字節、百度這樣的中國科技大廠身上。根據晚點LatePost報道,Manus出圈前后,字節就搞了至少5個團隊在開發不同Agent產品;百度的心響則由一群95后組成的團隊,在30天內研發出來。
對大廠而言,技術優化迭代是必由之路,挖掘差異化的應用場景才是打開這條路的起始。誰能率先找到復雜用戶場景的解決方案,誰就能從這塊蛋糕里分走一部分。
這也意味著,字節和百度絕不會是這條賽道里的唯二玩家。國內方面,阿里和騰訊同樣虎視眈眈。國外,不光是率先確立了A2A協議的Google,MCP協議的Anthropic,OpenAI對Agent也下了重注。一個月前,The Information 報道稱,OpenAI已經在與投資者商議了三類未來的Agent產品的發布,價格從每月2000美元到20000美元不等。
可以想見的是,技術、資本、場景、標準正在AI Agent領域進行混合博弈,對于大廠們而言,這不僅僅是燒錢的開始,也是為產品體系找到全新商業引擎的起點。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.