一碼難求的 Manus,帶火了整個 agent 賽道。OpenAI 推出 agent 工具包,開源項目 OpenManus 復現(xiàn) Manus,同時,一些已經(jīng)面世的 agent 產(chǎn)品也擴大了知名度,其中就包括 Flowith。
Flowith 是一個畫布式 AI 創(chuàng)作平臺,2024 年初開始布局 agent 方向,2024 年 8 月正式上線了 agent 框架——Flowith Oracle,這比 OpenAI 的 o1 模型還要早。至今,Oracle 已經(jīng)解決了超過 2000 萬次復雜問題。
2024 年 8 月 8 日,F(xiàn)lowith 發(fā)布 Oracle 并獲得當日 Product Hunt 榜首
Oracle 好用嗎?和 Manus 有什么不同?agent 的理想形態(tài)可能是怎樣的?最近,APPSO 體驗了 Oracle,并專訪了 Flowith 團隊的拐子,有了一些新的發(fā)現(xiàn)。
解放雙手的 agent,仍然需要人類的參與
使用 Oracle 的方式很簡單,打開網(wǎng)頁 flowith.net,然后在對話框點亮「Oracle」模式,輸入你的問題。
如果需要深度的分析,建議使用高算力的Ultra模式
不少網(wǎng)友嘗試用 Oracle 復刻 Manus 的案例,而在我的體驗過程中,對于可視化、交互式的工作,Oracle 都能完成得比較好。
Oracle 生成,GPT 模型的演進路線圖
Oracle 生成,自言自語的貪吃蛇游戲
同時,Oracle 有個鮮明的特點,和其他 agent 都不太一樣:讓人類體會到,自己和 AI 在協(xié)作。
當我讓 Oracle 寫篇可以通過晉江簽約的小說,Oracle 先把完整的工作流搭建好了,分出了 13 個步驟,每個步驟包括多個子任務。
在 Oracle 執(zhí)行任務之前,我們可以選中文字修改步驟,點擊右邊的「垃圾桶」圖標刪除步驟,或者點擊左下角的「加號」添加新的步驟。確認無誤,Oracle 再開始干活。
Oracle 先對平臺和熱門作品進行市場調(diào)查,然后確定小說的核心定位、主要情節(jié)線和矛盾沖突,再開始寫大綱和章節(jié)。多線程畫布的形式,讓過程看起來條理分明。
雖然 Oracle 給出的大綱和正文,離真正的網(wǎng)文作者還是差點火候,但交付的過程和結(jié)果都很完整,尤其前期的調(diào)研工作做得很充分,確實把事情給做完了。
另一個有參與感的例子是,讓 Oracle 幫我生成一個網(wǎng)頁,參考史努比漫畫的風格,給不懂技術(shù)的小白講解什么是強化學習。
Oracle 覺得我的需求還不夠清晰,主動向我追問了一些細節(jié),我做了回復,明確只講獎勵機制,需要分章節(jié),必須有互動元素,其他讓它自己揣摩。
最終設計好的網(wǎng)頁確實非常適合不懂技術(shù)的讀者,各種靜態(tài)的圖示做得簡單易懂。
交互的方式也很有趣和直觀,比如,通過不同的方式教史努比找骨頭和彈鋼琴,對應了不同的獎勵機制。
甚至,我們還可以向 Oracle 上傳自己的內(nèi)容。直接讓 agent 生成一個網(wǎng)頁,結(jié)果可能是同質(zhì)化的、沒有個性的,這其中缺少的,是我們自己的資料。
但只要在提示詞里寫到一些個人化的請求,比如「按照我的年終總結(jié).....」,Oracle 就會設計一個步驟,讓我們上傳文檔。
除了設計好工作流后向用戶確認、信息不足時向用戶追問和請求文件,Oracle 還會在完成每個步驟之后,詢問用戶滿不滿意。
如果滿意,任務可以自動進行下去。如果不滿意,用戶可以修改步驟,重新運行。
如果給體驗做個小結(jié),可以說,大部分的工作確實由 Oracle 完成,但這并非意味著,我是被動的,恰恰相反,被解放了雙手的我,能夠更自由地指導 AI,體會到翻身當甲方的快樂。
傳統(tǒng)的 AI 交互,是由我們給出提示詞、AI 生成結(jié)果,人類是無情的任務發(fā)布和結(jié)果接收機器,我們的創(chuàng)造力發(fā)揮得有限,但像 Oracle 這種,AI 負責干活,人類負責督工和給出關鍵的 idea,實時參與、完善和優(yōu)化 AI 生成的工作流,結(jié)果更可能讓人滿意。
按 Flowith 市場營銷與商務拓展負責人拐子的話說,「人機結(jié)合」是 Flowith 的核心哲學,這并不意味著讓 AI 更像人,關鍵是找到人類和 AI 各自最擅長的協(xié)作方式,「不是 AI 取代人類,也不是人類限制 AI,而是兩個不同認知系統(tǒng)的深度融合與互補」。
交互獨特的 agent,讓 AI 不困在聊天框里
除了強調(diào)人的參與,畫布的交互形式,也是 Oracle 和其他 agent 不同的地方之一。
每當用戶輸入指令,Oracle 會根據(jù)其功能和可以使用的工具,分解出較小的子任務,然后這些子任務會被傳遞到任務分配器,從而逐步執(zhí)行。
Flowith Oracle 當前支持的部分外部工具
當這樣的工作過程被畫布所承載,我們便可以在畫布縱向和橫向展開的每張卡片里,看到子任務以及所調(diào)用的工具。
上下文無限延展,并行完成多個任務,拐子認為,這就是為什么,與線性的聊天框和打開網(wǎng)頁一個個查看的 agent 相比,畫布更加高效,「電腦是為人設計的,AI 完全不用被束縛住」。目前,Oracle 執(zhí)行一個任務,基本都控制在 10 分鐘內(nèi)。
而且,AI 執(zhí)行任務有出錯的可能性,但畫布的每個節(jié)點都可以控制,如果一個節(jié)點失敗,可以讓 AI 重新跑一次。能夠干預中間步驟,也是畫布形態(tài)的一個優(yōu)點。
學生、教師、自媒體等內(nèi)容創(chuàng)作者,構(gòu)成了 Flowith 的核心用戶社區(qū),拐子強調(diào),「這是一場雙向選擇」,F(xiàn)lowith 的愿景,就是打造一個為創(chuàng)作者而生的 AI 賦能工具。
不過,對于一些用戶來說,畫布的交互形式,可能意味著一定的使用門檻,特別是完成復雜任務的時候,流程和節(jié)點會呈現(xiàn)更多的信息量。拐子表示理解,但他也認為,畫布恰恰反映了人類思維的本質(zhì)——并非一條單一直線,而是多維度、多分支的發(fā)散過程。
雖然現(xiàn)階段 Oracle 執(zhí)行任務時已能并行搜索和處理多維度信息,本質(zhì)上仍是單一 agent 在進行思考和決策。這就像你有一個非常聰明的助手,但終究只有一個大腦在運轉(zhuǎn)。
但很快,我們就能看到 Flowith 的進化。拐子預告,即將推出真正的「多智能體協(xié)作」模式,用戶可以同時指揮多個專精不同領域的 AI 智能體,比如,一個負責研究,一個專注創(chuàng)意,一個擅長整合,彼此之間還能進行思想碰撞,「這不再是簡單的工具使用,而是一種全新的創(chuàng)作生態(tài)系統(tǒng)」。
畫布形式的另外一大優(yōu)勢在于,知識庫的構(gòu)建與激活。知識庫的意義不難理解,如果我們不告訴 AI 自己是誰,不向 AI 輸入我們個性化的知識,AI 輸出的往往是千人一面的通用信息,接入了知識庫后,AI 才能真正為我們所用。
2025 年 1 月,F(xiàn)lowith 正式發(fā)布 2.0 版本,其中一個核心升級便是「知識花園」功能,它比傳統(tǒng)的知識庫更靈活,可以將各類素材、靈感和資料,有機整合到一個或多個動態(tài)空間中,由 AI 進行智能管理和激活。
在這個基礎之上,F(xiàn)lowith 還構(gòu)建了知識市場生態(tài),訂閱者不僅能獲取知識庫內(nèi)的全部內(nèi)容,還能與 AI 進行沉浸式互動問答,在執(zhí)行特定任務時,系統(tǒng)會自動匹配并調(diào)用我們選擇的知識庫中最有價值的信息片段。
圖片來自:即刻@Bruce-拐子
目前,Oracle 還沒有和知識庫功能打通,但拐子透露,他們正在快速推進這項工作,「當 agent 與個人知識花園結(jié)合,它將不僅僅是執(zhí)行任務的工具,而是真正理解你思維模式、掌握你私有化信息的協(xié)作伙伴」。
和主打通用 agent 的 Manus 不同,Oracle 只是 Flowith 生態(tài)中的一個關鍵組件,F(xiàn)lowith 真正想打造的,是一個「終極形態(tài)的 AI 創(chuàng)作工具」,以二維畫布為交互基礎,同時集成 agent、知識花園以及多樣化的模型能力,構(gòu)建一個完整的思維創(chuàng)作空間。所以,拐子認為,Manus 與 Oracle 不存在直接的可比性,盡管它們都被稱為 agent。
用 agent 解決問題,關鍵在于交付有價值及品味的結(jié)果
Manus 火了以后,出現(xiàn)了一個很有意思的現(xiàn)象:很多用戶會嘗試用它直接生成視頻。這符合了人類指揮 AI 干活最好一步到位的微妙心理,但生成視頻的任務,并不適合由現(xiàn)在的 agent 完成,反而會浪費較多的算力。
目前,Oracle 暫未接入視頻生成工具,拐子解釋,這是從體驗決策的角度考慮的,視頻生成的成本高,體驗又沒法做到極致,「如果用戶付費卻只得到平庸結(jié)果,還不如引導他們使用專門的 AI 視頻工具」。
兜兜轉(zhuǎn)轉(zhuǎn),我們又回到了最基礎的問題上:用 agent 做什么?在產(chǎn)品調(diào)研時,拐子發(fā)現(xiàn)了一個很有意思的現(xiàn)象:很多用戶,包括他自己,一開始都并不知道,用 agent 解決什么實際的問題。
從拐子的經(jīng)驗來看,目前 Oracle 在深度調(diào)研類任務中表現(xiàn)尤為出色,能將復雜的調(diào)研成果轉(zhuǎn)化為交互式網(wǎng)頁等高價值媒介。
Flowith 社區(qū)里的一個例子,讓他印象特別深刻。一位用戶利用 Oracle,生成了一個完整的交互式網(wǎng)頁,集成了上汽的四個汽車品牌,包含時間線、技術(shù)分析等元素,不是簡單地羅列信息,而是將思維具象地呈現(xiàn),水準接近專業(yè)汽車品牌官網(wǎng)。
作為 Flowith 團隊核心成員和 Oracle 的深度用戶,拐子還親自進行了一系列和 agent 有關的創(chuàng)新實驗,其中最有意思的是,將 Oracle 納入個人內(nèi)容創(chuàng)作工作流,特別是小紅書運營。
從選題到發(fā)布的全流程,Oracle 都能提供系統(tǒng)性支持,自動拆解創(chuàng)作任務,智能推薦素材資源,提供深度修改建議,甚至生成精準引流話術(shù)。這套 AI 加持的創(chuàng)作流程,幫助拐子在短短一個月內(nèi)就漲了 5000 多名粉絲,AI 生成的內(nèi)容,在互動數(shù)據(jù)上也表現(xiàn)優(yōu)異。
拐子體會到,AI 已經(jīng)不只是一個簡單模仿的「內(nèi)容生成工具」,而是一個「創(chuàng)作伙伴」。當我們把自己的語言風格、思維模式輸入到知識庫中,讓 AI 學會用我們的口吻說話,AI 就能幫我們打造一個獨特且有吸引力的個人 IP。同時,人類的價值排序,可能會隨之變化,「如果大家都會使用 AI,那品味將是我們?nèi)祟愖詈蟮谋趬尽埂?/p>
從實驗延伸開去,未來,F(xiàn)lowith 計劃設計更多垂直化的「子 Oracle」,針對特定場景,提供深度優(yōu)化的 agent 能力。比如,專門用于小紅書經(jīng)營的 agent,可以幫助那些技術(shù)過硬但不擅長運營的獨立開發(fā)者,獲得更多的曝光和用戶支持。
Manus 的爆火,讓 agent 概念進入更廣泛的討論,同時也引發(fā)了更深層次的思考:agent 的理想形態(tài)究竟是什么?是模擬人類操作電腦、手機,還是與工具和數(shù)據(jù)直接交互,或是多種方式的有機結(jié)合?
拐子給出了自己的見解:「沒有所謂的終極答案,F(xiàn)lowith 提供的只是眾多可能性中的一種。但有一點是確定的:agent 的核心價值在于解決實際問題,交付有價值的結(jié)果。所謂有價值,不僅是功能上的實用,更是優(yōu)質(zhì)產(chǎn)品、思維模式與個人知識的融合,最終生成既滿足創(chuàng)作者,也打動用戶的方案。」
對于 agent 的邊界和可能性,拐子認為最重要的是用戶親自探索:「agent 到底能做什么,不能做什么,這些邊界需要在實際應用中不斷驗證。更關鍵的是,我們需要習慣這種全新的 AI 交互方式。誠然 AI 還有很長的路要走,但每一位用戶都可以隨著 AI 一起成長,共同探索可能的未知。 」
關注 APPSO 頭部新媒體,獲取最新 AI 資訊和工具
One More Thing
Flowith AI 聯(lián)合微博 AI 、小紅書科技薯、即刻平臺共同推出 2025 第一場 Agent 創(chuàng)作大賽,同時邀請 APPSO 等頭部 AI 科技媒體與博主作為評委嘉賓,結(jié)合大眾評選的方式,一起完成這次 Agent 創(chuàng)作盛事。
參賽平臺:https://agentga.me/
活動更多細節(jié),可以在本次推文次條查看,歡迎加入官方社區(qū)一起暢聊
我們正在招募伙伴
簡歷投遞郵箱
hr@ifanr.com
?? 郵件標題
「姓名+崗位名稱」(請隨簡歷附上項目/作品或相關鏈接)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.