就在前幾天,字節旗下的產品 扣子 Coze 也上線了自己的 Agent 產品,叫做Coze Space 扣子空間。花了幾天做測試,跟各位分享下體感。
我們又多了一個實習生
從使用體感來說, Coze Space 的使用方式和基礎交互,跟別的 Agent 是差別不大的。
從細節來說,有這么幾點差異。
第一,雙模式。
Coze Space 可以選擇使用兩種模式。分別是探索模式和規劃模式。
簡單的理解是,探索模式是一站式幫你把任務搞定。而規劃模式則要有中間步驟,你可以修改工作的內容,防止中間就跑偏了,浪費資源。
比如在這個工作流出現的時候,會讓用戶確認一步。
如果是規劃模式,執行中間,Agent 也會反復確認,以便繼續進行:
第二,插件能力。
Coze 扣子并不是字節新出的產品,扣子宇宙里,之前就有開發平臺、羅盤和 Eino 框架。所以在這些積累之上,有一些 Agent 原本的能力,尤其是插件能力。
目前可添加的擴展包括高德地圖、飛書生態、天氣、圖像、語音、文檔等等。
這樣用戶可以自行選擇使用的擴展插件,能力也就有增強了。
比如,可以調用高德地圖的 API,就能得到地點的準確信息:
又或者直接生成一段短播客:
相較于單純的打開瀏覽器獲取信息,插件的能力會更加精確、成本更低。只是現在的插件還不算多,但也看到了未來的機會。
具體效果,后面會聊。
我讓 扣子空間 完成了 9 個任務。給每個任務做出了個人很主觀的評分。可以先說一下總分:
接下來是詳細的任務情況。其中的鏈接有全部的過程回放,各位都可以復制粘貼到瀏覽器自行查看。以證明內容均是可靠真實的。
任務 1:
「設計一個網頁,可以從調色盤上選擇 4 種顏色,用戶選擇完之后,可以自動生成一張以 4 種顏色為主色調的圖片」
這是我自己的一個痛點,用幾個顏色生成一張壁紙。
Agent 不僅理解了我的意思,還非常體貼地給出了很多自定義的部分,還有預覽圖。每次生成也都是隨機的。
再欣賞幾個:
效果十分驚艷,是我試過的任務中最滿意的。給出唯一一個滿分 10 分。
大家也可以從鏈接試一下:reurl.cc/yRL31q
評分 :10/10
對話回放地址:space.coze.cn/s/JEIKYQAPeVI
任務 2:
「用高德地圖來幫我規劃一個去青海大環線的自駕游,完成一個網頁,配備豐富的景點圖片。」
這次的完成度挺高的,調用高德接口的威力就顯現出來了。另外首頁上的行程圖是自己生成的,根據我說的出發地來設計的,這有點意外。
已經能到達可用的地步,同時美觀度有相當的加分。
評分:8/10
網站地址:reurl.cc/gRGqqQ
對話回放鏈接:space.coze.cn/s/oDkZemIjWM8
任務 3:
「幫我生成一期 10 分鐘的播客,講述今天的美股要聞,并且模擬兩個人的聲音對話,有一些觀點對立」
這屬于擴展插件的簡單體驗。
可以直接生成一段內容。美股的信息總結得還可以,聽感也還行,多數語句能夠以假亂真。只是本來要求的對話,實現得不太好,還是一個人在念稿子。
另外,其它試用音頻的操作都不是很成功,看來調用插件還不穩定。
評分:7/10
對話回放地址:space.coze.cn/s/0tgECMGcdE4
任務 4:
「制作一份詳盡的、可讀性強的中文互聯網的播客行研報告,以 PPT 形式展示。」
怎么說呢。依賴于獨立生成的排版和圖片,PPT 的效果乍一看還行,但是內容有點拉胯,不太可用。要用的話,只能說提供了一個模板吧。
評分:5/10
對話回放地址:space.coze.cn/s/1oStTC8nfEk
任務 5 :
「我是半拿鐵的主播劉飛,我要做一期播客的逐字稿,主題是博世的歷史故事,幫助我整理一份詳盡的稿件,我來做錄制。」
這個不算是現在 Agent 的長項。在用過幾個 Deep Research 之后,深刻體會到 AI 協助做復雜信息的處理的快樂。
而 Agent 的最大優勢還是在完成一些單純信息處理之外的工作。
評分:4/10
對話回放地址:space.coze.cn/s/RXpjjSqGsnY
任務 6:
「完成一個 2048 游戲,游戲里的美術設計都使用合乎邏輯的海賊王角色和海賊王的元素。」
這個效果也很意外,完全按照要求完成了。并且能玩。大家可以體驗一下也。
一句話就能做個小游戲,時代真的變了...
哦有個小問題,烏索普用的頭像是錯的,用成了路飛。扣分。
評分:9/10
玩游戲的地址:reurl.cc/RYqZj6
對話回放地址:space.coze.cn/s/PlWwe7F-XE0
任務 7:
「設計一個包含了 10 個題目的心理測試程序,測試結果為海賊王里的幾個性格鮮明的特定角色,看用戶跟哪個角色的性格最接近。題目是單選題,角色也由你來制定。網頁里要設計優良,最后的角色有頭像。評測結束頁面,要有語音介紹一下,用戶的性格特色」
也是一句話生成的游戲,完成度也可以。尤其最后結果頁面的效果,是真的不錯。
本來想測試擴展插件里的音頻生成,發現調用效果有問題,不出聲音。
評分:8/10
測試網站地址:reurl.cc/pa3kGZ
對話回放地址:space.coze.cn/s/k1Xrr6rqG90
任務 8:
「根據飛書文檔里我的文章的風格,幫我寫一篇在 2000 字左右的公眾號文章,并且起一個有意思的標題」
可以看得出來,內容的處理上比較規規矩矩。扣子空間的優勢在于,視覺的呈現效果好了不少。其中的格式排版,以及那些小圖標,都做得不錯。
評分:5/10
對話回放地址:space.coze.cn/s/Wp3B7yTV23E
任務 9:
「我是產品經理和播客主播劉飛,幫我制作一個內容豐富的個人主頁。」
跟前面的播客報告一樣,亮點是做的排版,結構,還有「自作主張」的配圖和表格。但問題也類似,內容只是盲目填充,缺乏一定的邏輯。
評分:5/10
對話回放地址:space.coze.cn/s/XkTYbiKa-XI
最后,再說幾句。
由于有新的擴展,這次的可玩性又有了進一步的提升。像生成壁紙那種小工具,效果驚艷。我們都可以用簡便的方法去完成一個小工具、小游戲,甚至不需要看到代碼頁面。
從穩定性而言,作為字節大廠出品,能明顯感覺到不會輕易崩掉。不過,Agent 的普遍問題依然存在,即輸出的效果不夠穩定,也會存在各種幻覺,結果里邏輯性欠佳。
樂觀的方面在于,扣子空間的使用場景再次拓展了。大廠入局,也是一個里程碑。大家可以用更強的算力、更低的成本去體驗 Agent 的場景。用戶提供的真實 case 本身也是一種當下快速創新階段的競爭力。
這么看,我們離賈維斯,也越來越近了。
對了,手頭還有一些扣子空間的邀請碼。評論區留言,我會選出一些朋友送出。
題圖由 Midjourney 繪制。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.