文:王智遠 | ID:Z201440
豆包正在猛攻智能體生態位。為什么這么說呢?
事情是這樣:
早上,客戶和我視頻會議,豆包電腦端,突然彈出一個窗口,問我:要不要讓它幫我讀取會議內容,順便整理成會議紀要?
我覺得挺新鮮,試了一下。不到兩分鐘,內容整理好了:結構清晰、沒有錯別字,速度特別快。這讓我對豆包的能力刮目相看。
01
說到智能體,大家可能聽過不少解釋,但想真正理解透徹它,得先說說Chatbot。
市面上Chatbot大致分兩類:一類是手機端交互型。
比如Kimi、文小言、通義;它們最初主要用于搜索和聊天,后來還加入了打電話功能。你可以把它們想象成手機里的“小秘書”,隨時隨地幫你處理事情。
另一類是PC端開源APP型,比如Monica。
這類Chatbot更像“多功能工具箱”,接口靈活,能接入各種API,實現圖片生成、聊天甚至本地操作。它們適合有定制化需求的用戶,功能強大且擴展性強。
不過,智能體在Chatbot的基礎上做了升級,不僅集成了兩者的優點,還融入了更貼近人類交互的屬性。這句話可能有點抽象,舉個例子你就明白了。
很多公司,在做PC端搜索功能。一般的AI搜索流程是這樣的:先打開公司網站,再進入聊天頁面,在對話框里輸入問題,才能得到答案。
Kimi就是這種模式。
但豆包的PC端搜索簡潔得多,不用單獨打開APP,直接在瀏覽器上就能用;瀏覽器窗口可以隨意放置,我習慣放在屏幕右側,利用那一小塊區域輸入問題,馬上就能看到答案。
更貼心的是,答案里還會附帶相關鏈接,點擊能直接查閱。這種設計不僅操作簡單,還讓交互過程特別輕便,完全沒有繁瑣的感覺。
除了AI搜索,打電話也很實用。
最初,各大廠推出語音功能時,我還在想:打電話這個場景,在工作中到底什么時候會用到?畢竟刷短視頻都忙不過來,誰有空天天跟硅基生命聊天?
但豆包的交互改變了我的看法。
比如,像我們這種天天碼字的人,有時真不想動手,或者遇到復雜情況時,打字打到一半,思路可能就斷了。這種情況下,我直接在PC端「打電話」給豆包,問題就解決了。
我把所有想法一股腦說出來,趁著思路還沒斷時講清楚,它馬上就能理解,并迅速給出答案;這種方式不僅節省時間,還避免了因忘記思路導致的效率低下。
還有一個功能我經常用:讀網頁。
有些網站、公眾號的文章太長了,實在沒精力看完。雖然有些平臺會提供總結,但總結往往不夠全面,容易漏掉關鍵內容,因為它的結構化,并不能滿足每個人的需要。
這時,我會直接把鏈接發給豆包,再加一些提示詞,告訴它我想要的重點是什么。豆包理解力很強,能快速給出我想要的答案。
02
云盤很符合工作流程,也可以叫:臨時處理邏輯。
現在好多公司都在做知識庫,把它當個存儲空間,能放鏈接、文檔,還能搜索。但說實話,這種方式讓工作流程變得越來越復雜。
豆包的收藏功能就不同。我有時候突然有了想法,或者讓他幫忙查資料,但沒時間馬上整理,中間的流程就很麻煩。不過,在豆包中,我只要點擊聊天記錄,就能把內容存到收藏夾里。
然后,等不忙的時再打開,能直接定位到對話的關鍵環節,甚至還能讓豆包基于之前的對話做二次優化。
這個獨立空間里,還能做更多操作。比如,篩選對話內容、視頻、播客、PDF文件,甚至是多輪對話記錄等等。它完全避免了繁瑣的中間步驟,真正做到了“為我所用”。
豆包的學術搜索能幫我快速拓寬知識面,尤其是在AI行業。
這個領域變化太快了,新技術、新概念層出不窮。比如,OpenAI發布了新東西,或者馬斯克又對AI提出了新想法,這些我都會特別關注。
但問題來了,新東西里有很多專業術語,看得人一頭霧水。比如,MOE架構是什么?多模態融合網絡又是干啥的?普通搜索引擎要么解釋得太簡單,要么找不到重點,很難滿足需求。
這時,豆包就派上用場了。
只要把不懂的詞輸進去,它就能把復雜概念講得清清楚楚,還會提供最新的研究材料,如此一來,不僅幫我理解了概念,還梳理了背景和由來,非常實用。
我之前一直在想,圖片生成技術到底能用在哪些地方呢?很多朋友可能知道,我以前在公眾號上經常分享“小綠書”,那些封面就是用圖片生成工具做的。
最早時,我用的「即夢」。后來我發現,網頁版用起來太卡,體驗不太好,于是轉而使用豆包了,雖然你們都是字節的產品,但是得吐槽。
現在我只要給它一個簡單的指令,甚至懶得想指令時,直接讓它幫我寫提示詞;接著,把提示詞發給豆包圖像生成功能,就能生成一張圖片,整個過程非常順暢。
豆包的優勢還不止于此。
如果生成的圖片有些地方不太滿意,比如某個局部不夠理想,還可以進行重繪、擦除或者擴圖等調整,功能非常強大。此外,豆包里還有一些現成的模板可以參考。
除了做封面,豆包還能應用在很多產品場景中,類似于生成咖啡封面、沐浴露的產品場景圖,效果看起來特別逼真。偶爾某些細節不符合實際需求,但從創意的角度來看,還是挺有意思的。
對于像 UI 設計師、新媒體運營這樣的職業來說,如果工作中要作圖但又找不到合適的工具,完全可以試試。它的風格有很多,電影風、寫真風、3D 動漫風等,選擇非常豐富。
03
除文成圖,我還在用好多別的功能,比如:改寫小紅書文案。
我公眾號的文章,一般都挺長。但有時候,我想把精華部分挑出來,發到小紅書上;要是手動一段一段去改,那可太費時間,還特別麻煩。
所以,我就直接用專門改寫小紅書文案的功能。
我只要把文章分成幾段輸進去,再給它一些簡單的提示。比如,不要加表情包,讓內容更有條理,“提煉重點信息”,或者“語言正式一點”。它就能很快把修改好的內容弄出來。
雖然生成的內容偶爾會有點AI感覺,但這完全沒關系。只要稍微調整一下,很快就能得到滿意的結果。
寫到這里,你可能也看出來了,豆包是不是一個智能體?我覺得是。
它和其他產品一樣,整合了AI搜索、云盤、圖像生成、AI總結等功能。但問題是,為什么豆包能吸引這么多用戶?
根據豆包APP的數據,截至2024年11月底,累計用戶規模已經超過1.6億;到今年1月19日,月活躍用戶達到了5600萬左右。
如果用兩個詞總結它的成功秘訣,那就是「體驗」和「交互設計」。
傳統C端產品的交互方式,比如按鈕、菜單等,操作流程固定,按設定好的步驟完成任務即可。
但很多聲稱要做C端市場的產品,包括一些我用過的工具,比如Kimi,仍然帶著傳統產品經理的思維在做;網頁版和APP用起來特別難用,前面拼命獲客,后面卻不重視留存,結果還是沒什么用。
前段時間我還吐槽過通義。作為一個手機端智能助手,主界面放什么日歷、非核心功能,明顯沒有抓住用戶的真正需求。
AI產品的交互完全不同,要重新思考人與人之間的交流方式。人與人交流是什么樣?很簡單:我想要什么,就能解決什么。比如:
讓AI幫我寫一篇文案,只要簡單描述需求,就能快速生成符合我想法的內容;
結果不滿意,我可以隨時調整要求,就像朋友之間互相溝通、磨合一樣,不用過多贅述。
再比如,想讓它推薦一家適合聚餐的餐廳,只要告訴它預算、地點和口味偏好,就能給出精準建議,甚至還能附上理由,讓人覺得貼心又實用。
所以,AI交互的核心在于,不再冷冰冰地執行命令,而是能理解我的意圖,靈活應對我的需求,真正做到像人一樣為我服務。不是嗎?
04
前幾時間,字節跳動CEO梁汝波在2025年2月13日的全員會上提到,AI業務有三個重點目標:
一,追求「智能」上限,把智能作為核心目標推動技術創新;二,探索新交互方式,讓產品更便攜、更自然;三,加強規模效應,讓AI產品越多人用越好用。
我把這段話發到社群里,不少朋友覺得很有高度。但問題來了,什么是便攜?什么是自然?怎么理解“全新交互方式”呢?
我不是產品經理,我是用戶。作為一個普通用戶,我的看法是這樣的:
首先,在AI與人的交互場景下,我不喜歡「學習能力」這個詞。設計一個App或日常工具,又不是造宇宙飛船,沒必要讓用戶去「學習一下」,尤其是C端產品。
所以,我們可以把「學習能力」拆成兩個維度來看,即:學習成本和學習意愿 。
學習成本在產品設計中是個負面因素。一個好的產品設計,應該盡量避免讓用戶花時間去“學習”如何使用。這一點已經被很多成功案例驗證了。
比如:蘋果和Google的產品,它們通過直觀的操作邏輯和有意義的動效設計,給用戶提供線索,讓用戶一看就懂、一用就會。這就是,降低學習成本的經典方法。
即便是為飛行員,設計宇宙飛船的操作界面(不好意思,剛看完《星際穿越》……),我相信設計者也會盡量遵循「學習成本越低越好」的原則;復雜的功能可以通過優化設計變得更易上手,而不是讓用戶去適應復雜性。
學習意愿則是另一個維度。
用戶為什么會愿意去學習?因為他們有需求。比如,用戶想給家人買一張去新疆的機票,但訂票網站特別復雜,他們只能硬著頭皮摸索、嘗試。這是外在因素驅動的學習意愿。
還有內在因素,比如社交產品。用戶為了認識新朋友、和老朋友保持聯系、和家人分享生活,會主動去學習如何使用這些產品,甚至琢磨出一些“使用策略”。
所以,設計一個產品時,認真考慮學習成本和學習意愿是非常有價值的。
C端產品,尤其是面向大眾的產品,90%以上的用戶是小白。他們不是不聰明,也不是學不會,而是不屑于學,或者有太多選擇可以替代你的產品。
既然這樣,產品經理的目標是不是應該設計出最簡單、最適合他們的產品呢?
我的理解:是。
所以,不要搞什么與用戶操作相悖的地方了。也許,不要讓人覺得麻煩,也不要讓用戶覺得自己笨,才是重點。反正我使用AI產品,一根腦神經都不想動;要是你樂意,我只能說:哥、姐,你真是人形算力。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.