瀏覽器賽道迅速擠滿了明星創(chuàng)業(yè)公司和大廠巨頭。
文|張勇毅 Nico
編|Nico
文章來源|極客公園(ID:geekpark)
The Browser Company 是一家明星且特別的公司。
它創(chuàng)辦于 2019 年,base 在紐約,累計融資 1.28 億美元,估值超過 5.5 億美元。
核心產品 Arc 瀏覽器,以顛覆性的產品體驗吸引了上百萬高粘性用戶,在硅谷極客們眼中,Arc 是過去五年最酷的瀏覽器產品,有著遠超 Chrome 等傳統(tǒng)瀏覽器的產品設計。
但在 2024 年春天完成了 5000 萬美元融資之后,他們悄悄做出了一個決定——將團隊重心轉向新產品「全新設計的 AI 瀏覽器」的研發(fā),原產品 Arc 僅保持維護,用戶期待的 Arc 2.0 也許再也不會有了。
半年后,新產品 Dia 瀏覽器官宣。創(chuàng)始人 Josh Miller 說,他們對這個 demo 中的新產品,有數(shù)不清的 good idea。
現(xiàn)在, Dia 終于開啟了邀請碼公測。
為 AI 重新設計瀏覽器
這支產品創(chuàng)新能力很強的團隊,一開始就目標明確:從頭開始,打造一款原生AI瀏覽器。
為了做到這一點,開發(fā)團隊認為必須「推翻重來」;即使他們傾注數(shù)年心血的 Arc 瀏覽器已經初步形成規(guī)模效應。開發(fā)團隊從未公布過 Arc 瀏覽器的用戶總量,但僅 Windows 版本上線首月就吸引了 20 萬用戶,iOS 端 App Arc Search 上線之后用時三個月日活躍用戶數(shù)量就突破了 10 萬。
雖然 Arc 瀏覽器堪稱「古典瀏覽器時代」的最高潮,但它無力對 AI Agent 對瀏覽器帶來的這場革命產生關鍵影響;開發(fā)團隊也曾試圖在 Arc 瀏覽器中整合一部分 AI 功能,但仍然無力改變 Arc 瀏覽器本身并不是為 AI 而生這一事實。
Dia 官網(wǎng)上的一條信息寫道:Dia 并非僅僅是在現(xiàn)有瀏覽器上添加AI功能,而是將 AI 作為核心構建理念,旨在打造一個全新的、由 AI 驅動的瀏覽環(huán)境。
開發(fā)團隊認為,AI不應該只是一個應用或一個按鈕,而應該成為瀏覽器底層的能力。
Dia 作為從一開始就「深度整合 AI 能力進入瀏覽器中」的產品,實際體驗能帶來哪些改變?
極簡但優(yōu)雅的產品體驗
表面上,Dia 瀏覽器是一款同時集成了 GPT-4o 與 Gemini Flash 2.0 的多模態(tài) AI 瀏覽器,支持個性化對話、視頻分析與多任務處理,并且免費、無使用限制。
但如果你已經或曾經是 Arc 瀏覽器的用戶,在打開 Dia 的首頁,你就能通過 Dia 首頁,意識到兩款瀏覽器產品迥然不同的開發(fā)邏輯,即從「復雜極客工具」到「極簡AI入口」的產品邏輯巨大變化。
作為開發(fā)團隊對「AI 瀏覽器應該是什么樣」的一個實現(xiàn)方式,Dia 在首頁的一個角落加入了「Personalize Dia」功能,你可以通過輸入包括「你崇拜誰?」「你喜歡怎樣的學習方式?」以及「Dia 的回答風格」三個角度,來幫助 Dia 快速理解用戶本身,將 AI 快速設定為用戶更熟悉的一個形態(tài)。
無論是 Steve Jobs 的創(chuàng)新精神,還是《The Atlantic》、《NYT》、《New Yorker》等媒體的視角,用戶的選擇都將潛移默化地影響 Dia 的知識結構搭建與思考方式,使其在某種程度上成為用戶所崇拜對象的「投影」。
在 AI 融入瀏覽器的浪潮中,Dia 團隊并非簡單地將 AI 生硬地塞入既有的框架,而是試圖從用戶與 AI 的交互入手,構想「AI 瀏覽器」的個性化定制方案。
更進一步,Dia 提供了多達 20 檔的「Dia 的回答風格」強度調節(jié)。這就像早期的操作系統(tǒng)允許用戶調整字體大小和界面主題一樣,Dia 讓用戶能夠精細地控制 AI 的表達方式和情感色彩。默認的中間檔位提供了一個平衡點,而用戶可以根據(jù)自己的喜好,微調 Dia 的「個性」。
簡單設置好 Dia 的風格后,你能感受到開發(fā)團隊在「讓 AI 能說人話」這件事上,一定下足了功夫?!甘娣故亲顪蚀_的描述。
對于經常使用瀏覽器打開眾多窗口、處理復雜工作的用戶,Dia 瀏覽器的 @Tabs 中包括網(wǎng)頁內容分析、自動推薦提示詞等功能,確實能有效幫助用戶理清思路、用最簡單的方式梳理復雜內容的結構脈絡。
在此前開發(fā)團隊的早期演示中,Dia 還能幫助用戶完成更加復雜的任務,例如自動將郵件中的商品添加到亞馬遜購物車中 —— 彼時 AI Agent 概念還沒有興起。而在現(xiàn)階段版本的體驗中 Dia 對網(wǎng)頁讀取的顆粒度非常細致,但同時也更加強調借助 AI 能力,大幅簡化用戶界面和操作流程,通過設計上的「克制」來獲取更加高效的使用體驗。
Dia 的預示著未來的 AI 瀏覽器,將不再是冰冷的工具,而是能夠理解用戶、貼近用戶,甚至在某種程度上成為用戶在數(shù)字世界中的延伸。
這與 Manus 團隊為 AI 單獨打造瀏覽器的思路異曲同工,都指向一個核心目標:讓 AI 更好地服務于人類,同時以更自然、更個性化的方式融入我們的數(shù)字生活。
與 Manus 不同的產品哲學
對于原生 AI 應用來講,瀏覽器作為平臺讓模型能力可以更深入地理解用戶的瀏覽習慣和上下文,從而提供更個性化和高效的服務。快速地將 AI Agent 概念中的產品交付給用戶,因此今年的情況,實際已經變成了「優(yōu)秀的 AI 應用開發(fā)者,會打造自己的瀏覽器」。
即使過去三十年互聯(lián)網(wǎng)領域已經發(fā)生了數(shù)次重大的技術變遷,但瀏覽器仍然是構成當代互聯(lián)網(wǎng)最前沿用戶體驗的重要部分。但這也讓瀏覽器市場變得「極端保守」。
或許會有一些極客用戶,會為了屏蔽廣告等功能去嘗鮮一款新瀏覽器工具,但絕大部分用戶并不會為了一點新鮮感,放棄自己原本已經熟悉的體驗 —— 這才是讓 Chrome 過去十余年一家獨大的根本原因。
如果說 Dia 瀏覽器現(xiàn)階段哪一點最讓人印象深刻,或許仍然是「新鮮感」。但它的新鮮感與充滿「極客工具箱」屬性的 Arc 又有著明顯不同,Dia 瀏覽器更像是開發(fā)團隊打造的一片「適合 AI 應用生長的土壤」。
這個思路與此前打造出 Manus AI 的 Monica.im 團隊異曲同工:在開發(fā) Manus 的過程中,Monica.im 曾經一度想打造一款 AI 瀏覽器,但他們很快遇到了一個問題:AI 和人類共用一個瀏覽器界面,體驗極差。
最終 Monica.im 的解決方案是:為 AI 單獨打造一款瀏覽器,讓人與 AI 交互,AI 操作瀏覽器完成執(zhí)行命令。作為基于瀏覽器的 Agent 而存在,它需要用戶在「想用 AI」 的時候使用。
針對同一個問題,在瀏覽器交互上有著極強創(chuàng)新能力的 Dia 團隊,給出的答案是:在 AI 能夠更好地融入瀏覽器之后,重新設計瀏覽器的交互邏輯。
雖然 The Browser Company 聲稱自己「不做 App」,但瀏覽器本質上仍然是一個巨型 App。除了 Dia 這樣的挑戰(zhàn)者,包括谷歌、Opera 等在上一個時代掌握瀏覽器入口的選手,也在主動擁抱 AI Agent 給瀏覽器帶來的轉型機會。
在當前 AI 應用發(fā)展處于早期,并未提供手機系統(tǒng)級別的生態(tài)入場機會的前提下,無論是 The Browser Company 還是 Perplexity 的 Comet,都選擇了瀏覽器作為布局 LLM 深度交互生態(tài)的「船票」。
由于瀏覽器這個形態(tài)的產品自承接端側用戶信息以及互聯(lián)網(wǎng)入口的屬性,因此一些硬件/手機 OS 廠商,都又在這個領域嘗試突破,落地一部分 AI Agent 的能力,因此這個賽道會迅速變得「百花齊放」,也會是 AI Agent 短期內最讓人興奮的突破口之一。
問題實際上變成了:對于創(chuàng)業(yè)公司來講,AI 瀏覽器是否已經是現(xiàn)有生態(tài)下的 AI App 終點?
創(chuàng)業(yè)公司和大廠都在做瀏覽器
回到一個根源的問題,「瀏覽器」是什么?
它是互聯(lián)網(wǎng)歷史的第一個「入口」。PC 互聯(lián)網(wǎng)的最初期,以網(wǎng)景、Mosaic 為代表的圖形界面瀏覽器改變了用戶訪問互聯(lián)網(wǎng)的方式,微軟 IE 瀏覽器更是因為反壟斷案改變了科技競爭格局。
隨后,Office、Adobe 等桌面軟件一度興起,占據(jù)大量市場份額,但 Web 端依然出現(xiàn)了 G-Suite 和 Canva、Figma、Notion 等新銳產品,隨著 SaaS 模式在全球市場的成功,最終網(wǎng)頁應用和移動 App 成為了開發(fā)者 top 2 的選擇。
至少在桌面平臺上,瀏覽器是聚攏價值的金山。用戶瀏覽信息(新聞、博客、流媒體),執(zhí)行操作(郵件、創(chuàng)作、視頻會議),所有這些,在大模型時代,我們稱之為 context(上下文)。
這意味著,AI 有極大的發(fā)揮空間,以及被 augmented 的機會。
如果你關注過去數(shù)月關于 Agentic AI 的討論,你會發(fā)現(xiàn) browser 瀏覽器作為產品形態(tài),頻繁地被討論和使用。
Manus 內置了瀏覽器,Opera 發(fā)布 AI 助手 Aria,Perplexity 和 OpenAI 都在做瀏覽器產品,當然還有 The Browser Company 的新產品 Dia。
一些原本定義并非瀏覽器的產品,也選擇了瀏覽器的形態(tài)。比如豆包,它的桌面端基于 Chromium 開發(fā)。另一家大廠也有類似形態(tài)的產品——夸克的桌面端。這兩家大廠的產品,功能極其全面,且用戶量遠遠領先創(chuàng)業(yè)團隊的新產品,最重要的,它們都是各自集團 AI to C 的重點發(fā)力產品。
豆包希望成為你的默認瀏覽器
還有 Claude 的桌面端應用,基于 Electron 框架的 PWA 應用——還是 Chromium。(當然 Claude 大概率是個暫時性的產品,他們應該沒準備一輩子用這個形態(tài)。)
部分 AI 瀏覽器或基于瀏覽器的 AI 產品
還有很多廠商在琢磨怎么讓 AI 能夠更好地「使用瀏覽器」,比如剛剛完成融資的 browser-use,以及 Amazon 剛剛發(fā)布的 Nova Act SDK,這些項目更多在框架層,為開發(fā)者提供調取瀏覽器的服務。
從 AI 接入方式的層面上,AI 瀏覽器產品大多可以分為三類:
傳統(tǒng)瀏覽器 + AI,通常以 copilot 的形式存在,最早有 Mircosoft Edge,以及 Chrome 上包括 Monica.im 在內的各種瀏覽器插件。
讓 AI built-in 瀏覽器的更底層,有更多權限。比如 Arc Max 能夠整理 tab,Opera Aria 能夠像 Manus 一樣執(zhí)行操作,Dia 未來能夠擁有記憶,知道用戶拿瀏覽器做過什么。豆包和夸克的桌面端產品,看起來「上網(wǎng)」不再是最核心的 feature——就像打電話之于智能手機。OpenAI 和 Perplexity 正在研發(fā)的產品,大概率也在這個范疇內。
打造一款給 AI 用的瀏覽器。這是 Manus 主要的產品哲學,他們讓用戶與 AI 交互,AI 去操作跑在虛擬機上的瀏覽器,是個更加終局的解決方案。
功能性的 roadmap 是明確且共識的:
最開始,AI 處理一個信息單元,讀取單個網(wǎng)頁,閱讀文字,抽取 YouTube 字幕,或者理解用戶當前所處的網(wǎng)頁環(huán)境;
然后,context 延展,AI 能夠理解更多的信息,比如其他已經打開的 Tab,甚至能夠記住用戶過去打開的網(wǎng)頁、執(zhí)行的操作;
最終,AI 必然會代替用戶執(zhí)行操作,比如挑選商品、發(fā)送郵件、寫文檔、做設計,所有用戶在瀏覽器內能做的事,AI 都可以執(zhí)行。
這是一個非常清晰的,能夠顛覆過去瀏覽器體驗的機會。
只是我們還不知道,這個機會屬于拿到 5000 萬美元融資的 The Browser Company,還是傳統(tǒng)巨頭 Chrome 和 Edge,又或者,下一個像 Manus 一樣的創(chuàng)業(yè)新秀會橫空出世,將想象中的用戶體驗變成現(xiàn)實。
媒介合作聯(lián)系微信號|ciweimeijiejun
如需和我們交流可后臺回復“進群”加社群
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.