新智元報道
編輯:犀牛
【新智元導讀】隨著AI智能體的爆發,Browser Use異軍突起,剛剛融資1700萬美元。它能讓AI智能體輕松地「讀懂」網站并自動完成復雜任務,引領了一波AI應用熱潮。
AI智能體可能還沒有一個大家都認可的定義,但這并不妨礙一大堆創業公司爭相打造智能體工具,來自動化處理各種任務。
其中一家名為Browser Use的公司尤其吸引開發者與投資人的關注,因為他們的工具能使智能體更容易地「讀懂」網站。
據最新報道,Browser Use剛融了一筆1700萬美元的種子輪資金,由Felicis的Astasia Myers領投,Paul Graham、A Capital和Nexus Venture Partners跟投。此次融資之前還沒被報道過。
網站地址:https://browser-use.com
Browser Use是Y Combinator 2025冬季班的一員,最近幾個月隨著智能體的爆火而名聲大噪。
尤其是火出圈的Manus也用了Browser Use工具,一下子就把它的知名度推到了新高。
Browser Use的創辦人是Magnus Müller和Gregor Zunic,他們去年通過蘇黎世聯邦理工學院的創業加速器創辦了這個項目。
Müller多年來一直在研究網頁抓取工具,2024年他在讀數據科學碩士時認識了Zunic。Müller說,他們倆一塊兒琢磨出了把網頁抓取和數據科學結合起來的想法,打算讓瀏覽器自己完成任務。
Müller和Zunic花了五周時間做出了個Browser Use的demo,結果一炮而紅。后來,他們干脆把Browser Use開源了。
簡單說,Browser Use是把網站上的按鈕和元素拆解成一種更容易理解、更像「文本」的格式給智能體用。
這能幫助AI智能體搞清楚網頁有哪些選項,然后自主做出決策。
「好多智能體靠的是視覺系統,通過截圖來瀏覽網站,但這過程中老出問題?!筂üller說,「我們把網站轉化成智能體可以理解的東西,這種方法能讓我們以更低的成本反復運行相同的任務?!?/p>
隨著越來越多的AI公司想讓他們的智能體跟網站交互得更順暢,Müller覺得Browser Use能成為滿足這些需求的「底層技術」。
他還表示,現在Y Combinator冬季班里有20多家公司都在用Browser Use滿足自己的需求。
有些公司還跑來問他們,怎樣才能使得智能體更容易地瀏覽自己的網站?
Müller說,「像LinkedIn這樣的網站,總是改變網站的功能,智能體在這種情況就經常出錯?!?/p>
Felicis的Myers說,他們過去幾年一直在關注AI智能體領域,而Browser Use就是一個很好的投資機會。
她說,Browser Use的創始團隊——以及他們開源為先的策略——徹底打動了自己。
「我們覺得網頁AI智能體是下一個前沿技術,能真正使得人類任務實現端到端的自動化,」Myers對TechCrunch說,「網頁AI智能體就像是一座動態橋梁,連接著靜態預訓練模型與不斷變化的數字世界,而這些靜態模型往往只專注于文本?!?/p>
Browser Use:讓智能體簡單地瀏覽網頁
Browser Use可以使AI智能體簡單地瀏覽網頁。
它在GitHub上開源,許多項目都使用了它的功能,目前已經獲得超過47k個Star了。
項目地址:https://github.com/browser-use/browser-use
Browser Use通過提取網站的交互元素(如按鈕、表單等),使AI能夠自動化執行瀏覽器操作,例如填寫表單、搜索信息或導航網頁。
這對于開發AI驅動的網絡智能體非常有用。
比如,它可以將商品添加到你的購物車,并完成結賬。
甚至是閱讀你的簡歷,然后幫你找工作!中途如果有需要,還會停下來等待你的指示。
它也可以幫你干活兒。
比如,讓它在Hugging Face上查找具有cc-by-sa-4.0許可證的模型,然后按點贊數排序,將排名前5的模型保存到文件中。
從MCP到Browser Use的爆火
Browser Use是隨著智能體的快速發展而爆火起來的。
去11月,Anthropic首次提出「模型上下文協議」,即MCP,賦予了Claude模型超級能力,一次構建,讓AI與工作流深度集成。
用通俗的話講,MCP就像是專為AI應用設計的通用接口,類似我們日常使用的USB-C。
正如USB-C簡化了不同設備與計算機的連接方式,MCP簡化了AI模型與數據、工具和服務之間的交互方式。
通過MCP,AI助手不僅能夠「讀懂」代碼,還能「理解」團隊討論、涉及文檔等外部信息,提供更加精準的回答。
今年1月,OpenAI推出了Operator,能夠自主執行網絡任務,如規劃假期、填寫表單或預訂餐廳 (OpenAI Launches Operator)。
Operator使用名為Computer-Using Agent (CUA)的AI智能體,通過視覺界面控制網頁瀏覽器,模擬人類點擊、輸入和滾動的操作。
這一工具展示了AI智能體在網絡任務自動化中的潛力,但也需要用戶在遇到復雜界面或驗證碼時介入。
差不多同一時間,Browser Use也開源了,它被Manus團隊集成到了Manus智能體中。
Manus因其綜合能力和友好的用戶界面(如實時顯示思考過程)而迅速走紅,吸引了大量關注。
這直接推動了Browser Use知名度的提升。
參考資料:
https://techcrunch.com/2025/03/23/browser-use-the-tool-making-it-easier-for-ai-agents-to-navigate-websites-raises-17m/
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.