網易首頁 > 網易號 > 正文申請入駐

字節猛踩油門

2025-04-19 04:07:04　來源: 虎嗅APP

北京舉報

分享至

出品 | 虎嗅科技組

作者 | 房曉楠

編輯 | 苗正卿

頭圖 | 視覺中國

最近幾天，AI賽道擠滿了新品。

4月17日凌晨，先是OpenAI正式將預熱許久的o3和o4-mini正式對外，憑借“用圖像思考”能力瞬間占據熱搜頭條。

幾個小時后，杭州，字節跳動旗下火山引擎面向企業市場發布了豆包1.5深度思考模型，同步升級文生圖模型3.0、視覺理解模型，并推出OS Agent解決方案及AI云原生推理套件，用于企業客戶構建與部署Agent應用。

其中，豆包1.5深度思考模型作為字節首款推理模型，具備“邊想邊搜”能力，同時借助視覺推理能力，可以綜合理解圖片中的各類信息。官方介紹，目前這款模型的人類評估表現超出DeepSeek R1 8%，且采用MoE架構，在總參數量為200B的情況下，激活參數僅為20B，在訓練和推理成本方面相比同類模型可降低50%。

其實，豆包在對推理模型的響應上，稍慢了一拍。

去年9月，OpenAI發布o1模型，揭開了推理模型的序幕，之后就是今年年初，DeepSeek R1憑借超低訓練成本和優異性能表現，將推理模型的熱度推向高潮，一舉改變了大模型領域的競爭格局，國內外大廠巨頭、AI初創企業迅速跟進，不管是選擇自研推理模型，還是接入DeepSeek，都在持續發力……

字節在這方面，稍顯遲疑。但這似乎也符合字節的一貫風格，雖然并非最早出發，但一旦開始行動，就會以一種飽和式方式加速挺進，最明顯的就是豆包大模型背后的火山引擎。

去年5月，火山引擎發布豆包大模型，并將價格降至0.0008元/千Tokens，低于行業均價99.3%，之后阿里云、百度智能云接連跟進，以更低的價格甚至免費形式，短時間內將大模型拉進“價格戰”白熱化階段。

半年后的12月份，火山引擎再次加速，發布豆包視覺理解模型，并再次以0.003元/千tokens、低于行業85%的價格出圈。彼時，官方透露，豆包大模型12月日均tokens使用量超過4萬億，較5月發布時期增長超過33倍。

而這一次，數據再次刷新。火山引擎總裁譚待表示，截至2025年3月底，豆包大模型日均tokens調用量已達到12.7萬億，較發布之初增長超106倍。

另外，根據IDC發布的《中國公有云大模型服務市場格局分析，1 Q25》數據顯示，火山引擎以46.4%的市場份額位居第一，成為企業落地大模型的首選平臺。

此次，在模型發布后，虎嗅等媒體與譚待進行了交流，他分享了關于火山引擎這幾個月來的變化、以及當下大模型領域的行業新思考。以下為交流實錄，部分內容略有刪減：

提問：目前市場對于云服務的需求有哪些變化？具體提出了哪些新需求？

譚待：我覺得可以把這個問題更寬泛地理解為AI時代大家對云有什么要求。

傳統的云是伴隨著互聯網發展起來的，那時的云原生很多是互聯網應用（如 web、APP）在實踐中涉及的中間件、數據庫、容器等方面，是人通過編寫軟件規則、中間件等來實現對業務的抽象，現在范式發生了變化，則是利用“數據+模型”自動去解決更多的問題。那這種情況下，（大家）對云的要求越來越多，也催生出新的產品，我們把這類產品叫做AI云原生。

原來的云原生是為了適應互聯網發展，現在的AI云原生則是為了滿足AI和Agent發展的需求。

首先，云廠商需要有更好的模型、更低的成本，多模態也是更好模型的一種體現，但這還不夠。AI應用從聊天、信息處理到Agent的發展過程中，需要更多的解決方案。比如今天發布的OS Agent，需要Agent去操作電腦、手機，這就需要電腦和手機的相關組件Sandbox，以及能夠操作界面的模型。

此外，還包括強化學習框架、安全保障以及底層數據處理等方面。未來，火山引擎將圍繞AI云原生，在存儲、計算、數據、安全以及新的中間件如Sandbox等方面推出一系列的產品。

提問：剛才你講到Agent，今年也被稱為Agent元年，包括字節在內的很多廠商都在挖掘Agent的應用場景，那從火山引擎的角度來看，如何看待Agent市場的機會？

譚待：我覺得不能簡單說是押注（Agent），隨著AI發展，聊天和信息處理只是其中一小部分，要真正為各行各業帶來變革，Agent是必經之路，如果做不好相關工作，就難以實現AI的社會和經濟價值。

我認為Agent大概分為垂直類Agent和通用型Agent兩種類型。對于垂直類Agent，火山引擎會基于自身優勢領域進行探索，比如之前推出的數據Agent，通過構建數據飛輪，將數據處理能力發揮到極致。所以我們會在這類垂直領域打造自己的Agent產品，這次提到的Trae也是類似情況，數據和代碼雖然屬于垂直領域，但非常基礎，這類垂直Agent我們會參與開發。

對于通用型Agent，它能操作電腦、手機等，應用場景涵蓋企業內部、個人或特定領域，并且需要根據不同場景進行特別制定。對火山引擎來說，更重要的是搭建好基礎框架、提供好用的工具。所以我們推出了OS Agent解決方案，借助新的AI云原生組件、SandBox和新模型，讓開發者和企業能更輕松地打造自己的通用Agent，這是火山引擎未來的重要發展方向。

提問：在Agent的布局上，現在可以看到，既有字節這樣的大廠，也有發布Manus的Monica這類初創企業，那在你看來，誰在這一領域的機會更大？

譚待：機會大小取決于企業的創新能力，而非企業規模，所以不能以公司大小來判斷，持續保持創新能力才是關鍵。

提問：DeepSeek的R2正在籌劃中，可能不久也要推出，面對這一強勁的競爭對手，字節是如何看待開源與閉源策略？

譚待：我主要從火山引擎的視角來回答。首先對于模型來說，開源或閉源不是關鍵，優劣才是關鍵。因為模型數量眾多，并非所有都有很大影響力，更關鍵還是在于質量。不管是去年還是今年，業界都處于你追我趕的狀態，比如17日凌晨OpenAI還發布了o3和o4-mini，與字節出現“撞車”情況（笑）。

我覺得競爭是非常好的事情，若把當前的AI發展看作一場馬拉松，可能現在才跑了500米。大家在競爭中相互推動，無論對于技術還是行業應用來說都能快速發展，而競爭的關鍵在于能否把模型做好，與開源和閉源關系不大。

提問：那在后續的商業化上有什么規劃？

譚待：提到商業模式的影響，從火山引擎的角度來說，我們本身是云廠商，目標是做AI時代最好的云。要把最好的模型提供給大家，核心在于兩點：一是做好基礎設施AI云原生；二是提供最好的模型以及模型上的各種應用。這次我們就推出了OS Agent這一層，更偏向于Agent這樣的模型。

當我們的云原生做好了，使用者和企業用戶既可以在上面用豆包，也可以用開源模型。剛才提到DeepSeek，它推出后，所有云廠商中對其適配最好的就是火山引擎，據我了解，市面上第三方在使用 DeepSeek云服務時，選擇火山引擎的最多。所以對于火山引擎來說，好的模型越多越好。

提問：預估未來2年火山引擎的大模型tokens調用情況如何，還會保持近百倍的增長嗎？

譚待：對于技術發展而言，人們通常會“短期高估、長期低估”。

從長期來看，百倍甚至更高的增長是有可能的，但具體是2年還是3年，最關鍵的取決于模型是否有重大突破。去年到今年（調用量）增長很快，是因為（豆包）模型有幾個重大突破：一是最基礎的聊天和信息處理能力提升且成本下降；二是今年深度思考功能的推出，這也是一個突破。往后發展還有很多關鍵節點，比如視覺推理能否做得更好、Agent相關技術能否取得更大進展。

每一次大的模型（技術）突破都肯定能激發一次大的變化，但2年內能否再翻100倍，要謹慎樂觀。

提問：目前火山引擎在對內支持和對外擴張上是怎樣的比重？接下來在團隊擴招上有沒有計劃？

譚待：對于火山引擎而言，內部很多業務都依托于火山平臺，比如抖音等產品，同時我們也對外提供支持。從成立之初，我們就堅持技術內外統一，這樣既能保障對內服務，也能做好對外支持。通過技術和資源復用，我們能為內外客戶提供性價比更高的服務，像我們的MaaS和云服務，性價比優勢就源于此，而且實現統一后，無需糾結資源分配偏向內部還是外部，因為技術需求基本一致，全球優秀的云服務提供商（如AWS）也是如此運作。

關于業務擴張，我們會根據業務增長情況進行規劃。

一方面，與規模相關的業務如服務更多客戶，需要擴充銷售團隊、增加解決方案和客戶成功經理，這部分人員會相應增加。另一方面，產品研發更注重質量。當下AI正改變各行各業，我們也在思考如何借助AI提升自身產品研發和維護的效率。比如我們內部使用Data Agent進行數據分析等，火山引擎要成為AI原生、AI實踐的典范，這樣才能助力客戶和開發者實現AI轉型。

本文來自虎嗅，原文鏈接：https://www.huxiu.com/article/4252412.html?f=wyxwapp

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.