出品 | 虎嗅科技組
作者 | 房曉楠
編輯 | 苗正卿
頭圖 | 視覺中國
最近幾天,AI賽道擠滿了新品。
4月17日凌晨,先是OpenAI正式將預熱許久的o3和o4-mini正式對外,憑借“用圖像思考”能力瞬間占據熱搜頭條。
幾個小時后,杭州,字節跳動旗下火山引擎面向企業市場發布了豆包1.5深度思考模型,同步升級文生圖模型3.0、視覺理解模型,并推出OS Agent解決方案及AI云原生推理套件,用于企業客戶構建與部署Agent應用。
其中,豆包1.5深度思考模型作為字節首款推理模型,具備“邊想邊搜”能力,同時借助視覺推理能力,可以綜合理解圖片中的各類信息。官方介紹,目前這款模型的人類評估表現超出DeepSeek R1 8%,且采用MoE架構,在總參數量為200B的情況下,激活參數僅為20B,在訓練和推理成本方面相比同類模型可降低50%。
其實,豆包在對推理模型的響應上,稍慢了一拍。
去年9月,OpenAI發布o1模型,揭開了推理模型的序幕,之后就是今年年初,DeepSeek R1憑借超低訓練成本和優異性能表現,將推理模型的熱度推向高潮,一舉改變了大模型領域的競爭格局,國內外大廠巨頭、AI初創企業迅速跟進,不管是選擇自研推理模型,還是接入DeepSeek,都在持續發力……
字節在這方面,稍顯遲疑。但這似乎也符合字節的一貫風格,雖然并非最早出發,但一旦開始行動,就會以一種飽和式方式加速挺進,最明顯的就是豆包大模型背后的火山引擎。
去年5月,火山引擎發布豆包大模型,并將價格降至0.0008元/千Tokens,低于行業均價99.3%,之后阿里云、百度智能云接連跟進,以更低的價格甚至免費形式,短時間內將大模型拉進“價格戰”白熱化階段。
半年后的12月份,火山引擎再次加速,發布豆包視覺理解模型,并再次以0.003元/千tokens、低于行業85%的價格出圈。彼時,官方透露,豆包大模型12月日均tokens使用量超過4萬億,較5月發布時期增長超過33倍。
而這一次,數據再次刷新。火山引擎總裁譚待表示,截至2025年3月底,豆包大模型日均tokens調用量已達到12.7萬億,較發布之初增長超106倍。
另外,根據IDC發布的《中國公有云大模型服務市場格局分析,1 Q25》數據顯示,火山引擎以46.4%的市場份額位居第一,成為企業落地大模型的首選平臺。
此次,在模型發布后,虎嗅等媒體與譚待進行了交流,他分享了關于火山引擎這幾個月來的變化、以及當下大模型領域的行業新思考。以下為交流實錄,部分內容略有刪減:
提問:目前市場對于云服務的需求有哪些變化?具體提出了哪些新需求?
譚待:我覺得可以把這個問題更寬泛地理解為AI時代大家對云有什么要求。
傳統的云是伴隨著互聯網發展起來的,那時的云原生很多是互聯網應用(如 web、APP)在實踐中涉及的中間件、數據庫、容器等方面,是人通過編寫軟件規則、中間件等來實現對業務的抽象,現在范式發生了變化,則是利用“數據+模型”自動去解決更多的問題。那這種情況下,(大家)對云的要求越來越多,也催生出新的產品,我們把這類產品叫做AI云原生。
原來的云原生是為了適應互聯網發展,現在的AI云原生則是為了滿足AI和Agent發展的需求。
首先,云廠商需要有更好的模型、更低的成本,多模態也是更好模型的一種體現,但這還不夠。AI應用從聊天、信息處理到Agent的發展過程中,需要更多的解決方案。比如今天發布的OS Agent,需要Agent去操作電腦、手機,這就需要電腦和手機的相關組件Sandbox,以及能夠操作界面的模型。
此外,還包括強化學習框架、安全保障以及底層數據處理等方面。未來,火山引擎將圍繞AI云原生,在存儲、計算、數據、安全以及新的中間件如Sandbox等方面推出一系列的產品。
提問:剛才你講到Agent,今年也被稱為Agent元年,包括字節在內的很多廠商都在挖掘Agent的應用場景,那從火山引擎的角度來看,如何看待Agent市場的機會?
譚待:我覺得不能簡單說是押注(Agent) ,隨著AI發展,聊天和信息處理只是其中一小部分,要真正為各行各業帶來變革,Agent是必經之路,如果做不好相關工作,就難以實現AI的社會和經濟價值。
我認為Agent大概分為垂直類Agent和通用型Agent兩種類型。對于垂直類Agent,火山引擎會基于自身優勢領域進行探索,比如之前推出的數據Agent,通過構建數據飛輪,將數據處理能力發揮到極致。所以我們會在這類垂直領域打造自己的Agent產品,這次提到的Trae也是類似情況,數據和代碼雖然屬于垂直領域,但非常基礎,這類垂直Agent我們會參與開發。
對于通用型Agent,它能操作電腦、手機等,應用場景涵蓋企業內部、個人或特定領域,并且需要根據不同場景進行特別制定。對火山引擎來說,更重要的是搭建好基礎框架、提供好用的工具。所以我們推出了OS Agent解決方案,借助新的AI云原生組件、SandBox和新模型,讓開發者和企業能更輕松地打造自己的通用Agent,這是火山引擎未來的重要發展方向。
提問:在Agent的布局上,現在可以看到,既有字節這樣的大廠,也有發布Manus的Monica這類初創企業,那在你看來,誰在這一領域的機會更大?
譚待:機會大小取決于企業的創新能力,而非企業規模,所以不能以公司大小來判斷,持續保持創新能力才是關鍵。
提問:DeepSeek的R2正在籌劃中,可能不久也要推出,面對這一強勁的競爭對手,字節是如何看待開源與閉源策略?
譚待:我主要從火山引擎的視角來回答。首先對于模型來說,開源或閉源不是關鍵,優劣才是關鍵。因為模型數量眾多,并非所有都有很大影響力,更關鍵還是在于質量。不管是去年還是今年,業界都處于你追我趕的狀態,比如17日凌晨OpenAI還發布了o3和o4-mini,與字節出現“撞車”情況(笑)。
我覺得競爭是非常好的事情,若把當前的AI發展看作一場馬拉松,可能現在才跑了500米。大家在競爭中相互推動,無論對于技術還是行業應用來說都能快速發展,而競爭的關鍵在于能否把模型做好,與開源和閉源關系不大。
提問:那在后續的商業化上有什么規劃?
譚待:提到商業模式的影響,從火山引擎的角度來說,我們本身是云廠商,目標是做AI時代最好的云。要把最好的模型提供給大家,核心在于兩點:一是做好基礎設施AI云原生;二是提供最好的模型以及模型上的各種應用。這次我們就推出了OS Agent這一層,更偏向于Agent這樣的模型。
當我們的云原生做好了,使用者和企業用戶既可以在上面用豆包,也可以用開源模型。剛才提到DeepSeek,它推出后,所有云廠商中對其適配最好的就是火山引擎,據我了解,市面上第三方在使用 DeepSeek云服務時,選擇火山引擎的最多。所以對于火山引擎來說,好的模型越多越好。
提問:預估未來2年火山引擎的大模型tokens調用情況如何,還會保持近百倍的增長嗎?
譚待:對于技術發展而言,人們通常會“短期高估、長期低估”。
從長期來看,百倍甚至更高的增長是有可能的,但具體是2年還是3年,最關鍵的取決于模型是否有重大突破。去年到今年(調用量)增長很快,是因為(豆包)模型有幾個重大突破:一是最基礎的聊天和信息處理能力提升且成本下降;二是今年深度思考功能的推出,這也是一個突破。往后發展還有很多關鍵節點,比如視覺推理能否做得更好、Agent相關技術能否取得更大進展。
每一次大的模型(技術)突破都肯定能激發一次大的變化,但2年內能否再翻100倍,要謹慎樂觀。
提問:目前火山引擎在對內支持和對外擴張上是怎樣的比重?接下來在團隊擴招上有沒有計劃?
譚待:對于火山引擎而言,內部很多業務都依托于火山平臺,比如抖音等產品,同時我們也對外提供支持。從成立之初,我們就堅持技術內外統一,這樣既能保障對內服務,也能做好對外支持。通過技術和資源復用,我們能為內外客戶提供性價比更高的服務,像我們的MaaS和云服務,性價比優勢就源于此,而且實現統一后,無需糾結資源分配偏向內部還是外部,因為技術需求基本一致,全球優秀的云服務提供商(如AWS)也是如此運作。
關于業務擴張,我們會根據業務增長情況進行規劃。
一方面,與規模相關的業務如服務更多客戶,需要擴充銷售團隊、增加解決方案和客戶成功經理,這部分人員會相應增加。另一方面,產品研發更注重質量。當下AI正改變各行各業,我們也在思考如何借助AI提升自身產品研發和維護的效率。比如我們內部使用Data Agent進行數據分析等,火山引擎要成為AI原生、AI實踐的典范,這樣才能助力客戶和開發者實現AI轉型。
本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4252412.html?f=wyxwapp
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.