給企業落地大模型打造基礎設施。
隨著大模型迭代加速,AI 應用生態正面臨前所未有的壓力:越來越多的垂類應用被更強、更通用的模型 “吞噬”。開發者的焦慮感在加劇,企業也開始重新評估開發 AI 應用的投入產出比。
4 月 25 日在武漢舉辦的 Create 2025 百度 AI 開發者大會上,百度創始人李彥宏回應了這股 “模型焦慮”:大模型快速迭代不會吞掉所有 AI 應用,“只要找對場景,選對基礎模型,有時候還要學一點調模型的方法,在此基礎上做出來的應用不會過時。”
李彥宏展示了百度智能云在交通信控、鋼鐵行業中的 AI 應用案例,稱通用大模型再怎么升級,也不能獨立完成 “檢測高速公路上各種安全事件” 或者 “檢測熱軋帶鋼表面的缺陷” 等精細任務,它們與小模型協同才能產生更好的解決方案。
他認為,大模型能力提升會讓這些 AI 應用護城河更深、價值更高,“這樣的機會,在千行百業里比比皆是”。市場調研機構 Gartner 估算,到 2029 年,中國 60% 的企業將把 AI 融入主要產品和服務,而這些 AI 功能也會成為企業收入增長的主要動力。
幫企業客戶開發大模型應用,是百度智能云近年來收入增長的動力。2024 年,百度智能云收入達到 219 億元人民幣,同比增長 17 %,是百度增速最快的業務線。據統計,今年一季度,百度智能云繼續位居國內的大模型中標項目數量和金額第一。
2023 年開始內測的千帆,是百度智能云推動大模型落地企業的核心產品。這次 AI 開發者大會上,百度智能云再次升級千帆大模型平臺:
模型開發平臺更加多維開放,支持上百個模型服務;新增多模態、深度思考模型工具鏈,并且成為國內首個把 RFT、GRPO 等領先強化學習方法產品化的平臺;“一鍵蒸餾” 功能,讓企業客戶更方便地用小參數模型 “學” 到大參數模型,解決特定問題的推理能力,降低推理成本。
數據智能平臺上線,讓企業把原來散落在各個部門、流程中的數據統一管理和治理,挖掘數據價值,實現數據變現,以及提升業務決策效率。
應用開發平臺增加 “智能體 Pro”,讓企業客戶可以批量開發嵌入到工作場景中的大模型應用,尤其是當前行業中的熱門產品形態 Agent,讓各行各業定制自己的企業專屬智能體;發布完整的 MCP(Model Context Protocol)服務,支持客戶和開發者將 MCP Server 接入大模型應用,推出低代碼創建 MCP Server 的工具,提供免費托管服務,以及組建聚集上千個 MCP Server 的廣場。
MCP 是 Anthropic 在 2024 年提出的協議,用統一的方式,把現有軟件變成大模型可以直接調用的 “工具”。“MCP 讓 AI 更懂外部世界,更容易獲得信息,更自由地調用工具,是 AI 發展的一大步。” 李彥宏說,“現在基于 MCP 開發 Agent ,就像 2010 年開發移動 App。”
百度各業務線也全面支持 MCP,將搜索、地圖、文庫、電商、網盤等產品能力做成 MCP Server。企業和開發者在千帆平臺中可以把它們接入自己的 Agent。
2023 年 3 月,百度在國內率先發布對標 ChatGPT 的文心一言,并推動公司全面向大模型轉型。如今,百度正進一步整合內部資源,抓住企業落地大模型的機會。云平臺間的大模型企業服務競爭,已從單點技術比拼走向體系化能力角逐。
三個平臺,覆蓋企業落地大模型的不同環節
兩年迭代,百度智能云逐步認識到如何開發一款好的企業大模型開發平臺:“門檻要足夠低,低到人人可用;天花板要足夠高,必須有能力服務那些最嚴肅、要求最苛刻的企業場景。”
這是百度智能云千帆平臺的升級目標。“大家有可能用的是同樣的基礎模型,要做出差異化的體驗,靠的是工程能力。” 百度集團執行副總裁、百度智能云事業群總裁沈抖說,企業可以利用千帆 “快速完成從數據處理到模型定制、應用開發的一整套工作,開發出效果更好的產品。”
模型開發平臺已上線超過 100 款基礎模型,涵蓋百度新發布的原生多模態模型文心 4.5 Turbo、深度思考模型文心 X1 Turbo,以及 DeepSeek、阿里等公司開源模型,跨越原生多模態、文本生成、深度推理、圖像 / 視頻生成、語音大模型等方向。企業客戶可通過 API 調用這些模型。
這只是千帆的基礎能力。他們還開發了模型工具鏈,覆蓋數據管理、模型精調、評估優化與部署。“雖然從 0 到 1 訓練大模型的需求沒有那么多了,但企業定制專、精模型的需求還在增長。” 沈抖說。
更新后的模型開發平臺上,企業可以拿自己收集的數據集精調平臺上的基礎模型,讓它更好地解決特定場景的問題,也可以用新上線的 “蒸餾” 功能,把大尺寸模型解決特定任務的能力遷移到小模型上。
蒸餾并不是一個全新的功能。百度智能云 AI 與大模型平臺總經理忻舟說,在 DeepSeek 推出 R1 前,千帆就可以支持企業用蒸餾的方式開發模型,“一直在做”,R1 加深市場認知,也驗證了千帆的判斷,加上公司內部業務有需求,蒸餾的價值提升,就推出了 “模型蒸餾樣板間標品化產品”。
比如智聯招聘使用千帆模型開發平臺的模型蒸餾功能,把 6000 多億參數的 DeepSeek-R1 作為 “教師模型”,蒸餾出它回答 “人崗匹配” 問題的數據集,清理后用它精調百億參數的 ERNIE Speed 模型,保留效果的同時,將模型使用成本壓縮至原來的三成。
忻舟說,這個平臺也是一個可以迭代的模型開發體系。很多的 C 端用戶使用大模型,不能為廠商提供直接有效的數據,促進基礎大模型能力的提升,這個在行業已經形成共識。比如 DeepSeek 發布 R1 前并沒有積累太多的用戶。
不過企業真實應用場景上,調用大模型解決的都是特定場景問題,所以模型使用反饋對模型的價值都非常大。“千帆模型開發平臺可以幫企業利用這些有效反饋,做模型精調并持續改善模型效果,讓企業的應用效果越來越好。” 他說。
他們給模型開發平臺設計了多種使用模式,以兼容不同的用戶。針對開發能力強的企業和開發者,他們提供集成接口,支持本地、云端 IDE,或者命令行使用,并兼容 Python、Go、JS、Java 等多種編程語言。為了進一步降低門檻,他們會提供精調好的行業模型或者提供模型 “樣板間”。
企業推動大模型落地的過程中,開發應用是最耗時的環節。百度智能云應用平臺部總經理朱廣翔說,他們調研發現,許多企業將 90% 的 AI 項目時間花在了應用開發上。
尤其是 DeepSeek-R1、文心 X1 等深度思考模型出現,讓 Agent 解決復雜問題的能力增強,但開發難度也跟著上升。
在開發者大會上,沈抖用 “大工程” 形容 Agent 開發過程。他們調研發現,企業想要做好 Agent 要具備以下能力:
結合企業自己的私域數據、企業知識庫,讓 Agent 學習企業多年沉淀的行業經驗,理解業務場景。
準確匹配到企業的標準 SOP,能根據企業規范編排業務流程、執行任務。
調用各種工具,解決復雜問題;同時還得達到企業級服務要求的安全性、穩定性、可控性。
千帆應用開發平臺推出了智能體 Pro,用戶只需要輸入提示詞,上傳需要調用的知識庫,選擇特定的組件,比如 Deep Research,就能迅速創建一個像行業內 Deep Research 應用那樣的 Agent。而且它不僅可以像其他的 Deep Research 那樣搜索公開資料,也可以調用企業內部的數據庫,整合后生成報告。
企業和開發者過去常用 RAG(檢索增強生成)功能,讓大模型根據特定的知識庫回答問題,從而提高解題能力。隨著智能體 Pro 推出,千帆也把它升級成 Agentic RAG。
朱廣翔舉例,銷售要去找游樂園談合作,想用公司開發的 Agent 推薦方案,傳統的 RAG 會把關鍵詞做向量化,然后用這些特征匹配知識庫,如果公司沒有跟游樂園合作過,可能什么都沒有;而 Agentic RAG 具備思考能力,它會先拆解用戶的需求,知識庫中沒有完全匹配項,它也會找相似的方案,然后整合出一個答案。
用智能體 Pro 降低企業開發大模型應用門檻的同時,千帆也全面支持 MCP,提升 Agent 價值。朱廣翔說,百度智能云是第一家支持 MCP 的云平臺,從 3 月到現在搭建起了一套完整的 MCP 服務,支持企業的 Agent 接入 MCP,還開發低代碼制作 MCP Server 的工具,提供免費托管服務。
他們收集整理了行業內公開的優質 MCP Server,與百度開發的圖像識別、OCR、語音識別、語音合成等 AI 工具,百度智能云長期積累的能源電力、智能交通等垂直行業的工具,以及百度 AI 搜索、地圖、電商、網盤、百科等核心業務聚集到一起,組建超過上千個 MCP Server 廣場。他說,利用這些 MCP 組件,企業可以不斷給 Agent 增加各種技能,讓它們持續成長,變成一個個行業專家。
與模型開發平臺類似,千帆的應用開發平臺也準備了 “樣板間”,降低企業的使用門檻。他們也把新功能與無代碼開發工具 “秒噠” 打通,讓企業一站式開發 AI 產品。
數據智能平臺是千帆新上線的服務。百度智能云數據平臺部總經理劉斌說,他們調查發現,企業訓練模型、開發應用的過程中,50~80% 時間都花在了在數據治理上。
尤其在多模態模型能力不斷增強的當下,企業同時面臨文本、圖像、語音、視頻等多模態數據的治理難題,而現有工具和流程仍以人工為主,協作復雜、自動化程度低,安全也難以保障。
“拉高的不只是機器和人力成本,還有機會成本,這對企業來說損失更大。” 劉斌說,企業用好大模型,數據工程是與算力、模型同樣重要的基礎設施,“但多模態數據治理還停留在農耕時代”。
據介紹,數據智能平臺具備多模態數據管理、多模態數據處理、彈性 AI 計算、統一在線協同開發四項核心能力:5 大類算子 100+,支持抽取、清洗、過濾、去重、嵌入等數據處理主要環節,覆蓋文檔、圖像、語音、音頻等所有模態,大部分場景下只需通過少量配置,就可完成數據處理;很好支持 GPU+CPU 的混合計算,強彈性可以用來高效處理不同規模的數據;跨團隊協作能力讓大規模開發變成可能。
這一平臺的首位客戶,正是百度自己。劉斌說,數據智能平臺是百度內部長期使用的數據工具的產品化版本,支撐了文心 4.5 及其升級版 Turbo 的訓練,解決了數據冗余、不一致、精細管理缺失等難題,讓數據生產效率提升六倍,算力成本節省 30%,而且 “數據安全可共享、可審計”。
在百度智能云看來,隨著大模型與 AI 原生應用加速滲透產業核心場景,企業在數據管理方面的需求會持續增長,數據工程也會越來越重要。“未來多模態的數據體量會有 10 倍以上增長空間。” 劉斌說,“這是政企客戶的剛需。”
云平臺的大模型應用競爭,比拼的是體系能力
千帆的誕生和迭代,是百度全面轉型大模型的產物。
朱廣翔說,大模型浪潮到來后,百度的各個業務快速接入大模型,“開發了一大堆應用”,覆蓋問答、客服、創作、代碼執行等各種場景,他們從中提煉不同團隊開發大模型應用或功能的共性,做出千帆應用開發平臺——模型開發平臺也是類似的過程。
把公司內部技術對外開放,是大型云計算平臺開發產品的慣用邏輯。AWS 的第一款產品是亞馬遜電商網站的商品數據庫,火山引擎早期最成功的產品是字節的推薦算法服務。
在忻舟看來,基于公司內部的技術積累迅速推出新產品,“只是短期優勢”。傳統的企業客戶,業務流程相對穩定,沒有那么容易接納新技術,“效果只是企業考慮的因素之一,他們同樣在意性能和成本”。
想抓住企業落地大模型的機會,云平臺不僅要有各種類型的領先模型,還要理解企業的真實需求,并提供低成本的方案。
百度云計算業務從 2015 年正式對外運營,后更名為 “百度智能云”,一直有著 AI 云的鮮明標簽。據市場調研機構 IDC 統計,截至 2023 年,百度智能云在中國 AI 公有云市場的份額連續 5 年保持第一。
在此期間,百度智能云積累一批愿意嘗試用 AI 技術改造業務的客戶,和 AI 在產業中落地的經驗。對于云計算公司來說,客戶和服務經驗都是優質資產。一旦某個企業選定公有云服務商,都會在數據和業務層面深入綁定,遷移成本會持續升高。在新技術到來時,這些客戶往往會愿意在原有的云計算平臺上繼續探索。
百度智能云介紹,千帆已經服務超過 40 萬客戶,在央企滲透率超過 60%,精調了 4.5 萬個模型,開發了超 100 萬個應用。這幫助百度智能云更好地理解用戶需求,持續迭代千帆大模型平臺。
企業客戶在意的性能、成本,比拼的是云平臺的技術系統實力。百度智能云在 2 月初上架 DeepSeek V3 和 R1 模型,API 調用價格比 DeepSeek 官方刊例價還低,當天就吸引 1.5 萬客戶使用。
“這不是大額補貼的結果。” 忻舟說,這是百度智能云在大模型推理性能優化方向的技術積累,他們聯合百度智能云異構計算平臺百舸、基礎架構部等團隊,針對 DeepSeek 的模型架構做了深入優化,比如將模型推理的 Prefill(處理提示詞)和 Decode(生成內容) 兩個階段分離,使其能在不同的 GPU 上并行處理,從而降低了算力成本。
這次 AI 開發者大會上,百度又為千帆大模型平臺增加更多能力,把公司各個業務開發的核心產品轉換成 MCP Server 大規模對外提供。這樣的開放程度,在全球大型公司中都很罕見,大多數公司支持 MCP 都只是為了利用生態增強實力。
“企業現在甚至可以用千帆,快速開發出類似 Perplexity 或 Manus 的產品。” 朱廣翔說,接下來千帆也會兼容 Google 推出的 A2A 多智能體協作協議,讓企業開發的 Agent 與全世界的 Agent 交互,提高產品價值。
數據智能平臺則讓千帆體系變得更完整。據市場調研機構 Gartner 估算,到 2028 年,中國企業處理 AI 數據的投資將達到 2024 年的 20 倍。
“數據平臺有機會在更多場景發揮價值,推動企業的數據治理從農耕時代邁入工業時代。” 劉斌說,無論是模型能力的演進還是 Agent 應用的擴展,數據始終是基礎。
“我們其實不存在 ‘Stay on the table’ 的問題,因為我們十幾年前就已經上了 ‘table’。” 李彥宏在去年底的內部會上說,“百度絕不可能下這個 ‘table’。”
千帆的體系化升級,是百度給出的最新證明。
題圖來源:《人生切割術》
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.