網易首頁 > 網易號 > 正文申請入駐

百度文心4.5與X1登場后，大模型第一梯隊的競爭再升級？

2025-03-18 10:48:53　來源: Tech星球

吉林舉報

分享至

來源|Tech星球

文|任雪蕓

比預想中更快一步，3月16日，百度正式發布文心大模型4.5（以下簡稱文心4.5）及文心大模型X1（以下簡稱文心X1），在文心一言官網即可免費使用。

文心4.5不僅在基礎能力上有大幅度提升，且具備原生多模態等能力，其多項基準測試成績優于GPT4.5、DeepSeek-V3等，并且平均分達到79.6分，高于GPT4.5的79.14。文心X1不僅在性能上對標DeepSeek-R1，且具備更強的理解、規劃、反思、進化能力，并支持多模態，是首個自主運動工具的深度思考模型。

和DeepSeek橫空出世一樣，文心4.5和文心X1不僅點燃了國內用戶的熱情，更讓外網沸騰。在推特上，不少人紛紛在求百度測試賬號，他們為兩大模型優異的性能和超低的價格感到不可思議，不少人覺得百度的股價被低估了。甚至有人在百度推特賬號下@薩姆·奧爾特曼，他們表示游戲結束了。

在看到文心新模型的表現后，在推特上擁有70萬粉絲的美國投資人Bill Gurley感慨道，美國人工智能公司應將100%的時間用于開發和創新，而不是在華盛頓特區游說尋求保護以躲避競爭。這種情況很糟糕，明顯暴露出缺乏自信。

兩大模型的優異能力，是對過去3月外界對于“百度大模型掉隊了”最有效的回應，也再一次證明了百度對AI戰略貫徹到底的決心。畢竟，大模型競技是一場持久戰，拼的是耐力、技術、資本。從Transformer到OpenAI-o1和DeepSeek-R1，技術的更新時刻在發生，沒有人可以保證永遠領先，但關鍵的是敢拼的勇氣。

所有玩家從來沒有放棄和停止在大模型領域的努力，百度也是如此。開年以來，百度在大模型領域動作頻頻——文心一言完全免費、文心4.5將于6月30日正式開源；百度核心業務搜索接入DeepSeek；很快百度還會發布4.5系列模型，以及更前沿的下一代模型5.0版本。

動作頻頻的背后，透露出百度依然想留在牌桌上的決心，它也確實做到了。但百度并不能掉以輕心。因為，大模型的終局遠未到來，包括百度在內，所有的玩家都必須全力以赴。這也是百度堅持不懈的根源。

百度加速變革：一場必要的戰略糾偏

半個月之前，OpenAI舉辦了一場線上發布會，正式發布了其最新一代基礎模型GPT-4.5。3月16日，百度并沒有任何發布動作，而是直接上線了文心4.5與文心X1。

這場上線發生得悄無聲息。有百度內部人士稱，無論是文心4.5全面免費，還是PC和移動兩端直接上線，百度管理層都是在半天之內做出的決策。

這似乎是現在的百度與過去的百度，以及行業的一場賽跑。

這一次的百度越來越快了。據百度方面透露，此次文心4.5和X1大模型發布之后，百度后續還會推出文心4.5系列模型，以及在下半年推出更先進的下一代模型5.0版本。

其實，此次模型迭代進程明顯加快，并非偶然。這一現象背后，其實是百度對過往策略選擇的反思與積極糾偏。

過去半年間，DeepSeek等新興公司憑借開源、低成本的模式，給OpenAI、百度這類傳統大模型巨頭帶來了不小的壓力。如今，全球AI企業中，無論是OpenAI，還是百度，都逐漸意識到，大模型領域未來走向依舊充滿變數，尚無定論。

激烈競爭的大模型領域，保持競爭力的關鍵在于果敢地 “求變”。于是，就在今年2月，比OpenAI更快一步，百度決定及時轉變策略。

隨后，百度創始人李彥宏就快速且堅決地推動了一系列動作：文心一言免費、核心業務搜索接入DeepSeek、文心大模型4.5系列將在6月30日正式開源等。

這次糾偏是文心一言對當下市場競爭的直接回應。從悄然上線文心4.5與X1，以及后續透露的一系列迭代計劃，無一不彰顯出百度謀求變革的堅定決心。

不過，百度突然加快腳步，讓外界有人質疑它可能會迷失方向。但目前來看，百度的“變快”建立在對自身技術實力與市場趨勢的研判上，每一次模型的迭代都伴隨著技術架構的深度優化，以及性能的飛躍提升。

從百度自有業務來看，百度旗下多款用大模型重構后的AI應用，包括百度App、百度地圖、百度網盤、百度文庫等體驗感都在持續提升。在此次文心4.5與文心X1上線后，這些應用也在迎來全方位升級。

讓大模型產品，植入“原生技術內核”

作為百度重回牌桌的階段性產品，原生多模態大模型文心4.5以及深度思考模型文心X1，究竟在哪些方面實現了蛻變與升級？

據了解，文心4.5是百度自主研發的新一代原生多模態大模型，通過多個模態聯合建模實現協同優化，多模態理解能力優秀；具備更精進的語言能力，理解、生成、邏輯、記憶能力全面提升，去幻覺、邏輯推理、代碼能力顯著提升。

而文心大模型X1具備更強的理解、規劃、反思、進化能力，并支持多模態，是首個自主運用工具的深度思考模型，兼備準確、創意和文采。

基于文心大模型4.5和文心大模型X1，Tech星球分別實測了一些應用場景。

我們上傳了一段“體重管理年”的新聞視頻，要求文心4.5概括新聞內容，可以看到其給出了準確的回答，證明了其跨模態的能力。目前，文心4.5支持上傳的視頻文件，兼容常見的格式，單個視頻文件大小不超過20M。

在圖片理解上，通過這個問題也能夠看出在圖形推理、圖表分析的“高智商”以外，文心4.5還具備了理解梗圖、漫畫、歌曲、電影等多模態內容的“高情商”。

此外，文心4.5的能力也在圖片生成、RAG（Retrieval Augmented Generation檢索生成增強）測試、邏輯測試、文本創作等方面得到了很好地體現。

在文心X1的測試中能夠看到，作為一個能力更全面的深度思考模型，其在邏輯問題中展現了周密的思考過程，且在答案的輸出上更為明確、直接。

在文本創作類的問題中，也能夠看出文心X1擅長寫“銳評”，避免“端水”，回答尖銳有態度。

Tech星球獲悉，文心X1在技術層面頗具創新，主要運用遞進式強化學習訓練方法，以思維鏈和行動鏈為依托開展端到端訓練，還構建起統一的獎勵系統，融入多元獎勵機制。

憑借這些技術，文心X1能夠在諸多場景中大顯身手，包括中文知識問答、文學創作、文稿寫作、日常對話、邏輯推理、復雜計算等。

此外，多工具調用是文心X1的特色之一。目前，X1已支持高級搜索、文檔問答、圖片理解、AI繪圖、代碼解釋器、網頁鏈接讀取、TreeMind樹圖、百度學術檢索、商業信息查詢、加盟信息查詢、詞云生成等多款工具。

技術+場景，大模型的生態戰

今年2月11日，李彥宏參加“世界政府峰會”WGS 訪談時曾表示，從技術的基礎要素來看，核心主題依然是技術進步得非常快。成本每年降低約90%，并且性能越來越好。當技術發展如此之快，你必須持續投入，以確保處于技術創新的最前沿。

換句話說，大模型的競爭首先是技術實力的競爭，最直觀的體現是價格。文心4.5輸入價格為0.004元/千tokens，輸出0.016元/千tokens，約為GPT4.5價格的1%；文心X1定價為輸入0.002元/千tokens，輸出0.008元/千tokens，是DeepSeek R1的一半。

效率得以大幅度提升，背后是百度通過全棧自研能力構建了“芯片層、框架層、模型層和應用層”的競爭壁壘。從昆侖芯三代萬卡集群的算力支撐，到飛槳深度學習平臺的開發者生態，再到文心大模型體系的多層次迭代以及AI重構的百度搜索、近億用戶的百度文庫，每一層都有反饋，通過不斷獲得反饋，實現了端到端優化，大幅度提升效率。這也是百度近十年累計研發費用超過1800億元的正向反饋。

成本的降低讓百度有了實現AI普惠的底氣，也為接下來文心4.5的開源打下了堅實的基礎。通過開放模型權重、訓練框架等核心能力，吸引開發者共建，百度會擁有更加繁榮的開發生態，構建更深的護城河。因為開源不僅是技術輸出，更是生態卡位。

文心一言將于4月1日取消59.9元/月的付費墻，免費開放表面看是“割肉”，實則是雙贏。這種“零門檻”的模式，讓更多人可以享受技術進步帶來的樂趣。同時，百度在4.3億用戶基數的基礎上得以形成更大的數據飛輪效應，驅動模型持續優化。

開源和免費的戰略轉向是百度應對行業變局的標志性動作，它讓每一個人都可以參與到創新中來。就像李彥宏所言，“創新不能被計劃，你不知道創新何時到來，你所能做的就是營造一個有利于創新的環境。”

更重要的是，技術的終局從來不是參數的比拼，而是在于解決現實生活中的問題。百度已經將這種理念落地實踐。被AI深度重構的百度搜索有超過20%的頁面含有AI生成的內容，近億用戶使用的百度文庫可以智能生成PPT、文檔，已經成為“一站式AI內容創作平臺”，其AI功能月活達9000萬。

更進一步看，大模型比拼的不僅僅是技術實力，更是一場以技術生態為核心、以場景落地為驅動的生態戰爭。這也是百度和其他創業公司的根本區別，百度旗下擁有億級用戶的搜索、地圖、文庫等應用都是AI的落地試驗場。

不僅如此，百度智能云千帆大模型平臺預置了包括百度文心大模型在內的、國內外上百個主流基礎大模型和行業大模型，還為大模型的持續預訓練、精調、評估、壓縮和部署等環節提供最完善易用的工具鏈，它已經幫助客戶精調了3.3萬個模型、開發了77萬個企業應用。

站在大模型爆發的前夜，百度的轉向證明：AI的未來屬于激活生態的玩家，而非單一技術的掌控者。當開源成為行業標配，真正的競爭將聚焦于“如何讓每個人在創新中獲益”——這或許才是李彥宏“創新不能被計劃”斷言的終極答案。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.