來源|Tech星球
文|任雪蕓
比預想中更快一步,3月16日,百度正式發布文心大模型4.5(以下簡稱文心4.5)及文心大模型X1(以下簡稱文心X1),在文心一言官網即可免費使用。
文心4.5不僅在基礎能力上有大幅度提升,且具備原生多模態等能力,其多項基準測試成績優于GPT4.5、DeepSeek-V3等,并且平均分達到79.6分,高于GPT4.5的79.14。文心X1不僅在性能上對標DeepSeek-R1,且具備更強的理解、規劃、反思、進化能力,并支持多模態,是首個自主運動工具的深度思考模型。
和DeepSeek橫空出世一樣,文心4.5和文心X1不僅點燃了國內用戶的熱情,更讓外網沸騰。在推特上,不少人紛紛在求百度測試賬號,他們為兩大模型優異的性能和超低的價格感到不可思議,不少人覺得百度的股價被低估了。甚至有人在百度推特賬號下@薩姆·奧爾特曼,他們表示游戲結束了。
在看到文心新模型的表現后,在推特上擁有70萬粉絲的美國投資人Bill Gurley感慨道,美國人工智能公司應將100%的時間用于開發和創新,而不是在華盛頓特區游說尋求保護以躲避競爭。這種情況很糟糕,明顯暴露出缺乏自信。
兩大模型的優異能力,是對過去3月外界對于“百度大模型掉隊了”最有效的回應,也再一次證明了百度對AI戰略貫徹到底的決心。畢竟,大模型競技是一場持久戰,拼的是耐力、技術、資本。從Transformer到OpenAI-o1和DeepSeek-R1,技術的更新時刻在發生,沒有人可以保證永遠領先,但關鍵的是敢拼的勇氣。
所有玩家從來沒有放棄和停止在大模型領域的努力,百度也是如此。開年以來,百度在大模型領域動作頻頻——文心一言完全免費、文心4.5將于6月30日正式開源;百度核心業務搜索接入DeepSeek;很快百度還會發布4.5系列模型,以及更前沿的下一代模型5.0版本。
動作頻頻的背后,透露出百度依然想留在牌桌上的決心,它也確實做到了。但百度并不能掉以輕心。因為,大模型的終局遠未到來,包括百度在內,所有的玩家都必須全力以赴。這也是百度堅持不懈的根源。
百度加速變革:一場必要的戰略糾偏
半個月之前,OpenAI舉辦了一場線上發布會,正式發布了其最新一代基礎模型GPT-4.5。3月16日,百度并沒有任何發布動作,而是直接上線了文心4.5與文心X1。
這場上線發生得悄無聲息。有百度內部人士稱,無論是文心4.5全面免費,還是PC和移動兩端直接上線,百度管理層都是在半天之內做出的決策。
這似乎是現在的百度與過去的百度,以及行業的一場賽跑。
這一次的百度越來越快了。據百度方面透露,此次文心4.5和X1大模型發布之后,百度后續還會推出文心4.5系列模型,以及在下半年推出更先進的下一代模型5.0版本。
其實,此次模型迭代進程明顯加快,并非偶然。這一現象背后,其實是百度對過往策略選擇的反思與積極糾偏。
過去半年間,DeepSeek等新興公司憑借開源、低成本的模式,給OpenAI、百度這類傳統大模型巨頭帶來了不小的壓力。如今,全球AI企業中,無論是OpenAI,還是百度,都逐漸意識到,大模型領域未來走向依舊充滿變數,尚無定論。
激烈競爭的大模型領域,保持競爭力的關鍵在于果敢地 “求變”。于是,就在今年2月,比OpenAI更快一步,百度決定及時轉變策略。
隨后,百度創始人李彥宏就快速且堅決地推動了一系列動作:文心一言免費、核心業務搜索接入DeepSeek、文心大模型4.5系列將在6月30日正式開源等。
這次糾偏是文心一言對當下市場競爭的直接回應。從悄然上線文心4.5與X1,以及后續透露的一系列迭代計劃,無一不彰顯出百度謀求變革的堅定決心。
不過,百度突然加快腳步,讓外界有人質疑它可能會迷失方向。但目前來看,百度的“變快”建立在對自身技術實力與市場趨勢的研判上,每一次模型的迭代都伴隨著技術架構的深度優化,以及性能的飛躍提升。
從百度自有業務來看,百度旗下多款用大模型重構后的AI應用,包括百度App、百度地圖、百度網盤、百度文庫等體驗感都在持續提升。在此次文心4.5與文心X1上線后,這些應用也在迎來全方位升級。
讓大模型產品,植入“原生技術內核”
作為百度重回牌桌的階段性產品,原生多模態大模型文心4.5以及深度思考模型文心X1,究竟在哪些方面實現了蛻變與升級?
據了解,文心4.5是百度自主研發的新一代原生多模態大模型,通過多個模態聯合建模實現協同優化,多模態理解能力優秀;具備更精進的語言能力,理解、生成、邏輯、記憶能力全面提升,去幻覺、邏輯推理、代碼能力顯著提升。
而文心大模型X1具備更強的理解、規劃、反思、進化能力,并支持多模態,是首個自主運用工具的深度思考模型,兼備準確、創意和文采。
基于文心大模型4.5和文心大模型X1,Tech星球分別實測了一些應用場景。
我們上傳了一段“體重管理年”的新聞視頻,要求文心4.5概括新聞內容,可以看到其給出了準確的回答,證明了其跨模態的能力。目前,文心4.5支持上傳的視頻文件,兼容常見的格式,單個視頻文件大小不超過20M。
在圖片理解上,通過這個問題也能夠看出在圖形推理、圖表分析的“高智商”以外,文心4.5還具備了理解梗圖、漫畫、歌曲、電影等多模態內容的“高情商”。
此外,文心4.5的能力也在圖片生成、RAG(Retrieval Augmented Generation檢索生成增強)測試、邏輯測試、文本創作等方面得到了很好地體現。
在文心X1的測試中能夠看到,作為一個能力更全面的深度思考模型,其在邏輯問題中展現了周密的思考過程,且在答案的輸出上更為明確、直接。
在文本創作類的問題中,也能夠看出文心X1擅長寫“銳評”,避免“端水”,回答尖銳有態度。
Tech星球獲悉,文心X1在技術層面頗具創新,主要運用遞進式強化學習訓練方法,以思維鏈和行動鏈為依托開展端到端訓練,還構建起統一的獎勵系統,融入多元獎勵機制。
憑借這些技術,文心X1能夠在諸多場景中大顯身手,包括中文知識問答、文學創作、文稿寫作、日常對話、邏輯推理、復雜計算等。
此外,多工具調用是文心X1的特色之一。目前,X1已支持高級搜索、文檔問答、圖片理解、AI繪圖、代碼解釋器、網頁鏈接讀取、TreeMind樹圖、百度學術檢索、商業信息查詢、加盟信息查詢、詞云生成等多款工具。
技術+場景,大模型的生態戰
今年2月11日,李彥宏參加“世界政府峰會”WGS 訪談時曾表示,從技術的基礎要素來看,核心主題依然是技術進步得非常快。成本每年降低約90%,并且性能越來越好。當技術發展如此之快,你必須持續投入,以確保處于技術創新的最前沿。
換句話說,大模型的競爭首先是技術實力的競爭,最直觀的體現是價格。文心4.5輸入價格為0.004元/千tokens,輸出0.016元/千tokens,約為GPT4.5價格的1%;文心X1定價為輸入0.002元/千tokens,輸出0.008元/千tokens,是DeepSeek R1的一半。
效率得以大幅度提升,背后是百度通過全棧自研能力構建了“芯片層、框架層、模型層和應用層”的競爭壁壘。從昆侖芯三代萬卡集群的算力支撐,到飛槳深度學習平臺的開發者生態,再到文心大模型體系的多層次迭代以及AI重構的百度搜索、近億用戶的百度文庫,每一層都有反饋,通過不斷獲得反饋,實現了端到端優化,大幅度提升效率。這也是百度近十年累計研發費用超過1800億元的正向反饋。
成本的降低讓百度有了實現AI普惠的底氣,也為接下來文心4.5的開源打下了堅實的基礎。通過開放模型權重、訓練框架等核心能力,吸引開發者共建,百度會擁有更加繁榮的開發生態,構建更深的護城河。因為開源不僅是技術輸出,更是生態卡位。
文心一言將于4月1日取消59.9元/月的付費墻,免費開放表面看是“割肉”,實則是雙贏。這種“零門檻”的模式,讓更多人可以享受技術進步帶來的樂趣。同時,百度在4.3億用戶基數的基礎上得以形成更大的數據飛輪效應,驅動模型持續優化。
開源和免費的戰略轉向是百度應對行業變局的標志性動作,它讓每一個人都可以參與到創新中來。就像李彥宏所言,“創新不能被計劃,你不知道創新何時到來,你所能做的就是營造一個有利于創新的環境。”
更重要的是,技術的終局從來不是參數的比拼,而是在于解決現實生活中的問題。百度已經將這種理念落地實踐。被AI深度重構的百度搜索有超過20%的頁面含有AI生成的內容,近億用戶使用的百度文庫可以智能生成PPT、文檔,已經成為“一站式AI內容創作平臺”,其AI功能月活達9000萬。
更進一步看,大模型比拼的不僅僅是技術實力,更是一場以技術生態為核心、以場景落地為驅動的生態戰爭。這也是百度和其他創業公司的根本區別,百度旗下擁有億級用戶的搜索、地圖、文庫等應用都是AI的落地試驗場。
不僅如此,百度智能云千帆大模型平臺預置了包括百度文心大模型在內的、國內外上百個主流基礎大模型和行業大模型,還為大模型的持續預訓練、精調、評估、壓縮和部署等環節提供最完善易用的工具鏈,它已經幫助客戶精調了3.3萬個模型、開發了77萬個企業應用。
站在大模型爆發的前夜,百度的轉向證明:AI的未來屬于激活生態的玩家,而非單一技術的掌控者。當開源成為行業標配,真正的競爭將聚焦于“如何讓每個人在創新中獲益”——這或許才是李彥宏“創新不能被計劃”斷言的終極答案。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.