撰文丨潘幾鶴
開源,免費。
毫無預兆,百度扔下兩個王炸。
2月14日,其宣布,將在未來幾個月,陸續推出文心大模型4.5系列,并于6月30日起,正式開源。
就在前一天,百度剛掏出兩個“免費”錦囊:文心一言將在4月1日0時起,全面免費;即日上線的深度搜索功能,屆時同樣全面免費。
作為最早一批入局AI領域的企業,百度的一舉一動,牽動大眾眼光,關乎行業走向。
多數人熱議的,是百度創始人李彥宏對待大模型開閉源的態度轉變。其實,比這更重要的,是他對下半場風向的洞察,以及路線相應的快速調整。
一個更開放的百度,疾馳在AI“水電煤”普惠革命的路上。
開閉之爭
不約而同地,百度與Open AI兩家巨頭,同一時間決定開源。
Open AI首席執行官山姆·奧特曼稱,未來將重新制定開源戰略,還提到,正醞釀將非前沿的舊模型開源。
百度更為直接,其直接宣布開源的,是新系列的模型。
這種變化,不免引向老話題——大模型到底是開源好,還是閉源更好?
其實,開源閉源,不是簡單的二元對立、非此即彼。
從技術發展路線來看,開發主體對此的選擇,很大程度上源于對商業策略的考慮,底層是商業模式和理念的碰撞。
開源能令參與的多方,深入理解模型的技術特點,增進產學研交流,同時,考慮到一些應用場景,涉及垂直領域特有應用的效率調優、行業數據隱私等問題,不便于開源。
二者各有各的使用場景。
早期的模型開源,更多得劃到“營銷”范疇。
比如Meta的LLaMA模型,僅部分開源了參數權重和結構,核心的“配方”,即訓練所用數據集、訓練過程、優化細節等未公開,后者才是真正決定性能的關鍵。
開發者想要復現和改進這些模型,會面臨諸多限制,嚴格意義上,它們只能算“半開源”。
李彥宏很早就指出這一點,提到有外行混淆了模型開源和代碼開源的概念。
市場鼓勵的,本就是負責任的模型開源。進入2025年,這一市場呼吁的實現,可能性變大了,背后是技術迭代的速度,超乎所有人想象。
“今天,創新速度比以往都快得多。摩爾定律中,每18個月,性能就會翻倍,價格減半;如今,大模型推理成本每年能降低90%以上。”數天前的WGS 2025峰會上,李彥宏如此表示。
他提到,回顧過去幾百年歷史,創新的本質是成本下降與生產力提升,在AI、IT乃至更多領域,大多數創新都與降低成本有關。
如成本降低一定比例,生產力也能同比例提高。
這意味著,無論開源、閉源,基礎模型的發展都在加速往前跑,二者勢必走向彼此博弈搖擺、相輔相成的格局。
大模型顛覆摩爾定律,行業邏輯重構,玩家只能應勢而變——這也是百度此次擁抱開源的原因。
價值根本
“開閉”之爭,并非涇渭分明,與其囿于孰強孰弱的爭論,大眾目光更該放在已形成共識的問題上。
正如李彥宏所說,“歸根結底,最重要的是應用,而不是使用哪種大模型。不管開源還是閉源,更重要的是可以在應用層創造什么樣的價值。”
沒有構建于基礎模型之上、豐富的AI原生應用生態,大模型就一文不值。
今年以來,得益于DeepSeek爆火出圈,以及百度文心免費等新的利好釋放,帶來AI應用開發的門檻大幅降低。
AI應用,迎接“安卓時刻”。
百度很早就給出判斷,必須加碼AI應用,其提前布局,一直是堅定的實踐派。
早在兩年前,李彥宏就多次表示,“百度要做第一個把所有現有產品重做一遍的公司。”
這不是整合、接入,而是重構。
大刀闊斧變革之下,百度的應用矩陣,顯現全新氣象。
數據顯示,截至2024年11月,百度已手握日均15億次調用的文心大模型,4.3億用戶規模的文心一言,旗下的百度文庫、網盤等產品,亦老樹發新芽,加速煥新。
以文庫產品為例,年初,百度透露,百度文庫AI功能MAU突破9000萬,AI DAU年同比增長230%,同時,付費用戶超4000萬,位居全球第二、中國第一。
驚人的成績背后,是一年上百項的AI功能更新,團隊為去掉產品的“AI味”付出的不懈努力。
在產業端,百度亦憑借多年的技術投入和工具開發,助力成千上萬企業用上趁手的AI應用。
其已擁有龐大的大模型產業落地規模,超過六成的央企和大量的民營企業,在聯合百度智能云進行AI創新。
今年,百度的應用創新,只快不慢,已釋放新的信號。
2月13日,文心一言新上線深度搜索功能,全面強化了專業咨詢類問題的解決能力,針對性地解決了一系列痛點,包括專業問題查詢門檻高、查詢渠道專精、查詢結果分析難度大等。
由此,更多行業有了專家級問答,內容的深度搜索和文檔閱讀、代碼解釋器等工具一配合,在解決復雜任務問題上變得更聰明。
加固底盤
高盛首席信息官馬可·阿根提觀察到,AI技術的發展速度和影響力,與他當年在亞馬遜見證云服務興起時的情景,驚人相似,AI的發展速度甚至更為迅猛。
超級應用尚未出現,但AI的實際滲透率已然不低。多數投資人和AI從業者都判斷,大模型賦能的AI原生應用,會在2025年有井噴式發展。
這對基礎模型的支撐能力,提出更高要求,市場會加快整合,有實力、規模化的玩家才能留在牌桌。
正如馬可·阿根提所形容的,在模型的商品化方面,將看到“很多汽車,更少的引擎”,不同的應用將基于更少的基礎模型之上構建。
大模型競技殘酷,百度這類頭部玩家,必須將自己的技術底盤,加固得更結實。
“我們仍需對芯片、數據中心和云基礎設施進行持續投入,用于打造更好、更智能的下一代模型。”李彥宏表示。
除了多項AI開放政策于近期密集發布,據市場消息,今年下半年,公司或發布文心大模型5.0,將在模型多模態能力方面,有顯著增強。
換個角度看,這些產品動作的官宣時間,均早于落地時間至少1個半月,既是一種市場承諾,也是百度AI多年錘煉的技術自信。
畢竟,迄今為止,擁有AI技術全棧架構的公司,能具備“芯片-框架-模型-應用”這四層的,百度是國內獨一份。
芯片算力上,近日,百度智能云成功點亮昆侖芯三代萬卡集群,這也是國內首個正式點亮的自研萬卡集群。
未來,百度智能云將進一步點亮3萬卡集群。
大規模集群可以通過任務并行調度、彈性算力管理等方式,提高計算資源利用率,避免算力閑置,降低整體算力成本。
百度開源開放的飛槳深度學習框架具備并行推理、量化推理等自研技術,與文心大模型聯合優化可以實現推理性能提升,推理成本降低。
百度通過端到端優化,提升性能的同時,不斷把成本打下來。
AI技術飛入產業和千家萬戶,無法一蹴而就。技術最前沿的爬坡者,最先體會到風雨。
李彥宏說,也許在某個時刻,能找到一條捷徑,比如只需600萬美元就能訓練出一個模型,“在此之前,你可能已經花費數十億美元來探索,哪條路才是花費這600萬美元的正確途徑。”
1個多月前,在2025年全員信里,這位“AI先生”分享感受,說話直白一如既往,提到有些工作直到最后一天,才知道成或不成,機遇與挑戰并行。
“要不斷試錯,要知道哪一天方向走錯了需要迅速調整,重新出發,甚至要對自己的能力邊界有清醒的認知,并不斷總結經驗教訓,以利再戰。”李彥宏坦言。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.