來源 | Tech星球
文 | 任雪蕓
2月14日,百度又官宣新消息:將在未來幾個月內陸續推出文心大模型4.5系列,并于6月30日起正式開源。
事實上這幾日,百度密集地推出了多項AI開放政策。
2月12日,CNBC一則關于百度文心大模型5.0版本將于下半年發布的消息,在AI行業引發震動。次日,OpenAI首席執行官Sam Altman宣布將在未來幾個月推出名為GPT-5,進一步加劇全球AI競賽的緊張氛圍。
然而,真正的“王炸”還是來自百度:同日,百度正式宣布,文心一言將于4月1日全面免費開放,所有PC端和APP端用戶均可體驗文心系列最新模型,同時上線深度搜索功能。
百度的這一決定,不僅意味著全球用戶可零門檻使用中國最先進的大模型技術,也標志著大模型從專業領域邁向大眾市場的關鍵轉折,一場普惠大眾的AI變革浪潮拉開帷幕 。
從OpenAI開放ChatGPT Search、谷歌免費推出Gemini 2.0,到阿里通義千問、訊飛星火接連開放API免費額度、騰訊混元大模型內測零門檻,再到文心一言的全面免費和文心大模型開源,科技巨頭們近乎同步的動作,揭示了一個核心趨勢:AI技術的普及已進入“全民化”階段。
大模型行至2025年,已度過初步發展階段,邁入 AI應用爆發階段。開源有助于技術更快傳播,提高采用率,為人們更低門檻創造AI應用創新帶來更多機會。開源最新系列的模型,意味著百度將采用更積極的姿態面對市場,攜手推動產業發展,尤其是助推AI應用層的進步。
百度以免費、開源為支點,撬動技術平權的杠桿,其背后既是技術實力的自信,更是對AI生態重構的深遠布局。
文心大模型4.0:從參數爆炸到多模態革命
開源是強者游戲,需要強大的技術自信。近兩年來,文心大模型不斷迭代,技術能力已有深厚積累,此時開源背后,更是技術底氣的體現。
文心一言的發展歷程,可以稱得上是一部中國大模型技術的進化史。
早在2019年,百度就推出了1億參數規模的文心大模型1.0版本,隨后又在2.0版本升級至10億參數,ChatGPT發布后不久,百度搶先推出了3.0版本,并在2023年10月迭代到4.0版本,緊接著在2024年4月發布文心大模型4.0工具版。
文心大模型的持續快速進化,是百度作為行業先行者不斷突破技術邊界、引領產業變革的有力見證。
文心一言1.0階段,整個行業對于中文語境下大模型的構建還處于迷茫與觀望階段,百度率先為行業初步驗證了中文語境下大模型的可行性。從2.0版本之后,文心一言持續進化,構建了從語義理解到知識推理的完整認知框架,實現了對復雜語言現象和知識的精準把握。
相比3.5版本,文心大模型 4.0不僅做到了參數的升級,其構建于 “知識增強 + 場景進化” 的雙引擎架構之上,以“多模態能力”為核心,其語言理解、推理、生成能力表現尤為突出。
在多個對比測試中,用戶已經能更直觀地感受到文心大模型4.0 的能力進階。開放免費使用后,相信將讓廣大用戶直接受益。
以 “繪制一幅奧黛麗?赫本吃湯圓的畫面” 這一指令為例,文心大模型 3.5 版本僅僅生成了一張符合指令基本要求的圖片。反觀文心大模型4.0,借助其自主研發的 IRAG(image - based RAG)能力,不僅能夠精準地描繪出奧黛麗?赫本的面部輪廓,讓人物形象栩栩如生,還一次性輸出了多張細節精妙的圖片。
除了圖像生成能力的顯著提升,在處理復雜邏輯推理問題時,文心大模型4.0同樣表現出色。
面對 “世界八大奇跡哪一個最有可能是外星人建的,嚴謹地推理一下” 這樣充滿挑戰的問題,文心大模型3.5 和 4.0 版本都能捕捉到題目中的關鍵線索。
但文心大模型4.0的優勢在于,它不僅能正面回應這類極具創意性的問題,還能以圖文并茂等富媒體形式呈現推理過程和結論,展現了其強大的邏輯思維與知識整合輸出能力。
通過以上實測不難發現,文心大模型 4.0通過多模態知識關聯實現了“視覺認知、知識圖譜、邏輯推演”的三維聯動,這種架構創新讓AI已經具備了接近人類的多維度問題解決能力。
成本革命:從實驗室到普惠的技術密碼
開源和免費策略背后,亦是技術創新驅動,大模型不斷迭代帶來成本降低和生產力提升。
在近日召開的世界政府峰會上,李彥宏表示,在AI領域或IT行業,大多數創新都與降低成本有關。
“如果成本降低一定比例,生產力也隨之提高同樣比例。在今天,創新速度比以往都快得多。根據摩爾定律,每18個月,性能就會翻倍而價格減半。如今,大模型推理成本每年降低90%以上。”
這一數字背后,是行業大模型技術的深度變革與突破。
成本的大幅降低,使得大模型不再是僅存于頂尖實驗室、少數科技巨頭手中的昂貴 “奢侈品”,而是得以廣泛普及,為千行百業的發展注入新動能。
成本下降的原因指向技術的成熟。過去幾年,以百度為首的大模型企業們,一直在硬件、算法、工程化層面突破,致力于進一步降低門檻,努力提升商業化能力。
回溯大模型發展的早期階段,技術不成熟帶來的高成本問題,籠罩著眾多AI企業。
以一個數百億參數的Transformer模型為例,進行大規模預訓練,通常需要數周到數月的時間,且需要依賴GPU集群的持續運行。在GPU單價居高不下的時代,每天的訓練費用可能高達數十萬美元甚至更多。
行業一直在圍繞算法和硬件兩個層面降本,百度的做法是,通過昆侖芯+百舸AI異構計算平臺雙輪驅動,構建超大規模算力集群。
其中,百度智能云通過自研昆侖芯三代及萬卡集群建設,在確保了自身算力供應以外,同時為行業提供了新的降本增效方案。據百度方面介紹,萬卡集群除了能處理單一任務,還可同時訓練多個輕量化模型。基于通信優化與容錯機制,有效減少算力浪費,實現訓練成本指數級下降。
支撐萬卡集群高效運行的是百度自研的昆侖芯三代。相較于前代產品,百度自研的新一代昆侖芯在算力、能效、穩定性等方面全面升級,針對大模型的分布式訓練,昆侖芯三代結合并行任務切分策略,在訓練主流開源模型時,將集群MFU(集群計算利用率)提升至58%,有效提升算力利用效率。
如果說訓練成本決定技術上限,那么推理成本則決定了應用下限。
得益于百度四層技術棧的獨特優勢,芯片、框架、大模型和終端應用場景能夠形成高效的反饋閉環,幫助大模型不斷調優迭代。早在2024年初的財報電話會上,李彥宏曾透露,自發布以來,百度不斷降低文心大模型的推理成本,已降低至一年前的1%。
訓練成本和推理成本的斷崖式下降,使百度有能力將文心一言從“付費會員制”轉向全民免費。
而這一策略也絕非簡單的價格戰。此前百度CTO王海峰透露,文心大模型日均調用量已超2億次,這種量級的用戶交互數據,是打磨AI能力的核心燃料。
免費策略本質上是用短期收益換取數據飛輪的高速旋轉,當單次API調用成本越來越低,免費開放帶來的用戶規模效應,反而可能通過生態反哺實現商業閉環。這種以戰養戰的策略,正在改寫AI進化的底層邏輯。
技術平權:重構AI生態的底層邏輯
過去互聯網的免費開放催生了淘寶、微信等國民級應用。今天,AI技術的普惠正在重演這一歷史。
公開數據顯示,截至2024年11月,文心一言用戶規模為4.3億,文心大模型日均調用量超過15億次。當文心一言的API接口向所有開發者敞開時,一個“AI原生應用”的爆發期已然臨近,當技術門檻消失時,創新將呈指數級涌現。
免費和開源背后,百度的戰略意圖清晰可見:以AI為紐帶,構建一個涵蓋開發者、企業用戶、個人消費者的超級生態。
一方面,通過免費、開源開放吸引開發者,開發者創造應用吸引用戶,用戶數據反哺模型優化,最終形成自我強化的生態閉環。
百度官方數據顯示,截至11月,飛槳文心生態已凝聚1808萬開發者,已服務43萬家企事業單位,已創建101萬個模型。
當AI從少數企業的“護城河”變為全社會的“基礎設施”,其價值創造方式將發生根本性轉變——技術優勢不再體現于模型參數的多寡,而在于能否激發千萬開發者的創造力。
這種模式下,屬于大模型企業的商業成功不再取決于短期利潤,而在于能否構建可持續的生態價值網絡。免費及開源后,百度既是技術提供者,更是生態規則制定者。
另一方面,在C端,截至第三季度,百度App月活用戶達7.04億。當更多的用戶習慣用文心一言寫周報、做PPT、開網店時,百度就把守住了下一代互聯網的入口。
文心一言在 C 端獲得更廣泛的應用,不僅會改變用戶的工作與生活方式,提高效率,還能為百度積累了海量的用戶數據與使用場景,進一步鞏固了其在 AI 領域的領先地位,為其生態發展注入動力。
技術平權也是AI時代的生存法則。回看歷史,每一次“免費革命”都伴隨著市場激烈的競爭:今天的AI免費大戰,同樣也是生態位爭奪戰的前奏。
當OpenAI和谷歌競相選擇開放,DeepSeek掀起波瀾時,市場爭奪的不僅是用戶,更是未來AI標準的話語權。百度選擇此時全面免費和開源,是對市場競爭的直接回應。在這場科技變革的盛宴中,掌握生態主導權的企業,將定義下一個十年的技術規則。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.