DeepSeek 推崇的開源策略,不僅對「AI 六小龍」造成了不小沖擊,也讓百度等老牌巨頭感受到了實實在在的壓力。
但轉身的百度,正逐漸展現出強勁的反擊姿態。
繼宣布「文心大模型 4.5 系列」將于 6 月 30 日正式開源后,已經發布多款新品的百度,今天在面向開發者的 Create 大會重磅推出兩款全新模型:文心 4.5 Turbo 和深度思考模型 X1 Turbo。
既然冠以 Turbo 之名,那這兩款模型能力自然在性能上全面進階,主打多模態、強推理和低成本。百度旗下新搜索智能助手文小言也宣布全面接入,免費向用戶開放,即日起用戶打開文小言 APP 即可使用。
會上,百度創始人李彥宏明確指出:「多模態將成為未來基礎模型的標配,純文本模型的市場會越變越小,多模態模型的市場會越來越大」。
「當然 DeepSeek 也不是萬能的。比如它只能處理文本,還不能理解和生成圖片、音頻、視頻等多媒體內容,」李彥宏認為「它更大的問題是慢和貴,中國市場上絕大多數的大模型 API調用價格都比 DeepSeek 滿血版要低,速度要更快。」
在他看來,今天隆重發布的文心大模型的 4.5 Turbo 和 X1 Turbo 正是要解決這些問題。
基于這一判斷,文心大模型 4.5 Turbo 進一步強化了多模態能力。在多個基準測試集中,文心 4.5 Turbo 多模態能力已與 GPT-4.1 持平,甚至在部分維度優于 GPT-4o。
▲文心4.5 Turbo-多模態
▲文心4.5 Turbo-文本
我們不妨測試一下文心 4.5 Turbo 的邏輯推理能力,看看它如何解答這樣一個經典問題:
「燒一根不均勻的繩要用一個小時,如何用它來判斷半個小時?燒一根不均勻的繩,從頭燒到尾總共需要1個小時。現在有若干條材質相同的繩子,問如何用燒繩的方法來計時一個小時十五分鐘呢?」
創作方面,文心 4.5 Turbo 靠譜嗎?我們也讓其創作一份孫悟空和東海龍王結拜的短劇劇本。
結果,交出的劇本不僅尊重原著核心,也注入了新的解讀。其中定海神針的擬人化是亮點,血盟儀式的設計也添加了新的維度。
而文心大模型 X1 Turbo 則在 4.5 Turbo 的基礎上進行了「深度思考」升級,性能顯著提升,內置更完整的思維鏈系統。
無論是問答能力、內容創作、邏輯推理,還是工具調用、多模態處理,X1 Turbo 均實現全方位增強,整體表現領先于 DeepSeek R1 和最新版本 V3。
上個月,我們實測了文心大模型 4.5 以及深度思考模型 X1 理解梗圖的能力,那新模型的表現如何?答案是,多模態理解能力確實更強了。
拿這張梗圖為例,相較于上一次,X1 Turbo 的理解更到位,回答也更具條理性,充分認識到這張萬能表情包背后的「友好善意」。
比如,上傳一張文物照片,讓 X1 Turbo 進行講解分析。它不僅能準確識別文物身份,還能詳細剖析其工藝特點,講解內容之細致,堪比專業博物館講解員。
亦或者,嘗試讓其生成一張空中飛機視角的圖像,畫面隨即生成,幾近真實。
▲Prompt:一個人的手指向飛機窗外,窗外的飛機機翼從側面可見。外面的天空清晰,天際線顯示出黎明或黃昏的景象。眼前是廣闊的海洋
而在大家最關心的成本方面,而百度此次也打出價格組合拳。
文心大模型 4.5 Turbo 每百萬 token 的輸入價格僅為 0.8元,輸出價格 3.2元,相比前代 4.5 降幅達 80%,只相當于 DeepSeek V3 的 40%。
而文心大模型 X1 Turbo 每百萬 token 輸入價格為 1 元,輸出為 4 元,同樣在性能提升的同時價格腰斬,僅為 DeepSeek R1 的 25%。
當天的 One More Thing 環節,百度正式點亮了國內首個全自研的三萬卡集群,可同時承載多個千億參數大模型的全量訓練,支持 1000 個客戶同時做百億參數的大模型精調,強大技術底座硬實力的背后,也意味著百度再次向行業釋放出最鮮明的信號。
此外,李彥宏在會上表示,當前開發者做 AI 應用的一大阻礙,就是大模型成本高、用不起。成本降低后,開發者和創業者們才可以放心大膽地做開發,企業才能夠低成本地部署大模型,最終推動各行各業應用的爆發。
不再將模型能力視作壁壘,而是回歸到一個產品、一個平臺應有的「性價比」邏輯上來。與其說是在卷價格,不如說是用效率降低門檻、通過開放構建生態。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.