網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

李彥宏：便宜已經(jīng)不是DeepSeek的優(yōu)勢(shì)了

2025-04-25 21:36:11　來源: 36氪

北京舉報(bào)

分享至

文｜周鑫雨

編輯｜蘇建勛

如今，模型的發(fā)展已經(jīng)成了應(yīng)用開發(fā)者的一把雙刃劍。一方面，模型能力的增強(qiáng)，給場(chǎng)景落地帶來更多的可能；另一方面，應(yīng)用的能力，也隨時(shí)可能被模型能力本身淘汰。

什么樣的應(yīng)用不會(huì)過時(shí)？

2025年4月25日，百度Create大會(huì)上，百度集團(tuán)創(chuàng)始人、董事長兼CEO李彥宏的答案是：“你只要找對(duì)場(chǎng)景，選對(duì)基礎(chǔ)模型，有時(shí)候可能還要學(xué)一點(diǎn)調(diào)模型的方法，那么在這個(gè)基礎(chǔ)上做出來的應(yīng)用，它是不會(huì)過時(shí)的，應(yīng)用才是真正創(chuàng)造價(jià)值的。”

在應(yīng)用層，李彥宏認(rèn)為2025年以來最令人激動(dòng)的突破性的應(yīng)用，是數(shù)字人和Agent。

賣數(shù)字人，是百度布局電商業(yè)務(wù)的重要一環(huán)。在會(huì)上，李彥宏發(fā)布了最新的數(shù)字人能力：高說服力數(shù)字人。除了更加擬人，“高說服力數(shù)字人”的特點(diǎn)，是可以感知直播間環(huán)境，并智能做出發(fā)紅包、換品等決策。

百度在應(yīng)用層的另一個(gè)布局重點(diǎn)，是Agent。

一年前，李彥宏曾表示，AI Coding是他最看好的應(yīng)用方向。目前，百度在代碼智能體領(lǐng)域已經(jīng)做了較為完整的布局，有面向?qū)I(yè)工程師的編程工具Comate，面向普通人的無代碼編程工具“秒噠”。

而面向通用場(chǎng)景，前有Manus邀請(qǐng)碼“一碼難求”，百度也快馬跟上，趁Manus收費(fèi)之際，推出了一款移動(dòng)端的Agent應(yīng)用“心響”。

在模型層，DeepSeek是繞不過去的競(jìng)爭對(duì)手。

“DeepSeek不是萬能的。”李彥宏開門見山，“DeepSeek不支持多模態(tài)理解，有幻覺，更重要的是，慢和貴。”

對(duì)著DeepSeek的“短板”打，百度在Create發(fā)布了新模型：文心大模型4.5 Turbo和X1 Turbo，主打多模態(tài)，強(qiáng)推理，低成本。尤其是成本，4.5 Turbo的成本，是DeepSeek V3的40%，X1 Turbo的成本，是DeepSeek的25%。

最后，百度將自己的野心，也放到了AI應(yīng)用生態(tài)的建立上。

一方面，百度搜索推出了開放平臺(tái)，邀請(qǐng)應(yīng)用開發(fā)者給予搜索生態(tài)開發(fā)AI應(yīng)用；另一方面，百度對(duì)Anthropic發(fā)布的Agent協(xié)議MCP，進(jìn)行了支持——這意味著，支持MCP的模型、外部工具和數(shù)據(jù)庫之間，將能夠暢通無阻的交互。

百度的“App版Manus”發(fā)布了

2025年3月6日發(fā)布的Agent應(yīng)用Manus，又讓AI Agent成為各家搶灘的應(yīng)用高地。

4月22日，大會(huì)三天前，百度的首款獨(dú)立Agent應(yīng)用，已經(jīng)上架了安卓應(yīng)用商店。這款名為“心響”的App，形式可以簡單理解為百度將Manus的移動(dòng)端版本做了一遍。

用戶只需在“心響”App中輸入自己的需求，Agent就能對(duì)任務(wù)進(jìn)行執(zhí)行和交付。

“心響”制作繪本。來源：百度

此前，據(jù)百度智能體業(yè)務(wù)首席架構(gòu)師、心響App負(fù)責(zé)人黃際洲介紹，“心響”的實(shí)現(xiàn)，背靠的是百度提出的Agent Use協(xié)議。此前，Anthropic提出的Agent協(xié)議MCP，針對(duì)的是工具的調(diào)用。

而“心響”采用的是對(duì)智能體的調(diào)用。根據(jù)用戶的需求，“心響”的主智能體，能根據(jù)任務(wù)，調(diào)度第三方和百度自己的智能體，實(shí)現(xiàn)任務(wù)的執(zhí)行和交付。

重建用戶心智，在心響App產(chǎn)品經(jīng)理黎宇昕看來，是百度做Agent產(chǎn)品時(shí)遇到的最大難點(diǎn)。

在媒體溝通會(huì)上，他提到，百度之前用搜索建立的用戶心智，是及時(shí)交付。這意味著，AI應(yīng)用“一定會(huì)折損效果，比如通過緩存的方式，去降模型調(diào)用的次數(shù)等等”——這也是市面上大多強(qiáng)調(diào)及時(shí)交付的Agent產(chǎn)品，無法實(shí)現(xiàn)高質(zhì)交付的原因。

黎雨昕認(rèn)為，“心響”要重新建立的，是托管心智。與Manus的任務(wù)可視面板類似，“心響”在任務(wù)執(zhí)行過程中，也采用了分析流的形式，將任務(wù)執(zhí)行的過程和時(shí)間，呈現(xiàn)給用戶。

目前，心響已經(jīng)支持包括200種類型的任務(wù)，覆蓋了工作、學(xué)習(xí)、生活的主要場(chǎng)景，比如試題講解、旅游、相親、問診、法律咨詢。

黃際洲透露，未來，“心響”計(jì)劃將支持的任務(wù)類型擴(kuò)展到10萬+以上。與此同時(shí)，“心響”PC端也正在研發(fā)中。

會(huì)畫畫的新推理模型，成本僅DeepSeek的25%

百度新發(fā)布的模型文心4.5 Turbo和X1 Turbo，相較于DeepSeek V3和R1的優(yōu)勢(shì)，除了整體性能的超越，主要在于多模態(tài)能力和低成本。

文心4.5 Turbo性能測(cè)評(píng)。來源：百度

文心X1 Turbo性能測(cè)評(píng)。來源：百度

其中，李彥宏強(qiáng)調(diào)了多模態(tài)理解的能力。他認(rèn)為，多模態(tài)是未來基礎(chǔ)模型的標(biāo)配，“純文本模型的市場(chǎng)會(huì)越來越小，多模態(tài)的市場(chǎng)會(huì)越來越大”。

文心4.5 Turbo和X1 Turbo，都對(duì)圖像和視頻理解進(jìn)行了支持。

比如，輸入一張高糊的球賽照片，文心4.5 Turbo能通過周邊的廣告牌、球員動(dòng)作等元素，識(shí)別出這是1986年墨西哥的世界杯足球賽上，阿根廷與英格蘭的決賽。

文心4.5 Turbo的圖像理解能力。

除了多模態(tài)理解，兩個(gè)模型也支持多模態(tài)生成。

比如，在文心X1 Turbo中輸入“聽說武漢有種東西叫‘蒜鳥’，請(qǐng)你把它畫出來”，X1 Turbo就能根據(jù)聯(lián)網(wǎng)搜索到的信息，生成蒜鳥的卡通形象。

至于價(jià)格，文心4.5Turbo價(jià)格僅為文心4.5的20%、DeepSeek V3的40%，每百萬token的輸入價(jià)格為0.8元，輸出價(jià)格3.2元；X1 Turbo的價(jià)格僅為DeepSeek-R1的25%，每百萬token輸入價(jià)格1元，輸出價(jià)格4元。

百度電商，做上游“賣水人”

AI重燃了百度對(duì)電商信心。

自2023年5月在百度App上線“百度優(yōu)選”入口以來，百度對(duì)電商的定位，不是和淘寶、京東這些規(guī)模化的貨架電商競(jìng)爭。

百度副總裁、百度電商總經(jīng)理平曉黎表示，百度電商有兩個(gè)定位，一方面，是構(gòu)成百度App服務(wù)的一環(huán)，滿足搜索用戶的消費(fèi)需求；另一方面，是用智能工具服務(wù)，成為電商的上游“賣水人”。

數(shù)字人，就是百度電商賣的水。此次百度發(fā)布的“高說服力數(shù)字人”，除了在擬人、成本、風(fēng)格等層面有所優(yōu)化，最重要的是能夠?qū)χ辈ラg環(huán)境進(jìn)行感知，并作出實(shí)時(shí)的互動(dòng)，避免了傳統(tǒng)數(shù)字人循環(huán)播放的尷尬局面。

比如，比如滿50萬人觀看，就給觀眾發(fā)紅包；根據(jù)直播間用戶的問題，靈活調(diào)度PPT、切換素材。

“高說服力數(shù)字人”。來源：百度

實(shí)時(shí)互動(dòng)背后的技術(shù)，是多智能體調(diào)度能力。據(jù)平曉黎介紹，高說服力數(shù)字人背后，有主播專家、運(yùn)營專家、場(chǎng)控專家等多個(gè)角色智能體，能夠根據(jù)直播間實(shí)時(shí)熱度和轉(zhuǎn)化情況，靈活調(diào)度。

AI月活超9700萬的文庫，想打模型組合拳

整合了百度網(wǎng)盤的文庫，交出了半年答卷：付費(fèi)用戶數(shù)超4000萬，月活超9700萬。

在百度內(nèi)部，百度文庫是模型能力應(yīng)用的尖子生。此前，百度副總裁、百度文庫兼百度網(wǎng)盤負(fù)責(zé)人王穎告訴《智能涌現(xiàn)》，文庫是最早自研MoE（混合專家模型）架構(gòu)的AI應(yīng)用。

當(dāng)下，采用多模型組合的底座，已經(jīng)成為AI應(yīng)用的基操。李彥宏認(rèn)為，應(yīng)用對(duì)模型的組合使用，是普遍的現(xiàn)象，但如何組合、如何調(diào)用，仍然是一門技術(shù)活。

為此，百度文庫和網(wǎng)盤推出了一個(gè)技術(shù)底座：滄舟OS。

滄舟OS。

為了實(shí)現(xiàn)不同模型對(duì)不同內(nèi)容的理解和生成，這個(gè)底座，主要分成兩層：

第一層，Chatfile Plus。其能夠?qū)Σ煌B(tài)、不同形態(tài)、不同格式的內(nèi)容進(jìn)行“向量化處理”，也就是將不同內(nèi)容翻譯成大模型能看得懂的向量化Token，在進(jìn)行混合生成。

第二層，三庫+三器，也就是“公域知識(shí)庫、私域知識(shí)庫，記憶庫”，以及“編輯器、閱讀器和播放器”。這一套系統(tǒng)，可以根據(jù)用戶的需求，被大模型來組合調(diào)用。

基于這一套OS，百度網(wǎng)盤發(fā)布了新功能，AI筆記。

在百度文庫看來，用戶學(xué)習(xí)的一個(gè)痛點(diǎn)，是筆記內(nèi)容與原始學(xué)習(xí)資料之間缺乏關(guān)聯(lián)。比如用戶根據(jù)筆記復(fù)習(xí)時(shí)，需要再花一番功夫，去尋找文本、視頻、圖片等資料。

AI筆記的核心功能，是時(shí)間溯源和多模態(tài)整理。比如，根據(jù)百度網(wǎng)盤中保存的視頻講解，AI筆記可以基于對(duì)內(nèi)容的理解，梳理整個(gè)視頻的邏輯結(jié)構(gòu)和行文順序，并生成思維導(dǎo)圖。

導(dǎo)圖中，每個(gè)知識(shí)點(diǎn)帶的時(shí)間戳，都直接溯源到視頻的相應(yīng)節(jié)點(diǎn)。

百度網(wǎng)盤的“AI筆記”功能。

MCP，百度也接上了“AI萬能插座”

MCP，是美國模型廠商Anthropic推出的Agent協(xié)議。

就像秦統(tǒng)一了貨幣，協(xié)議的作用，就是統(tǒng)一了軟件之間的開發(fā)標(biāo)準(zhǔn)。支持MCP協(xié)議的軟件之間，也可以更為靈活的適配、相互調(diào)用。比如，不少金融公司采用MCP，讓AI更好地理解金融數(shù)據(jù)的上下文。

支持MCP，也成了廠商吸引更多第三方應(yīng)用入駐、建立AI生態(tài)的一場(chǎng)“暗戰(zhàn)”。比如，阿里云的AI開發(fā)平臺(tái)“百煉”上線了MCP服務(wù)，騰訊云也宣布大模型知識(shí)引擎支持MCP協(xié)議。

在李彥宏看來，MCP就像給AI裝上了一個(gè)萬能插座，能夠提高不同AI軟件適配、開發(fā)、整合維護(hù)的效率。對(duì)于需要自由調(diào)用工具的Agent而言，MCP的出現(xiàn)尤為重要，這意味著Agent可以自由調(diào)用支持MCP的第三方工具。

目前，百度智能云大模型平臺(tái)“千帆”兼容了MCP，百度搜索也構(gòu)建了MCP Server的索引平臺(tái)，文心快碼、百度電商、地圖、網(wǎng)盤、文庫等應(yīng)用，也通過MCP Server的形式，對(duì)外提供了能力。

歡迎交流！

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.