文|周鑫雨
編輯|蘇建勛
如今,模型的發(fā)展已經(jīng)成了應(yīng)用開發(fā)者的一把雙刃劍。一方面,模型能力的增強(qiáng),給場(chǎng)景落地帶來更多的可能;另一方面,應(yīng)用的能力,也隨時(shí)可能被模型能力本身淘汰。
什么樣的應(yīng)用不會(huì)過時(shí)?
2025年4月25日,百度Create大會(huì)上,百度集團(tuán)創(chuàng)始人、董事長兼CEO李彥宏的答案是:“你只要找對(duì)場(chǎng)景,選對(duì)基礎(chǔ)模型,有時(shí)候可能還要學(xué)一點(diǎn)調(diào)模型的方法,那么在這個(gè)基礎(chǔ)上做出來的應(yīng)用,它是不會(huì)過時(shí)的,應(yīng)用才是真正創(chuàng)造價(jià)值的。”
在應(yīng)用層,李彥宏認(rèn)為2025年以來最令人激動(dòng)的突破性的應(yīng)用,是數(shù)字人和Agent。
賣數(shù)字人,是百度布局電商業(yè)務(wù)的重要一環(huán)。在會(huì)上,李彥宏發(fā)布了最新的數(shù)字人能力:高說服力數(shù)字人。除了更加擬人,“高說服力數(shù)字人”的特點(diǎn),是可以感知直播間環(huán)境,并智能做出發(fā)紅包、換品等決策。
百度在應(yīng)用層的另一個(gè)布局重點(diǎn),是Agent。
一年前,李彥宏曾表示,AI Coding是他最看好的應(yīng)用方向。目前,百度在代碼智能體領(lǐng)域已經(jīng)做了較為完整的布局,有面向?qū)I(yè)工程師的編程工具Comate,面向普通人的無代碼編程工具“秒噠”。
而面向通用場(chǎng)景,前有Manus邀請(qǐng)碼“一碼難求”,百度也快馬跟上,趁Manus收費(fèi)之際,推出了一款移動(dòng)端的Agent應(yīng)用“心響”。
在模型層,DeepSeek是繞不過去的競(jìng)爭對(duì)手。
“DeepSeek不是萬能的。”李彥宏開門見山,“DeepSeek不支持多模態(tài)理解,有幻覺,更重要的是,慢和貴。”
對(duì)著DeepSeek的“短板”打,百度在Create發(fā)布了新模型:文心大模型4.5 Turbo和X1 Turbo,主打多模態(tài),強(qiáng)推理,低成本。尤其是成本,4.5 Turbo的成本,是DeepSeek V3的40%,X1 Turbo的成本,是DeepSeek的25%。
最后,百度將自己的野心,也放到了AI應(yīng)用生態(tài)的建立上。
一方面,百度搜索推出了開放平臺(tái),邀請(qǐng)應(yīng)用開發(fā)者給予搜索生態(tài)開發(fā)AI應(yīng)用;另一方面,百度對(duì)Anthropic發(fā)布的Agent協(xié)議MCP,進(jìn)行了支持——這意味著,支持MCP的模型、外部工具和數(shù)據(jù)庫之間,將能夠暢通無阻的交互。
百度的“App版Manus”發(fā)布了
2025年3月6日發(fā)布的Agent應(yīng)用Manus,又讓AI Agent成為各家搶灘的應(yīng)用高地。
4月22日,大會(huì)三天前,百度的首款獨(dú)立Agent應(yīng)用,已經(jīng)上架了安卓應(yīng)用商店。這款名為“心響”的App,形式可以簡單理解為百度將Manus的移動(dòng)端版本做了一遍。
用戶只需在“心響”App中輸入自己的需求,Agent就能對(duì)任務(wù)進(jìn)行執(zhí)行和交付。
“心響”制作繪本。來源:百度
此前,據(jù)百度智能體業(yè)務(wù)首席架構(gòu)師、心響App負(fù)責(zé)人黃際洲介紹,“心響”的實(shí)現(xiàn),背靠的是百度提出的Agent Use協(xié)議。此前,Anthropic提出的Agent協(xié)議MCP,針對(duì)的是工具的調(diào)用。
而“心響”采用的是對(duì)智能體的調(diào)用。根據(jù)用戶的需求,“心響”的主智能體,能根據(jù)任務(wù),調(diào)度第三方和百度自己的智能體,實(shí)現(xiàn)任務(wù)的執(zhí)行和交付。
重建用戶心智,在心響App產(chǎn)品經(jīng)理黎宇昕看來,是百度做Agent產(chǎn)品時(shí)遇到的最大難點(diǎn)。
在媒體溝通會(huì)上,他提到,百度之前用搜索建立的用戶心智,是及時(shí)交付。這意味著,AI應(yīng)用“一定會(huì)折損效果,比如通過緩存的方式,去降模型調(diào)用的次數(shù)等等”——這也是市面上大多強(qiáng)調(diào)及時(shí)交付的Agent產(chǎn)品,無法實(shí)現(xiàn)高質(zhì)交付的原因。
黎雨昕認(rèn)為,“心響”要重新建立的,是托管心智。與Manus的任務(wù)可視面板類似,“心響”在任務(wù)執(zhí)行過程中,也采用了分析流的形式,將任務(wù)執(zhí)行的過程和時(shí)間,呈現(xiàn)給用戶。
目前,心響已經(jīng)支持包括200種類型的任務(wù),覆蓋了工作、學(xué)習(xí)、生活的主要場(chǎng)景,比如試題講解、旅游、相親、問診、法律咨詢。
黃際洲透露,未來,“心響”計(jì)劃將支持的任務(wù)類型擴(kuò)展到10萬+以上。與此同時(shí),“心響”PC端也正在研發(fā)中。
會(huì)畫畫的新推理模型,成本僅DeepSeek的25%
百度新發(fā)布的模型文心4.5 Turbo和X1 Turbo,相較于DeepSeek V3和R1的優(yōu)勢(shì),除了整體性能的超越,主要在于多模態(tài)能力和低成本。
文心4.5 Turbo性能測(cè)評(píng)。來源:百度
文心X1 Turbo性能測(cè)評(píng)。來源:百度
其中,李彥宏強(qiáng)調(diào)了多模態(tài)理解的能力。他認(rèn)為,多模態(tài)是未來基礎(chǔ)模型的標(biāo)配,“純文本模型的市場(chǎng)會(huì)越來越小,多模態(tài)的市場(chǎng)會(huì)越來越大”。
文心4.5 Turbo和X1 Turbo,都對(duì)圖像和視頻理解進(jìn)行了支持。
比如,輸入一張高糊的球賽照片,文心4.5 Turbo能通過周邊的廣告牌、球員動(dòng)作等元素,識(shí)別出這是1986年墨西哥的世界杯足球賽上,阿根廷與英格蘭的決賽。
文心4.5 Turbo的圖像理解能力。
除了多模態(tài)理解,兩個(gè)模型也支持多模態(tài)生成。
比如,在文心X1 Turbo中輸入“聽說武漢有種東西叫‘蒜鳥’,請(qǐng)你把它畫出來”,X1 Turbo就能根據(jù)聯(lián)網(wǎng)搜索到的信息,生成蒜鳥的卡通形象。
至于價(jià)格,文心4.5Turbo價(jià)格僅為文心4.5的20%、DeepSeek V3的40%,每百萬token的輸入價(jià)格為0.8元,輸出價(jià)格3.2元;X1 Turbo的價(jià)格僅為DeepSeek-R1的25%,每百萬token輸入價(jià)格1元,輸出價(jià)格4元。
百度電商,做上游“賣水人”
AI重燃了百度對(duì)電商信心。
自2023年5月在百度App上線“百度優(yōu)選”入口以來,百度對(duì)電商的定位,不是和淘寶、京東這些規(guī)模化的貨架電商競(jìng)爭。
百度副總裁、百度電商總經(jīng)理平曉黎表示,百度電商有兩個(gè)定位,一方面,是構(gòu)成百度App服務(wù)的一環(huán),滿足搜索用戶的消費(fèi)需求;另一方面,是用智能工具服務(wù),成為電商的上游“賣水人”。
數(shù)字人,就是百度電商賣的水。此次百度發(fā)布的“高說服力數(shù)字人”,除了在擬人、成本、風(fēng)格等層面有所優(yōu)化,最重要的是能夠?qū)χ辈ラg環(huán)境進(jìn)行感知,并作出實(shí)時(shí)的互動(dòng),避免了傳統(tǒng)數(shù)字人循環(huán)播放的尷尬局面。
比如,比如滿50萬人觀看,就給觀眾發(fā)紅包;根據(jù)直播間用戶的問題,靈活調(diào)度PPT、切換素材。
“高說服力數(shù)字人”。來源:百度
實(shí)時(shí)互動(dòng)背后的技術(shù),是多智能體調(diào)度能力。據(jù)平曉黎介紹,高說服力數(shù)字人背后,有主播專家、運(yùn)營專家、場(chǎng)控專家等多個(gè)角色智能體,能夠根據(jù)直播間實(shí)時(shí)熱度和轉(zhuǎn)化情況,靈活調(diào)度。
AI月活超9700萬的文庫,想打模型組合拳
整合了百度網(wǎng)盤的文庫,交出了半年答卷:付費(fèi)用戶數(shù)超4000萬,月活超9700萬。
在百度內(nèi)部,百度文庫是模型能力應(yīng)用的尖子生。此前,百度副總裁、百度文庫兼百度網(wǎng)盤負(fù)責(zé)人王穎告訴《智能涌現(xiàn)》,文庫是最早自研MoE(混合專家模型)架構(gòu)的AI應(yīng)用。
當(dāng)下,采用多模型組合的底座,已經(jīng)成為AI應(yīng)用的基操。李彥宏認(rèn)為,應(yīng)用對(duì)模型的組合使用,是普遍的現(xiàn)象,但如何組合、如何調(diào)用,仍然是一門技術(shù)活。
為此,百度文庫和網(wǎng)盤推出了一個(gè)技術(shù)底座:滄舟OS。
滄舟OS。
為了實(shí)現(xiàn)不同模型對(duì)不同內(nèi)容的理解和生成,這個(gè)底座,主要分成兩層:
第一層,Chatfile Plus。其能夠?qū)Σ煌B(tài)、不同形態(tài)、不同格式的內(nèi)容進(jìn)行“向量化處理”,也就是將不同內(nèi)容翻譯成大模型能看得懂的向量化Token,在進(jìn)行混合生成。
第二層,三庫+三器,也就是“公域知識(shí)庫、私域知識(shí)庫,記憶庫”,以及“編輯器、閱讀器和播放器”。這一套系統(tǒng),可以根據(jù)用戶的需求,被大模型來組合調(diào)用。
基于這一套OS,百度網(wǎng)盤發(fā)布了新功能,AI筆記。
在百度文庫看來,用戶學(xué)習(xí)的一個(gè)痛點(diǎn),是筆記內(nèi)容與原始學(xué)習(xí)資料之間缺乏關(guān)聯(lián)。比如用戶根據(jù)筆記復(fù)習(xí)時(shí),需要再花一番功夫,去尋找文本、視頻、圖片等資料。
AI筆記的核心功能,是時(shí)間溯源和多模態(tài)整理。比如,根據(jù)百度網(wǎng)盤中保存的視頻講解,AI筆記可以基于對(duì)內(nèi)容的理解,梳理整個(gè)視頻的邏輯結(jié)構(gòu)和行文順序,并生成思維導(dǎo)圖。
導(dǎo)圖中,每個(gè)知識(shí)點(diǎn)帶的時(shí)間戳,都直接溯源到視頻的相應(yīng)節(jié)點(diǎn)。
百度網(wǎng)盤的“AI筆記”功能。
MCP,百度也接上了“AI萬能插座”
MCP,是美國模型廠商Anthropic推出的Agent協(xié)議。
就像秦統(tǒng)一了貨幣,協(xié)議的作用,就是統(tǒng)一了軟件之間的開發(fā)標(biāo)準(zhǔn)。支持MCP協(xié)議的軟件之間,也可以更為靈活的適配、相互調(diào)用。比如,不少金融公司采用MCP,讓AI更好地理解金融數(shù)據(jù)的上下文。
支持MCP,也成了廠商吸引更多第三方應(yīng)用入駐、建立AI生態(tài)的一場(chǎng)“暗戰(zhàn)”。比如,阿里云的AI開發(fā)平臺(tái)“百煉”上線了MCP服務(wù),騰訊云也宣布大模型知識(shí)引擎支持MCP協(xié)議。
在李彥宏看來,MCP就像給AI裝上了一個(gè)萬能插座,能夠提高不同AI軟件適配、開發(fā)、整合維護(hù)的效率。對(duì)于需要自由調(diào)用工具的Agent而言,MCP的出現(xiàn)尤為重要,這意味著Agent可以自由調(diào)用支持MCP的第三方工具。
目前,百度智能云大模型平臺(tái)“千帆”兼容了MCP,百度搜索也構(gòu)建了MCP Server的索引平臺(tái),文心快碼、百度電商、地圖、網(wǎng)盤、文庫等應(yīng)用,也通過MCP Server的形式,對(duì)外提供了能力。
歡迎交流!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.