出品|虎嗅科技組
作者|房曉楠
編輯|苗正卿
頭圖|視覺中國
4月25日,在Create2025百度AI開發(fā)者大會(huì)上,百度發(fā)布了文心大模型4.5 Turbo和深度思考模型X1 Turbo兩款新模型。較之文心4.5,文心4.5 Turbo速度更快,價(jià)格下降80%。
其實(shí)此次距離文心4.5和文心X1的發(fā)布才剛剛過去一個(gè)多月,模型短期內(nèi)多次迭代,與之相對(duì)應(yīng)的“應(yīng)用”價(jià)值是否會(huì)被覆蓋?創(chuàng)始人李彥宏的看法是,找對(duì)場景、選對(duì)基礎(chǔ)模型、會(huì)調(diào)模型,做出來的應(yīng)用就不會(huì)過時(shí)。
李彥宏演講中多次提到應(yīng)用,甚至斷言,“模型有很多,但統(tǒng)治這個(gè)世界的是應(yīng)用。”
此次,百度也發(fā)布了多款A(yù)I應(yīng)用產(chǎn)品,包括一款官方定位為通用超級(jí)智能體的心響App。
據(jù)研發(fā)團(tuán)隊(duì)透露,這款產(chǎn)品是一支95后年輕團(tuán)隊(duì)在30天左右交付的結(jié)果,而正式開發(fā)是在3月18日。從時(shí)間推斷,這個(gè)時(shí)間距離Manus亮相過去12天。
智能體來勢洶洶。如果說去年關(guān)于大模型的落地應(yīng)用還是處于懸而未決的試探階段,那3月初Manus的爆火,直接給出了一個(gè)明確而具體的答案,應(yīng)用是未來,AI智能體的喧鬧前奏已經(jīng)響起。
不管是對(duì)于大廠,還是初創(chuàng)企業(yè)來說,DeepSeek式的沖擊與帶來的措手不及,一次就好。這次,必須快速響應(yīng)。像是字節(jié),據(jù)媒體報(bào)道,在Manus出現(xiàn)前后,內(nèi)部大概有7個(gè)團(tuán)隊(duì)在開發(fā)不同的智能體產(chǎn)品。
如今,初創(chuàng)企業(yè)中Genpark發(fā)布了Super Agent,大廠中的字節(jié)和百度相繼推出新品,其他玩家也在蓄勢待發(fā)。這一年,注定是AI智能體喧嘩熱鬧的一年。
在心響App正式發(fā)布前,虎嗅等媒體事先進(jìn)行了產(chǎn)品體驗(yàn),同時(shí)也與百度智能體業(yè)務(wù)首席架構(gòu)師、心響App負(fù)責(zé)人黃際洲,心響App產(chǎn)品經(jīng)理黎宇昕進(jìn)行了交流,他們結(jié)合心響App的研發(fā),分享了當(dāng)下AI智能體行業(yè)發(fā)展的新思考。以下為交流實(shí)錄,部分內(nèi)容略有刪減:
提問:短期組建的團(tuán)隊(duì)要在一個(gè)月內(nèi)做出這一產(chǎn)品,為什么這么著急?是老板給定的deadline,為的是搶占行業(yè)時(shí)機(jī)節(jié)點(diǎn)?
黃際洲:我們沒有非要趕某個(gè)時(shí)間節(jié)點(diǎn),老板也沒有給我們下目標(biāo)(笑),我們就是想發(fā)一個(gè)現(xiàn)貨。
AI智能體的摩爾定律是,每隔7個(gè)月AI智能體能完成的最長任務(wù)時(shí)長會(huì)翻番,設(shè)想一下如果按部研發(fā)、迭代,那等到呈現(xiàn)給大家用時(shí),已經(jīng)過時(shí)了。所以每一個(gè)節(jié)點(diǎn),我們會(huì)逼著自己做一個(gè)(產(chǎn)品)發(fā)布。
提問:目前心響只有App,將來會(huì)出PC端嗎?
黃際洲:會(huì)的。PC端在計(jì)劃中,包括大家可能想要的上傳文件、輸入Excel表格輸出圖表、做分析、與Word聯(lián)動(dòng)等功能,都會(huì)有的。
提問:據(jù)了解,Manus這一智能體產(chǎn)品也在海外上線了App端,你認(rèn)為PC端與App端智能體的不同點(diǎn)在哪?
黃際洲:首先,第一個(gè)不同也是最大的難點(diǎn)是,不是技術(shù)上實(shí)現(xiàn)不了,而是手機(jī)屏幕實(shí)在太小了,如果想讓用戶看清楚某個(gè)東西,或者進(jìn)行快速交互時(shí),不是件容易的事情。反之,PC端的屏幕大,但大也會(huì)帶來問題,就是如何高效利用起來,高效交互。
第二是,在PC端可以非常方便地去打開各種生產(chǎn)力工具,比如Excel和Word,但在移動(dòng)端想傳一個(gè)文件難度很大,快速填表、填數(shù)據(jù)等在PC端很容易實(shí)現(xiàn)的事情,在移動(dòng)端不容易實(shí)現(xiàn)。
黎宇昕:當(dāng)然,兩者技術(shù)上有更多的相通性,我們可以用多智能體協(xié)同的Pipeline去實(shí)現(xiàn)這個(gè)功能。PC端更多傾向于辦公場景,比如PPT,我們確實(shí)有生成PPT的功能,但是在手機(jī)播放PPT也太雞肋了,但在PC端就會(huì)相對(duì)輕松,文案一鍵編輯、自動(dòng)改編、填表、寫文檔等都可以。
提問:當(dāng)前的通用智能體或者超級(jí)應(yīng)用,都是多智能體協(xié)同操作,過程中的技術(shù)難點(diǎn)在哪?
黃際洲:首先,最大的問題在于很多時(shí)候想去接入很多東西,而MCP協(xié)議的出現(xiàn)解決了這一問題,讓大家能更快地接入。但到目前為止業(yè)界比較大的問題在于,大家都想獲得但很少去做貢獻(xiàn),免費(fèi)好用的工具實(shí)在太少了。可以算一個(gè)數(shù)字,把Tool Use做成MCP給到別人,乘以1000是很小的成本,但如果乘以10萬、100萬、1000萬、1億,那很難扛得住這個(gè)成本,所以我們想要構(gòu)建廣泛的生態(tài),呼吁更多的開發(fā)者一同來做,這是一個(gè)所有人都受益的事情。
第二個(gè)問題是,要實(shí)現(xiàn)多模態(tài)工具間的使用,比如Agent Use,必須要有很強(qiáng)的協(xié)議。舉個(gè)例子,平時(shí)工作中做(產(chǎn)品)開發(fā)會(huì)有PM、PE、FE各種各樣的研發(fā),承擔(dān)不同的角色,彼此知識(shí)背景、專業(yè)術(shù)語不一樣,說的話很難互相理解,頻率不同接收的信息就有折損。智能體也一樣,各個(gè)子智能體之間的互動(dòng)和信息傳遞要盡可能做到無損,所以需要設(shè)計(jì)很好的協(xié)議和交互方式,能夠把它協(xié)同起來。
第三個(gè)問題是大模型產(chǎn)品的“不可能三角”(虎嗅注:“不可能三角”國際經(jīng)濟(jì)學(xué)的一個(gè)著名理論,簡單來說是指如果一件事情同時(shí)存在三個(gè)要素,三者不可都得),以搜索為例,大家已經(jīng)養(yǎng)成的搜索習(xí)慣是輸入一個(gè)詞很快就返回答案,這是我們對(duì)搜索的心智。而對(duì)任務(wù)心智來講,你要的是一個(gè)精準(zhǔn)替你完成任務(wù)的管家,智能體產(chǎn)品能幫你完成任務(wù)、交付很好的結(jié)果。但在當(dāng)下的技術(shù)發(fā)展趨勢下,很難讓它短時(shí)間內(nèi)給到你最終任務(wù)結(jié)果,所以要做出(時(shí)間)犧牲。
提問:目前心響上各個(gè)場景中的智能體,都是百度自己開發(fā)的,還是外部接入?
黃際洲:我們很難把智能體開發(fā)得超過很多專業(yè)玩家。比如AI繪本,是接的百度文庫的AI繪本功能,為了做到免費(fèi),我們向百度文庫爭取到了最大權(quán)益。健康也是如此,引入的是第三方。未來,我們想要構(gòu)建開放生態(tài),只要是市面上好的體驗(yàn)、做得比我們好、愿意被我們接入或者愿意接入我們,都可以接進(jìn)來。
提問:當(dāng)前越來越多的大廠開始接受MCP,未來智能體可能會(huì)變成紅海賽道,競爭激烈。像是前段時(shí)間支付寶的百寶箱開了支付MCP Server協(xié)議。那百度在智能體競爭中,想怎么做?
黃際洲:MCP是個(gè)通用協(xié)議,只要大家遵循這個(gè)協(xié)議,開發(fā)者就不需要為A、B、C、D各開發(fā)一份,省時(shí)省力。而對(duì)于接入方來講,遵循這一協(xié)議以后,可以很方便地接入,不需要再充分對(duì)接。
對(duì)我們來講,現(xiàn)在是這樣,如果某一東西(功能)是我們內(nèi)部開發(fā)的,那有比MCP更高效的協(xié)議,從而保證更快接入(心響)。我們既支持自己獨(dú)有的協(xié)議,也會(huì)把MCP接進(jìn)來,這是一個(gè)原則。
當(dāng)前實(shí)踐告訴我們,優(yōu)質(zhì)的MCP是稀缺的,因?yàn)樗懔苜F。我做這么好的服務(wù),不可能免費(fèi)接入,我要構(gòu)建起商業(yè)模式。但用戶想白嫖,我們也想白嫖,開發(fā)者就被白嫖死了,無法養(yǎng)家糊口。所以未來是有一個(gè)供需之間的GAP存在,而最終生態(tài)的繁榮一定是能把商業(yè)模式跑通的繁榮。開發(fā)者能掙到錢,我們能掙到錢,需求越做越大,給大家提供越來越好的體驗(yàn)。當(dāng)前,我們只專注于給用戶提供極致的通用超級(jí)智能體產(chǎn)品體驗(yàn)。
提問:現(xiàn)在大家都在說超級(jí)智能體或超級(jí)應(yīng)用,你認(rèn)為最終的交互方式該是怎樣的?
黃際洲:對(duì)于這一問題,我們也一直在思考。
關(guān)于交互方式,如果把用戶千奇百怪的輸入和不同的交互方式(語音、文字等)整合在一個(gè)產(chǎn)品里,這對(duì)于交互的要求超高,在完成不同任務(wù)時(shí),也很難。所以我們一直強(qiáng)調(diào)一個(gè)很簡單的輸入,目標(biāo)就是消滅復(fù)雜的prompt,但這很難一下子做到,所以我們嘗試從極簡化用戶需要輸入的東西開始,比如做城市攻略,用戶輸入“哈爾濱旅游攻略”就足夠了,剩下的事情智能體會(huì)一步步幫你細(xì)化和完善,最后給出一個(gè)成品。
本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4282325.html?f=wyxwapp
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.