百度創(chuàng)始人 李彥宏,圖片來(lái)自百度官方
“百度還在支棱著。”
這是一位開(kāi)發(fā)者在Create2025百度AI開(kāi)發(fā)者大會(huì)現(xiàn)場(chǎng)的感嘆。
畢竟,李彥宏還在不遺余力地在臺(tái)前為AI布道。他始終對(duì)外展示出一副訓(xùn)練有素的姿態(tài),就像一個(gè)持續(xù)穩(wěn)定輸出的AI。
Create大會(huì)是百度一年一度面向開(kāi)發(fā)者群體的技術(shù)發(fā)布和交流大會(huì)。4?25日, Create2025百度AI開(kāi)發(fā)者大會(huì)如期舉行,百度創(chuàng)始人李彥宏發(fā)表了題為《模型的世界 應(yīng)用的天下》的演講。
60分鐘的演講中,李彥宏發(fā)布了兩大模型,多款A(yù)I應(yīng)用,并宣布將幫助開(kāi)發(fā)者全面擁抱MCP。
過(guò)去一年,一面是大模型廠商卷死卷生,另一面是開(kāi)發(fā)者無(wú)所適從,不敢放心大膽做應(yīng)用,生怕一不留神,重投入的應(yīng)用,就被新出現(xiàn)的應(yīng)用取代,當(dāng)然,事實(shí)也是如此。
李彥宏對(duì)開(kāi)發(fā)者說(shuō),“只要找對(duì)場(chǎng)景,選對(duì)基礎(chǔ)模型,有時(shí)候還要學(xué)一點(diǎn)調(diào)模型的方法,在此基礎(chǔ)上做出來(lái)的應(yīng)用是不會(huì)過(guò)時(shí)的”“沒(méi)有應(yīng)用芯片、模型都沒(méi)有價(jià)值。模型會(huì)有很多,但未來(lái)真正統(tǒng)治這個(gè)世界的是應(yīng)用,應(yīng)用才是王者。”
在基礎(chǔ)模型側(cè),李彥宏還發(fā)布了文心大模型4.5 Turbo和深度思考模型X1 Turbo。相比文心4.5,文心大模型4.5 Turbo速度更快,價(jià)格下降80%。文心大模型X1 Turbo相比文心X1,性能提升的同時(shí),價(jià)格再降50%。
一同發(fā)布的,還有高說(shuō)服力數(shù)字人、通用超級(jí)智能體心響APP、內(nèi)容操作系統(tǒng)滄舟OS等AI應(yīng)用,覆蓋AI數(shù)字人、代碼智能體、多智能體協(xié)作等熱門(mén)賽道。
值得關(guān)注的是,在“AI+”的細(xì)分行業(yè)上,百度這一次似乎更看好電商賽道。除了發(fā)布基于電商直播場(chǎng)景的高說(shuō)服力數(shù)字人之外,百度發(fā)布了首個(gè)電商交易MCP,搜索MCP等MCP Server,供開(kāi)發(fā)者調(diào)用。
MCP(Model Context Protocol,模型上下文協(xié)議)是最近AI行業(yè)的熱詞,由Claude公司母公司Anthropic?于去年11月提出并開(kāi)源,獲得了獲OpenAI、谷歌等公司支持。
作為AI領(lǐng)域的標(biāo)準(zhǔn)化接口協(xié)議,正在重構(gòu)行業(yè)生態(tài),其核心目標(biāo)是解決大模型與外部工具交互的標(biāo)準(zhǔn)化問(wèn)題,推動(dòng)AI應(yīng)用從實(shí)驗(yàn)室走向產(chǎn)業(yè)級(jí)落地。
李彥宏表示,百度將幫助開(kāi)發(fā)者全面擁抱MCP,并現(xiàn)場(chǎng)演示了千帆、搜索、電商、網(wǎng)盤(pán)等產(chǎn)品接入MCP的案例。
當(dāng)天的One More Thing環(huán)節(jié),百度正式點(diǎn)亮了國(guó)內(nèi)首個(gè)全自研的三萬(wàn)卡集群,李彥宏表示,它可以同時(shí)承載多個(gè)千億參數(shù)大模型的全量訓(xùn)練,支持1000個(gè)客戶同時(shí)做百億參數(shù)的大模型精調(diào)。
以下是李彥宏的演講全文實(shí)錄,經(jīng)編輯整理:
大家好!歡迎參加Create 2025百度AI開(kāi)發(fā)者大會(huì)!Create是我們一年一度面向開(kāi)發(fā)者群體的技術(shù)發(fā)布和交流大會(huì)。今天AI的發(fā)展日新月異,新技術(shù)層出不窮,令人眼花繚亂,甚至不知所措,這個(gè)時(shí)候面對(duì)面的交流和溝通,思想的碰撞,成果的展示,比以往任何時(shí)候都更加重要。
這是我們首次來(lái)到武漢舉辦Create大會(huì)。這里開(kāi)放包容、高校云集、活力涌動(dòng)、場(chǎng)景眾多。我相信,隨著無(wú)代碼開(kāi)發(fā)時(shí)代的到來(lái),武漢也將成為“開(kāi)發(fā)者之城”。
過(guò)去一年,我們看到模型發(fā)布越來(lái)越頻繁,DeepSeek橫空出世,MCP逐漸被接受為行業(yè)標(biāo)準(zhǔn),代碼智能體和通用智能體等多智能體協(xié)作產(chǎn)品被廣為關(guān)注。越來(lái)越多人加入開(kāi)發(fā)者隊(duì)伍,我看到開(kāi)源中國(guó)社區(qū)一年新增的開(kāi)發(fā)者數(shù)量就超過(guò)了150萬(wàn)。另一方面,也有不少開(kāi)發(fā)者充滿焦慮,模型迭代這么快,能力越來(lái)越強(qiáng),我基于大模型開(kāi)發(fā)的應(yīng)用會(huì)不會(huì)很快就過(guò)時(shí),沒(méi)價(jià)值了?
這種擔(dān)心不無(wú)道理。大模型世界風(fēng)云變幻,幾乎周周有發(fā)布,天天有更新。去年第四季度有49個(gè)大模型更新發(fā)布。2025年速度進(jìn)一步加快,第一季度就有55個(gè)發(fā)布,最多的時(shí)候一周有8個(gè)模型。一邊是大模型廠商卷死卷生,另一邊是開(kāi)發(fā)者無(wú)所適從,不敢放心大膽做應(yīng)用。為什么?就是擔(dān)心應(yīng)用被模型的迭代給快速覆蓋掉,自己白費(fèi)功夫。
但我想跟大家說(shuō),這其實(shí)是個(gè)雙刃劍,一方面開(kāi)發(fā)者確實(shí)要理解技術(shù)發(fā)展的趨勢(shì),避開(kāi)大模型自身發(fā)展的延長(zhǎng)線;另一方面,這么多模型,日益強(qiáng)大的模型能力,其實(shí)是為我們提供了更多的選擇,打開(kāi)了更多的可能性,你只要找對(duì)場(chǎng)景,選對(duì)基礎(chǔ)模型,有時(shí)候還要學(xué)一點(diǎn)調(diào)模型的方法,在此基礎(chǔ)上做出來(lái)的應(yīng)用是不會(huì)過(guò)時(shí)的。
應(yīng)用才是真正創(chuàng)造價(jià)值的,沒(méi)有應(yīng)用,芯片、模型都沒(méi)有價(jià)值。我們這次大會(huì)的主題:模型的世界,應(yīng)用的天下,就是說(shuō)模型會(huì)有很多,但未來(lái)真正統(tǒng)治這個(gè)世界的是應(yīng)用,應(yīng)用才是王者。
比如,在交通領(lǐng)域,高速公路上會(huì)發(fā)生各種各樣的安全事件。既有異常停車(chē)、行人闖入這樣的常發(fā)事件,也有火災(zāi)煙霧、物品拋灑這種長(zhǎng)尾事件。這些安全事件的檢測(cè),都是部署在高速路側(cè)的邊緣系統(tǒng)中的小模型完成的。但它們的識(shí)別準(zhǔn)確率沒(méi)那么高,時(shí)不時(shí)會(huì)出現(xiàn)一些狀況。比如沒(méi)能識(shí)別出大貨車(chē)拋灑下來(lái)的危險(xiǎn)物品,把視頻中的光斑、陰影識(shí)別成了拋灑物,漏報(bào)、誤報(bào),或者重復(fù)報(bào)。而誤報(bào)太多,預(yù)警的作用就沒(méi)有了。
有了大模型之后,部署在云端的大模型,可以對(duì)小模型檢測(cè)過(guò)的視頻片段進(jìn)行秒級(jí)校驗(yàn),對(duì)于常發(fā)事件,大模型可以將檢測(cè)準(zhǔn)確率提升到95%以上;對(duì)于長(zhǎng)尾事件,檢測(cè)準(zhǔn)確率也能提高到90%。監(jiān)控人員介入處置的工作量降低了50%。
隨著模型能力的增強(qiáng),這種大模型和應(yīng)用場(chǎng)景結(jié)合的機(jī)會(huì)將越來(lái)越多,這些AI應(yīng)用不但不會(huì)被模型能力所覆蓋,反倒能夠滲透到更多的場(chǎng)景,從而價(jià)值變得更高。這種能夠帶來(lái)實(shí)在價(jià)值的應(yīng)用,是屬于開(kāi)發(fā)者的真機(jī)會(huì)。這樣的機(jī)會(huì),在千行百業(yè)里,比比皆是,遍地是黃金。
DeepSeek發(fā)布以后,我們第一時(shí)間在百度智能云的千帆平臺(tái)上做了部署,向數(shù)以萬(wàn)計(jì)的開(kāi)發(fā)者提供免費(fèi)的調(diào)用機(jī)會(huì)。百度的各個(gè)業(yè)務(wù)線也都積極擁抱,文小言、百度搜索、百度地圖等都接入了DeepSeek滿血版,在很多內(nèi)外部應(yīng)用場(chǎng)景都產(chǎn)生了非常不錯(cuò)的效果。今天下午的分論壇就有一個(gè)專(zhuān)門(mén)討論DeepSeek的,我們會(huì)在那里跟大家分享利用DeepSeek開(kāi)發(fā)AI應(yīng)用的各種經(jīng)驗(yàn)。
當(dāng)然DeepSeek也不是萬(wàn)能的。比如它只能處理文本,還不能理解和生成圖片、音頻、視頻等多媒體內(nèi)容,而我們的很多百度智能云客戶,都需要這種多模理解和生成能力;比如它幻覺(jué)率比較高,在很多場(chǎng)合不能放心使用,如果在電商直播中幻覺(jué)出來(lái)一個(gè)買(mǎi)一送一的優(yōu)惠,那商家就要賠慘了。當(dāng)然它更大的問(wèn)題是慢和貴,中國(guó)市場(chǎng)上絕大多數(shù)的大模型API調(diào)用價(jià)格都比DeepSeek滿血版要低,速度要更快,而今天我們要隆重發(fā)布的文心大模型的4.5 Turbo和X1 Turbo就是要解決這些問(wèn)題的。
今年的3月16日,在文心一言發(fā)布兩周年之際,我們發(fā)布了文心大模型4.5和文心大模型X1。文心大模型4.5是百度首個(gè)原生多模態(tài)大模型,實(shí)現(xiàn)了在同一個(gè)模型里對(duì)文本、語(yǔ)音、圖片、視頻的一體化理解。在多項(xiàng)測(cè)試中表現(xiàn)優(yōu)于GPT4.5,而API調(diào)用價(jià)格僅為GPT4.5的1%;文心大模型X1作為深度思考模型,性能對(duì)標(biāo)DeepSeek-R1,而調(diào)用價(jià)格只有R1的一半。
今天,我們正式發(fā)布文心大模型4.5 Turbo和文心大模型X1 Turbo。主打三大特性:多模態(tài)、強(qiáng)推理、低成本。
多模態(tài)是未來(lái)基礎(chǔ)模型的標(biāo)配,純文本模型的市場(chǎng)會(huì)越變?cè)叫。嗄B(tài)模型的市場(chǎng)會(huì)越來(lái)越大。至于說(shuō)新模型的價(jià)格有多低?這里先賣(mài)個(gè)關(guān)子,稍后揭曉答案。我們先來(lái)看看,文心4.5 Turbo在圖片和視頻理解方面的表現(xiàn)。
我們給文心4.5 Turbo這樣一張照片,照片很模糊,大致能看出,是兩個(gè)人在爭(zhēng)搶一個(gè)球。現(xiàn)場(chǎng)朋友們,有人知道這是哪場(chǎng)比賽嗎?我們也問(wèn)了一些其他的大模型,有的把這個(gè)足球識(shí)別成了橄欖球,把圖片中的廣告牌,識(shí)別成了職業(yè)橄欖球聯(lián)盟比賽的畫(huà)面,得出結(jié)論“這是1981年的超級(jí)碗比賽片段”,但這是錯(cuò)的。
我們?cè)賮?lái)問(wèn)問(wèn)文心4.5 Turbo:“這是哪場(chǎng)比賽?”可以看到,在畫(huà)質(zhì)非常低、信息量很少的情況下,通過(guò)賽場(chǎng)廣告牌和球員動(dòng)作等元素,文心4.5Turbo準(zhǔn)確判斷出,這是1986年阿根廷對(duì)陣英格蘭的世界杯足球賽。而且點(diǎn)出了那場(chǎng)比賽最著名的事件——馬拉多納的“上帝之手”。
我們?cè)賮?lái)看一個(gè)視頻理解的例子。在這個(gè)視頻中,有三個(gè)物體在水槽中游動(dòng),看起來(lái)像是在展示一種科學(xué)原理。我們把這個(gè)視頻上傳給文心4.5Turbo,看看它怎么說(shuō)?
答案出來(lái)了,它準(zhǔn)確理解了這是一個(gè)水槽實(shí)驗(yàn),其中紅色的水滴形浮體比另外兩塊浮體更快到達(dá)了終點(diǎn),并給出近一步說(shuō)明,這可以用“流體動(dòng)力學(xué)中的形狀阻力原理來(lái)解釋”,因?yàn)榱骶€形物體能夠減少渦流,降低了阻力,所以跑得更快。
文心4.5 Turbo不僅在多模態(tài)理解能力上有著明顯進(jìn)步,在去幻覺(jué)、邏輯推理和代碼能力上也都有著整體增強(qiáng)。
文心大模型X1 Turbo是基于文心4.5 Turbo的深度思考模型。上個(gè)月X1發(fā)布后,受到了用戶的廣泛青睞。而X1 Turbo具備更先進(jìn)的思維鏈,深度思考能力更強(qiáng),擅長(zhǎng)文學(xué)創(chuàng)作、邏輯推理等,進(jìn)一步增強(qiáng)了多模態(tài)能力。更重要的是,它還能夠調(diào)用不同工具,我們來(lái)看下。
最近武漢有個(gè)很有名的吉祥物叫“蒜鳥(niǎo)”,我們用它來(lái)考考新的文心X1 Turbo。“聽(tīng)說(shuō)武漢有種東西叫蒜鳥(niǎo),請(qǐng)你把它畫(huà)出來(lái)”它思考后,自動(dòng)選擇了聯(lián)網(wǎng)搜索、圖片生成兩個(gè)工具。
首先,通過(guò)聯(lián)網(wǎng)查找“蒜鳥(niǎo)”相關(guān)信息,我們了解到這是一個(gè)諧音梗,從武漢方言“算了”演變成吉祥物,被稱(chēng)為武漢的和平鳥(niǎo)。文心X1 Turbo在思考時(shí),認(rèn)為在圖像中加入長(zhǎng)江大橋、黃鶴樓這些武漢元素會(huì)更有代表性。然后,它調(diào)用AI繪圖工具,畫(huà)出了這樣一只頭頂綠色大蒜的“蒜鳥(niǎo)”。我們也嘗試了用其他模型來(lái)畫(huà),但生成出來(lái)的都只是一張普通小鳥(niǎo)的圖片。
我們?cè)僮屗皩?xiě)一份蒜鳥(niǎo)應(yīng)聘武漢熱干面代言人的簡(jiǎn)歷,以word形式發(fā)給我。”通過(guò)聯(lián)網(wǎng)搜索工具,文心X1 Turbo收集到了關(guān)于“蒜鳥(niǎo)”的詳細(xì)信息,構(gòu)思出背景、特點(diǎn)、文化意義、代言人優(yōu)勢(shì)等內(nèi)容,生成了一份簡(jiǎn)歷,再調(diào)用代碼解釋器,把這份簡(jiǎn)歷做成了word文件,方便做二次編輯。
上面這個(gè)簡(jiǎn)單的案例,只是X1 Turbo能力的一個(gè)小切口。體現(xiàn)了它的深度思考和多工具調(diào)用能力。好,現(xiàn)在是謎底揭曉的時(shí)刻了!
文心大模型4.5 Turbo每百萬(wàn)token 輸入價(jià)格僅為0.8元,輸出價(jià)格3.2元!相比文心4.5,速度更快,價(jià)格下降80%。
文心大模型X1 Turbo每百萬(wàn)token輸入價(jià)格1元,輸出價(jià)格4元,相比文心X1,性能提升的同時(shí),價(jià)格再降50%。
為什么我們要不斷把大模型的成本降下來(lái)?因?yàn)殚_(kāi)發(fā)者做AI應(yīng)用的一個(gè)很大阻礙就是成本高,用不起。而創(chuàng)新的本質(zhì)往往就是成本下降。成本降低后,開(kāi)發(fā)者和創(chuàng)業(yè)者們才可以放心大膽地做開(kāi)發(fā),企業(yè)才能夠低成本地部署大模型,最終推動(dòng)各行各業(yè)應(yīng)用的爆發(fā)。
有了這樣超級(jí)能干的基礎(chǔ)模型,我們就可以打造出超級(jí)有用、超級(jí)有趣的AI應(yīng)用來(lái)。2025年最令人激動(dòng)的突破性應(yīng)用之一,就是AI數(shù)字人。下面,我就給大家介紹一種高說(shuō)服力數(shù)字人,簡(jiǎn)單來(lái)說(shuō),就是聲形超擬真、內(nèi)容更專(zhuān)業(yè)、互動(dòng)更靈活,實(shí)現(xiàn)了數(shù)字人超越真人的體驗(yàn),在電商直播、游戲、消費(fèi)等領(lǐng)域,有著巨大的想象空間。
現(xiàn)在市場(chǎng)上常見(jiàn)的數(shù)字人,文案枯燥、動(dòng)作少、機(jī)器音重,我們先來(lái)看一下。這樣的數(shù)字人直播,其實(shí)效果也不算差,但看久了就審美疲勞。我們?cè)賮?lái)看這段。
如果看到這段直播,你能分清她是真人還是數(shù)字人嗎?為什么數(shù)字人能做到這么真,甚至表現(xiàn)力超越真人?這要?dú)w功于一個(gè)關(guān)鍵能力,叫做“劇本生成”。
高說(shuō)服力數(shù)字人的背后,是由內(nèi)容豐富的多模劇本驅(qū)動(dòng)的。剛才屏幕右邊,就同步展示了一個(gè)完整的劇本。不止有臺(tái)詞,還有表情、語(yǔ)氣、動(dòng)作,它們會(huì)匹配臺(tái)詞內(nèi)容實(shí)時(shí)調(diào)整,情緒轉(zhuǎn)折和動(dòng)作切換都很順暢,表現(xiàn)“超擬真”。
那一個(gè)真實(shí)的直播間,除了主播,往往還有助播、場(chǎng)控、運(yùn)營(yíng)等四五個(gè)角色給打配合。在數(shù)字人直播間里,能不能做到呢?
可以看到,有一個(gè)AI大腦會(huì)根據(jù)直播間的實(shí)時(shí)熱度和轉(zhuǎn)化情況,靈活調(diào)度各類(lèi)角色。比如,直播間人氣高,大家下單熱情高,AI大腦就會(huì)把助播調(diào)動(dòng)起來(lái),促進(jìn)轉(zhuǎn)化。在產(chǎn)品介紹和領(lǐng)取福利環(huán)節(jié),AI大腦也可以適時(shí)切換鏡頭畫(huà)面、插入小卡片、福袋等素材。真正實(shí)現(xiàn)了一個(gè)人就是一支營(yíng)銷(xiāo)團(tuán)隊(duì)。
今天的電商直播已經(jīng)是一個(gè)非常主流的交易形態(tài),也涌現(xiàn)出了一批賺了大錢(qián)的主播。他們的能力可不可以被數(shù)字人復(fù)制?為了讓更多人都能有一個(gè)專(zhuān)屬數(shù)字人,并且靠數(shù)字人直播變現(xiàn),我們推出了“一鍵克隆”功能。你只需要錄制一條最短2分鐘的直播視頻,傳到百度慧播星平臺(tái)上做基礎(chǔ)訓(xùn)練,就可以反復(fù)使用這個(gè)數(shù)字人進(jìn)行直播了,可謂是“人人都能做主播”。
高說(shuō)服力數(shù)字人,是多模態(tài)大模型的一個(gè)典型應(yīng)用。而開(kāi)發(fā)者面對(duì)的多數(shù)情況,往往是一個(gè)應(yīng)用需要組合使用多個(gè)模型。模型的組合使用,聽(tīng)起來(lái)簡(jiǎn)單,但要想做得好、體驗(yàn)好、有用戶買(mǎi)單,還是很難的。
百度文庫(kù)在這方面收獲了廣泛的認(rèn)可。文庫(kù)的AI功能付費(fèi)用戶已經(jīng)超過(guò)4000萬(wàn),月活達(dá)到了9700萬(wàn),成為了真正的“超級(jí)生產(chǎn)力"。
而文庫(kù)和網(wǎng)盤(pán)共同打造的自由畫(huà)布,就是一個(gè)多模型組合使用的極致例子。自由畫(huà)布可以處理幾乎所有的常見(jiàn)模態(tài)和文件類(lèi)型,我們可以從網(wǎng)盤(pán)中拖入各種格式的素材,有Word、PDF、圖片、音頻、視頻等等。
比如,我們想研究下《長(zhǎng)江禁漁對(duì)江豚種群的影響》,就可以使用這些素材,也可以直接粘貼網(wǎng)頁(yè)鏈接,或是通過(guò)AI搜索來(lái)補(bǔ)充最新的內(nèi)容。它還支持圖生圖,比如選中一張江豚的實(shí)拍圖,讓它改為可愛(ài)漫畫(huà)風(fēng)。
接著,我們可以指定每種素材的使用方法,比如,在這篇江豚生存境況的文稿中選取一段,明確要求用這里面的數(shù)據(jù);然后,圈選一篇禁漁政策效果分析的論文,指定參考其中的主要觀點(diǎn)。
做好這些備注后,把這些素材一鍵全選,輸入需要的主題,就可以要求它生成各種類(lèi)型的內(nèi)容了。比如中等篇幅的長(zhǎng)文,比如PPT或者是繪本。特別是適合孩子觀看的視頻化繪本,還用上了剛剛生成的卡通小江豚形象。
自由畫(huà)布對(duì)各類(lèi)素材強(qiáng)大的處理能力,正是多個(gè)模型組合使用的結(jié)果。這里有基于文心精調(diào)的模型來(lái)理解用戶意圖,有多模態(tài)模型處理音視頻素材,還有不同的專(zhuān)有模型和行業(yè)模型,用于提取文檔和網(wǎng)頁(yè)鏈接內(nèi)容、處理角色形象、生成不同格式的新內(nèi)容等。
這套能力,已經(jīng)沉淀為一個(gè)完整的技術(shù)底座——滄舟OS。這是一個(gè)為內(nèi)容而生的操作系統(tǒng),它包括了兩大核心:
第一個(gè)是Chatfile Plus,它要對(duì)不同模態(tài)、不同形態(tài)、不同格式的內(nèi)容,做解析和向量化處理,把它們變成一種大模型能聽(tīng)懂的向量化Token,然后再進(jìn)行混合生成。第二個(gè)是建立了三庫(kù)和三器:三庫(kù),就是公域知識(shí)庫(kù)、私域知識(shí)庫(kù)、記憶庫(kù);三器,是編輯器、閱讀器、播放器,它們可以根據(jù)用戶的需求被大模型組合調(diào)用。
有了這樣一個(gè)扎實(shí)的技術(shù)底座,它上層的交互界面就不再局限于畫(huà)布的形態(tài),我們近期就利用這套底座上線了一個(gè)非常實(shí)用的功能,AI筆記。
我們相信,有了這套技術(shù)底座,文庫(kù)和網(wǎng)盤(pán)還會(huì)不斷推出更多更好用的AI功能,成為每個(gè)人都愛(ài)不釋手的超級(jí)生產(chǎn)力工具。
剛才我介紹了幾個(gè)多模態(tài)理解和生成方面的應(yīng)用。下面,我還想給大家再看看另外一個(gè)視覺(jué)大模型的典型應(yīng)用,無(wú)人駕駛。就在我們Create大會(huì)的會(huì)場(chǎng)周邊,包括武漢的大部分區(qū)域,有許多輛蘿卜快跑正為人們提供著安全、舒適與便利的服務(wù)。事實(shí)上,無(wú)人駕駛比有人駕駛更安全的理念正在被越來(lái)越多的人意識(shí)到。全世界各個(gè)國(guó)家、城市都會(huì)逐步接受這一新鮮事物,我們也將在全球持續(xù)擴(kuò)大規(guī)模。相信在不久的將來(lái),不同城市、不同國(guó)家、不同種族都將享受無(wú)人駕駛的便利。
大概一年前,別人問(wèn)我最看好的AI應(yīng)用方向是什么,我說(shuō)是智能體。那時(shí),這還是個(gè)非共識(shí)的認(rèn)知。僅僅一年不到,智能體就已經(jīng)成為了AI應(yīng)用的代名詞。
代碼智能體Coding Agent, 是最近半年AI應(yīng)用進(jìn)展最快、最火的賽道。陸續(xù)涌現(xiàn)了cursor、devin、lovable等一系列編碼智能體,既有輔助代碼生成工具,也有無(wú)代碼編程工具。未來(lái)每個(gè)公司都需要依賴(lài)代碼智能體來(lái)完成任務(wù)。如果還像原來(lái)那樣吭哧吭哧一行一行地寫(xiě)代碼,是沒(méi)有贏的可能性的。
百度的工程師普遍使用文心快碼Comate這樣的輔助代碼生成工具,非技術(shù)人員則會(huì)使用秒噠這樣的無(wú)代碼編程工具。去年11月的百度世界大會(huì)上,我們發(fā)布了秒噠,它擁有無(wú)代碼編程、多智能體協(xié)作、多工具調(diào)用三大特性。今年3月,秒噠向全社會(huì)開(kāi)放,任何人都可以通過(guò)秒噠,一句話生成應(yīng)用。
比如,一個(gè)父親提出來(lái)想做個(gè)拼圖小游戲,既有經(jīng)典的動(dòng)物、交通工具、字母類(lèi)圖片主題,也可以有不同難度的進(jìn)階。另外,他還希望游戲允許上傳本地圖片,做成個(gè)性化拼圖,拼圖完成后,還能夠顯示圖片的知識(shí)卡片,寓教于樂(lè)。
我們看秒噠接到需求后,陸續(xù)調(diào)度了策劃師、研發(fā)工程師、素材設(shè)計(jì)師等多個(gè)角色智能體。
很快,游戲就生成好了,可以選擇不同的圖片主題,比如火車(chē)、寵物等等,還能選擇2乘2到4乘4的不同難度。拼圖成功后,會(huì)顯示出一個(gè)“太棒了”的鼓勵(lì)頁(yè),還是挺有意思的,很適合小朋友。如果有自己喜歡的圖片,也可以選擇本地上傳,做成個(gè)性化拼圖。
這位父親給我們留言說(shuō),秒噠幫了他大忙,以前經(jīng)常不知道陪孩子干點(diǎn)兒什么,這個(gè)拼圖游戲讓他們度過(guò)了一個(gè)快樂(lè)的中午。有興趣的朋友也可以掃碼體驗(yàn)一下。
我們?cè)賮?lái)看一個(gè)秒噠幫助大學(xué)生創(chuàng)業(yè)者做好營(yíng)銷(xiāo)工具的例子。一個(gè)大學(xué)生創(chuàng)業(yè)團(tuán)隊(duì)發(fā)現(xiàn)了在校園內(nèi)賣(mài)夜宵的商機(jī)。需要做出一個(gè)購(gòu)買(mǎi)和配送功能一體化的系統(tǒng),原本的開(kāi)發(fā)時(shí)間要1周多;而使用秒噠,不需要任何開(kāi)發(fā)團(tuán)隊(duì),幾分鐘就可以搞定。
他們先上傳了一份需求文檔,涵蓋了對(duì)于頁(yè)面的各類(lèi)需求,這里還要求系統(tǒng)具備地圖導(dǎo)航和客服咨詢的功能。可以看到,秒噠先調(diào)用了產(chǎn)品經(jīng)理的智能體,理清了首屏內(nèi)容、上屏展示、預(yù)約訂餐這些模塊的開(kāi)發(fā)需求,還給出了設(shè)計(jì)建議。和剛才一樣,接著秒噠就開(kāi)始陸續(xù)調(diào)用架構(gòu)師、素材設(shè)計(jì)師、測(cè)試工程師等多個(gè)智能體開(kāi)發(fā)應(yīng)用。
在這個(gè)過(guò)程中,秒噠先后調(diào)用了智能云的存儲(chǔ)、數(shù)據(jù)庫(kù)功能,和手機(jī)驗(yàn)證碼、地圖導(dǎo)航、智能客服等工具組件,實(shí)現(xiàn)了制作留資表單、一鍵導(dǎo)航到店、管理后臺(tái)數(shù)據(jù)等能力,生成的應(yīng)用可以直接在手機(jī)上使用。
這個(gè)創(chuàng)業(yè)團(tuán)隊(duì)把二維碼分享到社群推廣后,還可以在后臺(tái)時(shí)刻關(guān)注營(yíng)銷(xiāo)轉(zhuǎn)化的進(jìn)展情況。就這樣,僅用5塊錢(qián)左右的模型調(diào)用費(fèi),和幾分鐘的時(shí)間,這個(gè)團(tuán)隊(duì)就搞出了一個(gè)營(yíng)銷(xiāo)工具。
有了秒噠,一個(gè)陜西的果農(nóng),做了一個(gè)能賣(mài)蘋(píng)果、自動(dòng)算賬的應(yīng)用;一位退休師傅,創(chuàng)建了一個(gè)可以進(jìn)行車(chē)位、訪客和維修登記的居民服務(wù)應(yīng)用;一個(gè)蘇州的繡娘工作室,搭建了蘇繡AI博物館,讓更多人看到這種傳統(tǒng)技藝。
全球只有不到3000萬(wàn)程序員,有80億人,當(dāng)技術(shù)的門(mén)檻逐漸消失,每個(gè)人都可以具備程序員的能力,無(wú)論你是大學(xué)生、農(nóng)民還是手藝人,只要有想法,秒噠就能讓你夢(mèng)想成真!
多智能體協(xié)作是一個(gè)非常有價(jià)值的AI應(yīng)用方向。未來(lái)的AI應(yīng)用,不只可以回答問(wèn)題,還要能完成任務(wù)。而任何一個(gè)復(fù)雜任務(wù)的交付,都需要多智能體協(xié)作來(lái)解析需求、分拆任務(wù)、調(diào)度資源、規(guī)劃執(zhí)行,最終交付結(jié)果。
AI應(yīng)用井噴的時(shí)代就在眼前,它們可能是智能體,也可能是H5、小程序或者獨(dú)立App。那怎么才能快速找到它們呢?
答案就在百度搜索開(kāi)放平臺(tái)的AI開(kāi)放計(jì)劃!在新的時(shí)代,百度搜索將敞開(kāi)大門(mén),擁抱每個(gè)不同形態(tài)的AI應(yīng)用,建立多樣的內(nèi)容和服務(wù)分發(fā)機(jī)制,不僅為用戶提供最新最全的AI服務(wù),更為開(kāi)發(fā)者提供流量和收益。
比如在搜索框內(nèi)輸入『3D家裝設(shè)計(jì)』,首條結(jié)果就會(huì)出現(xiàn)生境科技的『家裝設(shè)計(jì)』AI應(yīng)用卡,選擇『定制專(zhuān)屬方案』,上傳房間照片、選擇房間類(lèi)型和風(fēng)格偏好,就可以一鍵生成效果圖了。
目前,已經(jīng)有AI面試助手、專(zhuān)業(yè)醫(yī)學(xué)咨詢、視覺(jué)內(nèi)容制作等各個(gè)領(lǐng)域的一批應(yīng)用率先接入了百度搜索開(kāi)放平臺(tái),我們也誠(chéng)摯邀請(qǐng)更多的應(yīng)用開(kāi)發(fā)者們參與進(jìn)來(lái),早接入,早獲益!
與此同時(shí),百度搜索也將全面索引市場(chǎng)上的各類(lèi)MCP server,為開(kāi)發(fā)者提供最全的開(kāi)發(fā)工具。MCP很火,那它為什么這么重要呢?
AI應(yīng)用大爆發(fā)的時(shí)代,開(kāi)發(fā)者們普遍遇到了一系列難題:比如,使用工具缺少統(tǒng)一規(guī)范,開(kāi)發(fā)效率不高;需要反復(fù)適配各類(lèi)平臺(tái),耗時(shí)耗力;開(kāi)源社區(qū)的工具和組件良莠不齊,整合維護(hù)難度大。
MCP,也就是模型上下文協(xié)議,提供了全新的解決思路。它就像給AI裝上了“萬(wàn)能插座”,開(kāi)發(fā)者不再需要為每個(gè)工具編寫(xiě)定制化的代碼,只要按照MCP標(biāo)準(zhǔn),編寫(xiě)一次接口就好,極大降低了開(kāi)發(fā)的負(fù)擔(dān)。總的來(lái)說(shuō),MCP讓AI更懂外部世界,更容易獲得信息,更自由地調(diào)用工具,是AI發(fā)展的一大步,你應(yīng)該盡早的了解它。
開(kāi)發(fā)者要擁抱MCP有兩種路徑,一是把自己的資源、數(shù)據(jù)、能力通過(guò)MCP的形式提供出來(lái),讓更多的AI應(yīng)用來(lái)使用;一是自己在開(kāi)發(fā)AI應(yīng)用的時(shí)候充分利用已有的MCP Server資源,這樣既減少了開(kāi)發(fā)量,又大幅提升能力。隨著MCP生態(tài)的日益繁榮,無(wú)論是國(guó)外的Anthropic, OpenAI, Google,還是國(guó)內(nèi)的阿里、字節(jié)、騰訊,都在積極擁抱MCP。
百度會(huì)幫助開(kāi)發(fā)者積極全面地?fù)肀CP。
我們優(yōu)化了文心基礎(chǔ)大模型,提升了模型在使用MCP server時(shí)的任務(wù)規(guī)劃和調(diào)度能力。
百度智能云的千帆平臺(tái)率先全面兼容了MCP,不僅提供大量的第三方server,也支持開(kāi)發(fā)者創(chuàng)建和發(fā)布自己的MCP server。
百度搜索構(gòu)建了MCP server的發(fā)現(xiàn)平臺(tái),可以索引全網(wǎng)市場(chǎng)上優(yōu)質(zhì)的server
百度的文心快碼Comate,是國(guó)內(nèi)首個(gè)支持MCP server的智能編碼助手。
百度的商品檢索、商品交易、商品詳情、商品參數(shù)對(duì)比、商品排行榜能力等等也已經(jīng)通過(guò)百度電商的MCP server對(duì)外提供,這是國(guó)內(nèi)首家支持電商交易的MCP服務(wù)。
我們的地圖、文庫(kù)、網(wǎng)盤(pán)等應(yīng)用,也在通過(guò)MCP server的方式,把越來(lái)越多的能力逐步開(kāi)放出來(lái)。
當(dāng)然,最重要的是,文心大模型使用的聯(lián)網(wǎng)搜索工具也變身為百度搜索MCP server供開(kāi)發(fā)者調(diào)用,依托百度25年的技術(shù)積累,這是目前世界上最好的搜索MCP。
我們來(lái)看一個(gè)三星手機(jī)接入百度文庫(kù)網(wǎng)盤(pán)MCP server的例子。三星手機(jī)正在接入百度文庫(kù)網(wǎng)盤(pán)的文件上傳、下載、檢索、分享和內(nèi)容理解等多個(gè)MCP server。
一方面,用戶在手機(jī)的語(yǔ)音助手界面,通過(guò)說(shuō)話方式,就可以直接實(shí)現(xiàn)文件的上傳網(wǎng)盤(pán)備份、云上分享、文檔摘要總結(jié)和內(nèi)容問(wèn)答等功能。
另一方面,這些Server還能夠豐富三星手機(jī)系統(tǒng)的云存儲(chǔ)能力,解決手機(jī)自身對(duì)大文件、多文件難以批量備份和分享的問(wèn)題。比如用戶在手機(jī)相冊(cè)里,喚起語(yǔ)音助手說(shuō):“把昨天在奧森拍的照片備份至百度網(wǎng)盤(pán),并把小明的照片發(fā)送給他”。
相關(guān)照片就會(huì)被上傳到用戶授權(quán)的網(wǎng)盤(pán)賬號(hào)內(nèi),并生成分享鏈接,手機(jī)助手再調(diào)用通訊錄,把鏈接通過(guò)短信方式發(fā)到對(duì)方手機(jī)上,點(diǎn)擊鏈接就能夠直接進(jìn)入百度網(wǎng)盤(pán)進(jìn)行查看或轉(zhuǎn)存了。
文庫(kù)網(wǎng)盤(pán)的這些能力都被大量用戶驗(yàn)證過(guò),我們希望把它們封裝好,通過(guò)MCP Server的形式開(kāi)放出來(lái),供更多開(kāi)發(fā)者使用。
我們?cè)賮?lái)看一個(gè)通過(guò)千帆平臺(tái)把智能體和搜索、電商MCP server相結(jié)合的例子。用戶的需求是“想考清華大學(xué)計(jì)算機(jī)方向的研究生,要買(mǎi)幾本專(zhuān)業(yè)書(shū)籍學(xué)習(xí)”。以前的智能體只能泛泛的列出些看似相關(guān)的書(shū)名,無(wú)法給出具體的推薦建議,更沒(méi)法幫助用戶實(shí)現(xiàn)選品和交易。那現(xiàn)在有了MCP,怎么就不一樣了呢?
我們打開(kāi)千帆平臺(tái),對(duì)原有的萬(wàn)能助手智能體進(jìn)行編輯,添加百度AI搜索和百度優(yōu)選的MCP Server,點(diǎn)擊發(fā)布,智能體的能力就更新完成了。看下效果。我們拿剛才的需求問(wèn)這個(gè)智能體,它會(huì)首先進(jìn)行深度思考,接著調(diào)用百度AI搜索的MCP Server,給出推薦書(shū)籍的清單,并且列出了作者、出版社和書(shū)籍特點(diǎn)等商品詳情。
用戶看過(guò)書(shū)籍清單后,確定要第一本,希望找個(gè)靠譜劃算的店鋪下單。智能體就又調(diào)用百度優(yōu)選的MCP Server,獲取了不同店鋪的評(píng)分信息和商品價(jià)格,給出了最終購(gòu)買(mǎi)建議。用戶確認(rèn)后,就可以直接生成訂單,完成交易了。
這就是國(guó)內(nèi)首個(gè)支持電商交易的MCP服務(wù)與最好的搜索MCP相結(jié)合的成果。當(dāng)然,千帆平臺(tái)上已經(jīng)接入的MCP服務(wù)遠(yuǎn)不止這些。
現(xiàn)在基于MCP開(kāi)發(fā)智能體,就像2010年開(kāi)發(fā)移動(dòng)APP。百度將持續(xù)加大對(duì)MCP的支持,推動(dòng)更多應(yīng)用和服務(wù)接口兼容MCP,不斷賦能開(kāi)發(fā)者創(chuàng)新,共建繁榮的MCP生態(tài)。今天下午的MCP分論壇會(huì)提供更多了解和掌握MCP的機(jī)會(huì),希望大家踴躍參加。
百度一直為開(kāi)發(fā)者提供模型、開(kāi)發(fā)工具,以及資金資源等多方面的支持。兩年前,我們啟動(dòng)了“文心杯”創(chuàng)業(yè)大賽,就是希望推動(dòng)大模型生態(tài)繁榮,幫助創(chuàng)業(yè)者、開(kāi)發(fā)者開(kāi)發(fā)各種AI應(yīng)用。
兩屆“文心杯”創(chuàng)業(yè)大賽,我們收到了來(lái)自全球2500余支創(chuàng)業(yè)團(tuán)隊(duì)的報(bào)名,為優(yōu)勝的隊(duì)伍提供了超過(guò)2億元的資金支持,并在技術(shù)、團(tuán)隊(duì)和資源上持續(xù)給予全方位扶持。
可以說(shuō),文心杯已成為中國(guó)AI創(chuàng)投圈,最重磅的賽事和最知名的品牌之一。獲獎(jiǎng)團(tuán)隊(duì)大多成為了百度重要的生態(tài)伙伴,近半數(shù)獲獎(jiǎng)團(tuán)隊(duì)也已經(jīng)拿到了下一輪融資,獲得了很好的發(fā)展。
現(xiàn)在我宣布,第三屆“文心杯”創(chuàng)業(yè)大賽正式啟動(dòng)!我們將進(jìn)一步加大對(duì)創(chuàng)業(yè)者的支持力度,單一項(xiàng)目的獲獎(jiǎng)金額將翻倍。特別大獎(jiǎng)的投資額最高可達(dá)7000萬(wàn)人民幣!非常期待可以有更多的開(kāi)發(fā)者和創(chuàng)業(yè)團(tuán)隊(duì)與我們同行,打造更多更好的AI應(yīng)用!
當(dāng)然,正如大家都感受到的,外部環(huán)境充滿不確定性,經(jīng)濟(jì)形勢(shì)也面臨不小的挑戰(zhàn),這同樣考驗(yàn)著每一家企業(yè)的責(zé)任和擔(dān)當(dāng)。百度是一家技術(shù)公司,始終堅(jiān)持創(chuàng)新,堅(jiān)持AI人才培養(yǎng)。5年前,我們提出500萬(wàn)AI人才計(jì)劃,實(shí)際上我們已經(jīng)為社會(huì)培養(yǎng)了超630萬(wàn)AI人才。今天我宣布,未來(lái)5年,百度將加大力度,再為社會(huì)培養(yǎng)1000萬(wàn)AI人才,幫助他們發(fā)揮創(chuàng)造力和生產(chǎn)力,一起推動(dòng)智能經(jīng)濟(jì)的發(fā)展。
今天,我們?cè)?小時(shí)內(nèi)做了有關(guān)模型和應(yīng)用的9大發(fā)布——發(fā)布了更強(qiáng)大、成本更低的文心大模型4.5 Turbo和X1 Turbo;發(fā)布了領(lǐng)先一代的高說(shuō)服力數(shù)字人、功能強(qiáng)大的滄舟OS系統(tǒng)、代碼智能體秒噠的新進(jìn)展、多智能體協(xié)作APP心響、面向未來(lái)的百度搜索AI開(kāi)放計(jì)劃和幫助開(kāi)發(fā)者全面擁抱MCP的計(jì)劃。
所有這些發(fā)布,都是為了讓開(kāi)發(fā)者們可以不用擔(dān)心模型能力、不用擔(dān)心模型成本、更不用擔(dān)心開(kāi)發(fā)工具和平臺(tái),可以踏踏實(shí)實(shí)地做應(yīng)用,做出真正好的應(yīng)用!
讓每個(gè)需求都有回響,讓每次交互都產(chǎn)生心跳,讓每個(gè)創(chuàng)新都引爆浪潮!
我們堅(jiān)信,應(yīng)用創(chuàng)造未來(lái)!開(kāi)發(fā)者創(chuàng)造未來(lái)!謝謝大家。
(本文首發(fā)于鈦媒體APP,作者|李程程)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.