國內(nèi)AI領域內(nèi),一場圍繞MCP的暗戰(zhàn)悄然顯現(xiàn)。
不會再有百模大戰(zhàn)那樣聲勢浩大的泡沫、更關注AI是否落地好用的長期價值,再談生態(tài)壁壘,這些都是MCP入局者的共識。
科技巨頭們?nèi)缃竦哪θ琳?,比起在這片“新戰(zhàn)場”搶占先機,更大的目標是攜手幫助AI應用加速進化。
而被看作是智能體“萬能插頭”的MCP,不但依托框架化思維,成為多模態(tài)應用與各方數(shù)據(jù)源深度融合的紐帶,更能真正意義打造開放生態(tài)、讓每個企業(yè)、開發(fā)者都能打造自己的應用,給用戶提供高質(zhì)量、個性化的交付,大幅提升AI生產(chǎn)力。
基于此,4月25日,Create2025百度AI開發(fā)者大會上,百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏宣布,百度文庫與百度網(wǎng)盤聯(lián)合推出“滄舟OS”,這也是全球首個內(nèi)容領域的操作系統(tǒng),將AI的能力沉淀到了系統(tǒng)級技術底座,在OS的特性和MCP的價值基礎之上,真正實現(xiàn)從深度思考走向到深度交付。
如果說數(shù)據(jù)是AI時代的能源,模型是生產(chǎn)力引擎,OS系統(tǒng)就像是一個“超級工廠”,將技術、數(shù)據(jù)、工具和端到端的交付需求連接起來,讓用戶進一步感受到大模型時代AI正在朝“無所不能、無處不在”的方向邁進。
AI的正確方向,是“無所不能、無處不在”
2024年被稱為AI應用的元年。很多AI應用生產(chǎn)的多模態(tài)內(nèi)容已經(jīng)基本“可用”,大多數(shù)用戶也告別觀望,開始尋找符合自身需求的AI交付場景。
然而“可用”并不是最終目標,AI時代仍需邁向更進一步的階段——用戶需要更“實用”、更“好用”的AI,這該如何實現(xiàn)?
在回答這個問題之前,值得思考的是,AI應用還“不夠好用”的痛點是什么。
首先,大模型已經(jīng)非常普及,也全面進入了深度思考階段。AI可以為我們出謀劃策,但做到真正能干活、能實現(xiàn)交付的案例還是鳳毛麟角。
縱觀市面上的AI應用,大部分仍然匱乏上下文語境貫通和跨平臺調(diào)用能力。在封閉環(huán)境下,非??简炗脩舳噍唽υ挼哪托暮汀吧筛怕省?。品控參差不齊,也會讓用戶不敢把它用到更專業(yè)復雜的交付場景中。
其次,從ChatGPT到DeepSeek,用戶輸入prompt的門檻已經(jīng)大幅簡化,但還是依賴用戶自身的邏輯表達和資料整理,造成了很多輸入負擔和輸入成本。
再次,在沒有多模態(tài)輸入和輸出的成熟解決方案之前,AI只能“聰明”地思考,但不能“干活”。用戶受限于不同AI應用的單點功能對素材模態(tài)處理的局限,往往需要不斷地切換應用、更換平臺,輸入、輸出的思路也被頻繁打斷。Manus等AI Agent的能力上限,就明顯受到了這方面的制約。
在這些明確的挑戰(zhàn)下,提升模型能力不再直接對等AI交付能力的躍遷。百度文庫和百度網(wǎng)盤也已經(jīng)意識到,用戶需求并不是學習如何使用AI,而是在“不學習AI、不精準掌握提示詞結(jié)構(gòu)”的前提下就能穩(wěn)定得到高質(zhì)量交付結(jié)果。而且是能在任何時間、任何地點、任何終端,輸入任何指令或多模態(tài)文件,都能端到端地迅速生成多模態(tài)格式的內(nèi)容,這才符合大眾對AI“聰明能干”的心理預期。
正是在這個從量變到質(zhì)變的關鍵節(jié)點,“滄舟OS”給出了正確的方向:讓AI朝著“無所不能、無處不在”邁進。
好的系統(tǒng),需要端到端的高質(zhì)量交付
在MCP的“連接”價值體系下,想要讓每一個應用場景都實現(xiàn)端到端的交付,技術、工具、服務,每個鏈條上的價值創(chuàng)新都是必不可缺的。
所以,端到端的交付,意味著一站式系統(tǒng)級的完整生成體驗。就像有了Windows系統(tǒng)以后,用戶不再需要參與編碼就能讓計算機干活一樣,想要讓百度文庫、百度網(wǎng)盤龐大的用戶群體“平等”地用AI干活,同樣需要一套AI原生的操作系統(tǒng)。
比如,百度文庫和百度網(wǎng)盤去年發(fā)布的自由畫布,就是一個改變Chatbot交互方式的、多模態(tài)理解生成、多任務并行協(xié)作的操作系統(tǒng),就是為了降低AI門檻而生,可以說是“滄舟OS”的一個Beta版。
李彥宏在Create2025上介紹道:“自由畫布多個模型組合使用的能力,現(xiàn)在已經(jīng)沉淀為一個完整的技術底座——滄舟OS。這是一個為內(nèi)容而生的操作系統(tǒng)?!?/p>
“滄舟OS”解決問題的思路更加簡單直接:讓AI實現(xiàn)系統(tǒng)級的進化。也就是說,用戶把全模態(tài)的材料和指令輸入這套系統(tǒng),通過更加自由的交互和操作,直接生產(chǎn)出全模態(tài)、可交付的內(nèi)容,這不再是單一的工程化思路,而是一個端到端的系統(tǒng)。
而端到端的系統(tǒng),至少要滿足三點:一是讓用戶沒有輸入的門檻,二是需要工具鏈和上下文記憶完整且開放,三則是多模態(tài)混合輸入輸出的內(nèi)容精準豐富。
這樣的操作場景一旦被驗證,就會迅速挑戰(zhàn)和迭代現(xiàn)有的OS生產(chǎn)力體系。而想要超過傳統(tǒng)定義的操作系統(tǒng),AI時代的操作系統(tǒng),需要在三件事情上有突破:內(nèi)容更個性、交互更便捷、工具更全面。
“滄舟OS”的三層架構(gòu)也與之一一對應。
在底座基建上,“滄舟OS”構(gòu)建了“三大庫”。這也是基于百度文庫和百度網(wǎng)盤積淀多年的文庫公域知識庫、網(wǎng)盤用戶授權的私域知識庫和用戶的記憶庫,以及對知識強大的加工和知識提取能力。讓用戶在任務中沒有門檻地獲取和調(diào)用知識數(shù)據(jù)。
公私域知識庫之所以是百度文庫和網(wǎng)盤的壁壘,是因為文庫積累的海量知識可以幫助推理,多模態(tài)輸出結(jié)果更專業(yè)可信,網(wǎng)盤知識則讓生成內(nèi)容更符合用戶個性化的需求和靈感。
在中樞系統(tǒng)上,想要彌合效率場景的“斷層”,輸入與輸出、生產(chǎn)與協(xié)作必須是高度集成且易操作的,這也是今后所有OS系統(tǒng)和AI終端都會發(fā)力的場景。“滄舟OS”因此構(gòu)建了“三大器”,不僅擁有百度文庫、百度網(wǎng)盤自研的集成AI能力的閱讀器、編輯器、播放器,還能通過“調(diào)度中樞”,通過交互組件、意圖模型和傳輸基建等,結(jié)合用戶記憶和畫像數(shù)據(jù)、充分理解用戶意圖,實現(xiàn)多模型、多智能體的并行協(xié)作和高效調(diào)度。
在應用服務上,回歸操作系統(tǒng)自身的屬性,“滄舟OS”基于MCP協(xié)議,集成了文庫、網(wǎng)盤數(shù)百項AI Agent,生成模態(tài)涵蓋了圖片、圖表、文檔、音頻、視頻等各種類格式的素材、全面覆蓋學習辦公、生活娛樂等多元化實用場景,還擁有靈活擴展的能力。
與PC、移動端操作系統(tǒng)相比,“滄舟OS”很好地體現(xiàn)了AI OS的價值特性,讓數(shù)據(jù)的個性化和MoE帶來的模型多元性和精確性流動到各個場景、各個終端中,探索真正的“無處不在”。
同時,“滄舟OS”結(jié)合著龐大的公私域知識數(shù)據(jù),以及數(shù)百個已經(jīng)被用戶長期驗證過的AI能力,滿足用戶通用又細分的需求場景,才有機會朝向“無所不能”邁進。
聰明能干活,是驗證AI的唯一方式
李彥宏在Create2025上公開發(fā)布:百度文庫AI功能的付費用戶已經(jīng)超過4000萬,月活用戶達到了9700萬,成為了真正的“超級生產(chǎn)力”。
那么,在有了一套“OS”系統(tǒng)之后,如何讓這套系統(tǒng)為如此大規(guī)模的用戶賦能?
基于“滄舟OS”,百度文庫、百度網(wǎng)盤推出了兩個全新能力,“GenFlow超能搭子”“AI筆記”,這兩個能力也體現(xiàn)出,在AI OS系統(tǒng)之上,AI功能的體驗、AI的交互界面也可以像水一樣柔性而有力地流動,在不同的應用形態(tài)中去探索AI“無所不能、無處不在”的可能性。
比如,百度文庫APP的GenFlow超能搭子,在人機協(xié)作的原理上是WorkFlow的全面迭代。WorkFlow一般用于指代一切都規(guī)定好的工作流,是寫死的,非機動性的;而GenFlow的邏輯則是通過AI的思考規(guī)劃,自主調(diào)用各種模型和PPT、文檔、腦圖、海報等Agent,最終輸出多模態(tài)內(nèi)容。
在很多“意想不到”的場景上,GenFlow都表現(xiàn)出了對于簡單口語化訴求的深度理解,活干得又快又漂亮,讓用戶本來只是抱著試一試的心態(tài),驚喜地發(fā)現(xiàn)得到的東西竟然能直接用于交付。
比如在GenFlow輸入“我五一要在海南舉辦婚禮,幫我做一個圖文并茂的婚禮策劃和婚禮邀請函”,這樣一個簡單的口語化指令,但對于AI來說,它的復雜性在于——理解需求的工作流:一個完整的婚禮策劃不但需要有實用的方案、大量的用戶偏好和定制化內(nèi)容,還涉及邀請函等物料的制作。
可以看到,GenFlow聰明地結(jié)合當?shù)氐牧曀住龅睾蜁r間的特性,通過多輪對話和回顧歷史記錄來主動確認用戶的喜好、預算、流程等,并通過模型推理解析需要用哪些多模態(tài)輸出方式呈現(xiàn)給用戶,這些是GenFlow“像人一樣思考”的推理過程。到了多模態(tài)輸出這一層,則會調(diào)用PPT工具、海報設計工具等,幾分鐘內(nèi)即可同時生成高質(zhì)量的婚禮策劃PPT和邀請函海報,且生成的內(nèi)容用戶都可以在操作系統(tǒng)里直接編輯。
同時,相對于市面上的多智能體協(xié)作產(chǎn)品,GenFlow超能搭子不僅是立等可用的“現(xiàn)貨”,也能實現(xiàn)分鐘級交付,在生成質(zhì)量上穩(wěn)定性更高,還克服了同類產(chǎn)品無法多輪對話調(diào)優(yōu)的缺陷。
第二個是百度網(wǎng)盤的AI筆記,這也是目前市場上第一個多模態(tài)AI筆記產(chǎn)品,而百度網(wǎng)盤思考的原點,是探索究竟什么是一個“好的筆記”。用戶對于筆記的需求,無非就是要求信息全面、準確、知識呈現(xiàn)結(jié)構(gòu)化、邏輯完整,重點知識可沉淀、再利用,以及筆記和學習資料能夠進行深度融合,便于多次回顧、復習。
而現(xiàn)在用戶的學習資料大多是視頻、圖像、文本等多種模態(tài),現(xiàn)在市面上的筆記產(chǎn)品很難同時滿足用戶的上述需求,百度網(wǎng)盤充分發(fā)現(xiàn)了這一痛點,對用戶的私域?qū)W習知識庫進行了充分激活,也讓學習內(nèi)容和筆記實現(xiàn)了絲滑聯(lián)動。
比如在觀看網(wǎng)盤中存儲的學習視頻時,用戶即可在網(wǎng)盤的播放界面?zhèn)冗厵谥?,通過AI筆記能力自動生成全面、清晰、結(jié)構(gòu)化的多模態(tài)AI筆記,并與視頻內(nèi)容完全關聯(lián)。用戶還可一鍵生成AI思維導圖、概覽視頻結(jié)構(gòu),并可基于視頻內(nèi)容AI出題,測試知識掌握程度。未來,用戶還可以在筆記中自主添加教材、資料等其他知識內(nèi)容,還能基于知識進行AI全網(wǎng)搜索,從而生成更加詳實、完整的AI筆記。
這兩個能力其實只是百度文庫、網(wǎng)盤海量能力的冰山一角,隨著更多企業(yè)MCP化、加入滄舟OS等系統(tǒng)生態(tài),構(gòu)建自己的AI應用、Agent,更多的單點能力也會隨之迸發(fā)出來。
能力之外,開放生態(tài)的長期價值
而讓更多的企業(yè)和開發(fā)者加入進來,也是整個AI行業(yè)能夠把“做大的蛋糕”賣出去的關鍵。
所以,為了讓生態(tài)和應用發(fā)揮最大價值,百度文庫、百度網(wǎng)盤基于“滄舟OS”,率先將MCP充分運用到產(chǎn)品與生態(tài)的鏈接上,構(gòu)建MCP Server-Client-Host三層體系,將文庫、網(wǎng)盤的能力通過MCP Server形式開放,供更多企業(yè)和開發(fā)者使用。
從百度文庫和網(wǎng)盤迅速把自身Server工具化也可以看出,現(xiàn)在基于MCP協(xié)議做架構(gòu)創(chuàng)新的AI領域,比起激戰(zhàn),更像是一種競合關系。
企業(yè)端的應用合作,不會只發(fā)生在數(shù)字世界。比如,三星作為硬件廠商,已經(jīng)在擁抱MCP在內(nèi)容消費端的價值。
目前,三星手機也在接入百度文庫網(wǎng)盤文件上傳、下載、檢索、內(nèi)容理解等多個MCP Server。接入以后,三星用戶在手機的語音助手界面就可以直接實現(xiàn)文件上傳網(wǎng)盤備份、云端分享、文檔摘要總結(jié)和內(nèi)容問答等功能。
另一方面,這些Server也在豐富三星手機系統(tǒng)的云存儲能力,解決硬件自身針對大文件、多文件批量備份和分享的痛點。舉個例子,圖片影音文件“即看即存”、文件批量交付,以后就有機會在三星手機上輕松實現(xiàn)了。
同時,在IoT設備上,百度網(wǎng)盤也和牛聽聽達成了合作,牛聽聽是超600萬高知家庭使用的兒童智能硬件頭部品牌,百度網(wǎng)盤已經(jīng)成為牛聽聽最受歡迎的第三方應用。
這些場景足夠簡單實際,能讓普通人覺得AI聰明會干活,所以也是當下AI應用最迫切的需求場景切入點。
也就是說,只要解決的問題夠多、夠深,就能引起用戶心智的快速認知和足夠重視。所以,比起先發(fā)優(yōu)勢,比別的產(chǎn)品聰明好用才是AI最大的壁壘。而聰明好用,也是驗證AI未來商業(yè)化空間的先決條件。
從滄舟OS的發(fā)布時間,可以看出百度文庫和百度網(wǎng)盤對于AI領域的判斷邏輯,也是站在用戶亟須讓AI聰明、能干活的內(nèi)容創(chuàng)作需求,而非把技術突破強塞給市場去消化。
對此,開發(fā)者更能夠感受到,未來不會有任何一家模型和一個AI應用能覆蓋所有長尾需求。在每一個細分賽道誰能跑出來,目前還都尚未可知,但生態(tài)和系統(tǒng)的“展卷”卻是必不可缺的。
2025年,我們都同意的一個觀點是,好的AI應該主動思考,主動去判斷自己怎么樣才能像人一樣工作,而不是讓人通過新一輪的學習和培訓去貼合AI的需求,本末倒置。為了省時提效而花大量時間學習如何提效,這是一個反直覺的矛盾。
而這個矛盾,模型本身的能力是解決不了的。只有從底層系統(tǒng)去發(fā)力,一層層簡化開發(fā)、適配場景、組裝應用,才能讓AI同時擁有大腦、四肢和器官,從終端用戶的口中來驗證AI應用的iPhone時刻。
好的操作系統(tǒng)像水一樣,水既是生存能源,也是航行方式,AI的想象空間也是如此。往小了看,它能為任何一個普通人提供知識和生產(chǎn)力;往大了說,它也會逐漸貫穿到一家企業(yè)、一個產(chǎn)業(yè)的生命周期中去,成為一種無所不能、無處不在的新質(zhì)“元素”。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.