剛剛在拉斯維加斯召開的谷歌云下一步(Google Cloud Next '25)大會上,谷歌向世界展示了其在人工智能領域的強大野心,通過一系列重磅公告試圖在日益激烈的云 AI 市場中鞏固自己的領導地位。從全新設計的芯片到革命性的互操作性協議,從新的推理模型到無代碼代理開發工具,谷歌在會議上釋放了其近期最全面的 AI 攻勢。
今年的谷歌云大會主題明確指向了 AI 發展的新階段,谷歌將其定義為“推理時代”(age of inference)——AI 不再僅僅是對用戶請求做出即時響應,而是能夠主動檢索和生成數據,協作提供見解和解答。谷歌云 CEO Thomas Kurian 在大會上強調,他們的戰略是“承諾提供世界級的基礎設施、模型、平臺和代理;提供開放、多云平臺以實現靈活性和選擇;并構建互操作性”。
根據谷歌在今年 1 月發布的財報,其 2024 年第四季度云業務收入達到 120 億美元,同比增長 30%。谷歌高管表示,AI Studio 和 Gemini API 的活躍用戶僅在過去一個月就增長了 80%,在此強勁勢頭下,谷歌連續發布多項創新技術,試圖重新定義 AI 基礎設施和應用的未來發展方向。
Ironwood:專為推理模型設計的全新 TPU 芯片
在一系列發布中,最吸引人眼球的無疑是谷歌的第七代張量處理單元(TPU)——Ironwood。與之前同時兼顧訓練和推理的 TPU 不同,Ironwood 是谷歌首款專為推理工作負載設計的芯片,標志著其 AI 芯片設計理念的根本性轉變。
“Ironwood 是我們迄今為止最強大、最具擴展性和能源效率的 TPU,專為規模化部署思考型、推理型 AI 模型而設計,“谷歌機器學習、系統和云 AI 副總裁兼總經理 Amin Vahdat 在發布會上表示。“它標志著 AI 發展和支持其進步的基礎設施的重大轉變,從提供實時信息供人解讀的響應式 AI 模型,轉向提供主動式見解生成和解釋的模型。”
圖丨 Ironwood(來源:Google)
為支撐這種高級 AI 能力,Ironwood 在多項技術指標上實現了大幅提升。首先,在核心的計算性能方面,當配置為包含 9216 顆芯片的完整計算集群時,據谷歌公布的數據,Ironwood 能夠提供高達 42.5 Exaflops 的 FP8(8 位浮點)峰值計算力。谷歌將其與當前世界領先的超級計算機之一 El Capitan 進行了對比,稱其算力達到后者的 24 倍以上,但需要注意這種比較基于特定的精度(FP8)和潛在的理想化條件,且超級計算機通常針對不同的科學計算負載進行優化。即便如此,42.5 Exaflops 的 FP8 算力對于大規模部署需要高吞吐量和低延遲的推理任務而言,仍是一個相當可觀的數字。單顆 Ironwood 芯片的峰值 FP8 算力也達到了 4614 TFLOPS。
圖丨相對于 TPU v2,Ironwood FP8 峰值浮點運算性能的提升
其次,Ironwood 在內存子系統方面進行了大幅升級。每顆芯片配備了 192GB 的高帶寬內存(HBM),這一容量是其上一代 TPU Trillium(配備 95GB HBM)的兩倍多,相較于更早的 TPU v4(配備 32GB HBM)更是提升了六倍。同時,內存帶寬也提升至 7.2 Tbps,相比 Trillium 的 2.8 Tbps 有了顯著增長。更大的內存容量意味著可以在芯片本地緩存更大規模的模型參數和更長的上下文信息,減少對外部存儲的訪問;更高的帶寬則能更快地將數據喂給計算單元,這兩者對于降低推理延遲、提升復雜模型處理效率具有直接作用。
再者,能源效率也是 Ironwood 設計的關鍵考量。谷歌表示,Ironwood 的每瓦性能(performance per watt)相較于 Trillium 提升了約兩倍,并且比 2018 年推出的第一代谷歌云 TPU 的能效高出近 30 倍。在數據中心能耗日益成為瓶頸和主要運營成本的背景下,能效的提升對于 AI 技術的可持續發展和大規模經濟化部署具有重要價值。谷歌還強調了其配套的先進液冷散熱技術,旨在確保芯片在高負載下能夠穩定、高效地運行。
谷歌還強調 Ironwood 將與其機器學習運行時 Pathways 配合使用,使開發者能夠輕松地利用數萬個 Ironwood TPU 的組合計算能力。對企業客戶而言,Ironwood 將提供兩種配置:256 芯片配置和 9,216 芯片配置,計劃于今年晚些時候推出。
Agent2Agent:AI 代理互操作性的新標準
如果說 Ironwood 代表了谷歌在 AI 算力基礎上的持續深耕,那么 Agent2Agent (A2A) 協議的發布則體現了其試圖構建一個開放、協作的 AI 應用生態的戰略意圖。
當前,隨著不同企業和開發者構建出大量針對特定領域或任務的 AI Agent,一個日益嚴重的問題是這些 Agent 往往運行在隔離的平臺、框架或數據環境中。這種“碎片化”狀態嚴重限制了 Agent 之間進行有效協作的可能性,使得實現跨系統、跨業務流程的復雜自動化任務變得困難重重。
為應對這一挑戰,谷歌聯合了超過 50 家技術合作伙伴與服務提供商(包括 Atlassian、Salesforce、SAP、ServiceNow、Cohere、Langchain 等軟件公司,以及 Accenture、Deloitte、PwC 等咨詢服務機構),共同發起并推出了一個全新的開放協議——Agent2Agent (A2A)。
A2A 的核心目標是定義一套標準的通信規范和互操作框架,使得由不同供應商開發、基于不同技術棧構建的 AI Agent 能夠相互發現、安全地交換信息、協調行動并協同完成任務。該協議的設計圍繞幾個關鍵原則展開:首先是能力發現(Capability Discovery),A2A 允許每個 Agent 通過一個結構化的“Agent Card”(以 JSON 格式定義)來描述自身的功能、可處理的任務類型、輸入輸出要求等信息。這使得一個需要幫助的“客戶端 Agent”能夠查詢并識別出最適合執行某項特定子任務的“遠程 Agent”。
圖丨 A2A 的工作原理(來源:Google)
其次是任務管理(Task Management),A2A 將 Agent 間的交互聚焦于完成最終用戶的請求。協議定義了一個明確的“任務(task)”對象及其生命周期管理機制。通信流程圍繞任務的創建、執行、狀態更新和完成進行。這套機制既能支持可以立即響應的短時任務,也能支持需要較長時間運行(可能數小時甚至數天)、涉及多輪交互甚至可能需要人工介入的復雜研究或處理流程。協議確保了參與同一任務的多個 Agent 能夠就任務進展保持同步,并能可靠地傳遞任務的最終產出物,這些產出物在協議中被稱為“artifact”。
第三是協作與通信(Collaboration),A2A 定義了 Agent 之間發送結構化消息的規范,用以傳遞必要的上下文信息、中間步驟的回復、最終的“artifacts”以及來自用戶的具體指令或修正。
第四是用戶體驗協商(User Experience Negotiation),認識到 Agent 交互的多樣性,A2A 協議的設計超越了純文本交互。它支持 Agent 之間就最適合向用戶或調用方呈現信息的方式進行協商。例如,一個 Agent 可能生成了圖像數據,另一個 Agent 可能需要處理視頻流,或者需要在用戶界面嵌入一個 Web 表單(iframe)以收集用戶輸入。A2A 的消息結構設計(包含帶有明確內容類型定義的“parts”)允許進行這種靈活的格式與交互方式協商。
最后,A2A 協議強調基于現有標準與安全性。它構建在如 HTTP、Server-Sent Events (SSE)、JSON-RPC 等廣泛應用的網絡協議和數據交換格式之上,旨在降低與現有企業 IT 基礎設施集成的難度。同時,協議在設計之初就考慮了企業級的安全需求,計劃提供與 OpenAPI 規范相當的認證和授權機制支持。
值得注意的是,A2A 與我們所熟知的 Anthropic 的模型上下文協議(Model Context Protocol,MCP)是不同的。谷歌官方及技術社區的普遍觀點認為兩者是互補而非競爭的關系。MCP 主要關注 Agent 與其所處環境的交互,即 Agent 如何發現并調用外部工具、訪問 API 或獲取數據資源。而 A2A 則專注于 Agent 與 Agent 之間的直接通信與協作流程。簡而言之,可以理解為 MCP 幫助 Agent 具備“做事的能力”,而 A2A 則幫助 Agent“找到合適的伙伴一起做事”。谷歌在其新發布的 Agent Development Kit (ADK) 中同時包含了對這兩種協議的支持,也印證了其認為兩者在構建復雜多 Agent 系統中各自具有不可或缺的價值。
A2A 還包含一些 MCP 所沒有的重要概念,例如任務準備度和長時間運行任務的狀態追蹤,使一個代理可以給另一個代理一個任務,幾天后完成,并通過 webhook 或輪詢獲得通知。這種功能對于企業環境中的復雜工作流程尤為重要。
谷歌已將 A2A 協議的規范草案作為開源項目發布,并設立了明確的貢獻途徑。公司表示正在與合作伙伴合作,計劃在今年晚些時候推出該協議的生產就緒版本。
谷歌的整合 AI 生態戰略:從智能模型到開發工具
在 Ironwood TPU 和 A2A 協議這兩大重點發布之外,谷歌還推出了一系列相互關聯的 AI 創新,共同構建了一個從模型到開發工具的完整生態系統。這些創新彼此銜接,形成了谷歌完整的“推理時代”戰略布局。
首先,谷歌擴展了其 Gemini 模型系列,推出了 Gemini 2.5 Flash,這是其前不久所推出的旗艦 AI Gemini 2.5 Pro 的高效版本,同樣具備谷歌所強調的推理能力。Gemini 2.5 Flash 的一個特點是能夠根據輸入提示的復雜度動態調整其推理深度,從而在響應速度和結果質量之間取得平衡,適用于對成本和延遲較為敏感的日常應用場景。
為了使這些模型能夠真正發揮作用,谷歌同時推出了一系列代理開發工具。公司推出了代理開發套件(Agent Development Kit,ADK),允許開發者用不到 100 行代碼構建多代理系統。對于非技術用戶,谷歌增強了其 Agent Space 平臺,添加了 Agent Gallery(提供可用代理的單一視圖)和 Agent Designer(創建自定義代理的無代碼界面)功能。這些工具充分利用了 A2A 協議的能力,使不同代理之間能夠無縫協作。
在內容創作領域,谷歌進一步擴展了其模型的多模態生成能力,更新了 Imagen(圖像生成)、Veo(視頻)、Chirp(音頻),并新推出了文本到音樂生成的模型 Lyria。
(來源:Google)
谷歌還通過 Cloud WAN 服務向企業開放其龐大的全球網絡基礎設施,使企業能夠訪問谷歌長達 200 萬英里的光纖網絡——與支持 YouTube 和 Gmail 等消費者服務的網絡相同。與客戶管理的網絡相比,Cloud WAN 將網絡性能提高多達 40%,同時將總擁有成本降低相同比例。這一基礎設施升級為運行 AI 工作負載的企業提供了更高效、更經濟的全球網絡連接,是谷歌全棧 AI 戰略的關鍵組成部分。
總結:谷歌全面押注“推理時代”
綜合來看,谷歌云 Next '25 大會發布的系列內容,全面地展現了谷歌意圖構建一個覆蓋從底層硬件(定制 TPU、全球網絡)到核心模型(Gemini 系列)、再到開發者生態(A2A 協議、ADK 工具)直至上層應用(Workspace 集成、行業解決方案)的全棧式 AI 能力體系。
尤其是,Ironwood TPU 的推出及其對“推理時代”的明確側重,也反映出當前 AI 發展的一個重要趨勢:隨著模型能力的增強,行業關注點正逐漸從單純追求更大的模型規模和更快的訓練速度,轉向如何更高效、更經濟地部署這些模型以執行實際任務,以及如何讓模型具備更強的自主解決問題的能力。推理成本和效率正成為衡量 AI 技術成熟度和商業可行性的關鍵指標。
而 Agent2Agent (A2A) 協議的提出,也顯示了谷歌試圖在日益復雜和多元化的 AI Agent 市場中扮演“連接者”和“標準制定者”角色的戰略意圖。通過倡導并聯合業界伙伴共同構建一個開放的互操作性協議,谷歌希望能夠打破當前存在的“技術孤島”,降低不同 AI 系統之間集成的復雜度和成本,從而促進一個更繁榮、更具活力的協作式 AI 生態系統的形成。這不僅可能加速 AI 技術在各行各業的滲透和應用創新,也可能為谷歌自身的云平臺和 AI 服務帶來更廣闊的市場空間和更強的用戶粘性。面對來自微軟(Azure、OpenAI 合作)、亞馬遜(AWS、Anthropic 合作、自研芯片)等主要競爭對手的激烈競爭,谷歌通過其獨特的垂直整合能力(自研 TPU)和推動開放標準的策略,試圖形成差異化優勢。
但另一方面,這種全線出擊的策略也意味著巨大的資源投入和執行風險。何況,谷歌內部也并非歲月靜好,用我們之前說過的一句話作為總結,“對谷歌來說,最大的挑戰可能不是技術本身,而是如何將這些技術轉化為可持續的商業模式,同時應對監管壓力、維護用戶信任,并保持創新速度。”
谷歌云 Next '25 無疑投下了重磅砝碼,但這場關乎未來的 AI 競賽,才剛剛進入更復雜的深水區。
參考資料:
1.https://cloud.google.com/blog/topics/google-cloud-next/welcome-to-google-cloud-next25
2.https://blog.google/products/google-cloud/ironwood-tpu-age-of-inference/
3.https://developers.googleblog.com/en/a2a-a-new-era-of-agent-interoperability/
4.https://venturebeat.com/ai/google-cloud-next-25-new-ai-chips-and-agent-ecosystem-challenge-microsoft-and-amazon/
5.https://techcrunch.com/2025/04/09/google-unveils-ironwood-a-new-ai-accelerator-chip/
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.