99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

TPU 性能提升 10 倍,開源 A2A 顛覆智能體交互 |?Google?Cloud Next 25劃重點

0
分享至


作者 | 高玉嫻

Google Cloud Next 25 重要發布概覽:發布第七代 TPU Ironwood,提供更強的計算能力;存儲、網絡和計算方面的創新,有助于優化 AI 部署;Google 分布式云的優化,企業可以將 Gemini 模型部署到本地;Vertex AI 的創新,例如 Agent Development Kit 和 Agent2Agent 協議,可實現多智能體生態協同;Agentspace 的增強功能,使每個員工都能從 AI 中受益等。


美國時間 4 月 9 日,Google Cloud Next 25 在拉斯維加斯開幕。不出所料,今年的主角仍是 AI。但與以往不同的是,其發布亮點更多從技術突破轉向了價值交付,從單點創新轉向了規模化應用。

Google Cloud CEO Thomas Kurian 在開幕演講中表示,過去一年中,Google Cloud 和 Workspace 上已經推出了 3000 多項改進和更新,超過 400 萬開發者使用 Gemini,這使得 Vertex AI 用戶規模增長了 20 倍。他指出,這得益于 Gemini、Imagen(圖像生成模型)和 Veo(視頻生成模型)的快速普及,在企業需求推動下,Google Workspace 內部每月為企業用戶處理的 AI 請求量已經超過 20 億次,可以說從根本上重塑了工作方式。

AI 超級計算架構不斷完善和升級

這一系列生產力的革新首先源于谷歌在基礎設施層面的全面“AI 化”。


今年大會開幕演講的主題是“The New Way to Cloud”, 在筆者看來,其中所謂的“New Way”即是面向 AI 的,能夠滿足 AI 開發和應用需求的新方式。

Google 與 Alphabet CEO Sundar Pichai 強調,AI 的未來機會和潛力巨大,這也是 Alphabet 近幾年來持續大手筆投資 AI 基礎設施的重要原因。據他透露,2025 年谷歌將投入約 750 億美元用于服務器和數據中心建設。

與此同時,為了進一步幫助客戶擁抱 AI, Google Cloud 還宣布將以“谷歌速度”(接近零延遲)為全球數十億用戶提供云廣域網(Cloud WAN),與其他托管和開源 Kubernetes 產品相比,這意味著,Cloud WAN 能幫助 Google Cloud 客戶將網絡性能提升 40%,同時將總擁有成本(TOC)降低 40%。

芯片作為每年的關注焦點,今年谷歌推出了迄今為止規模最大、性能最強的第七代 TPU——TPU Ironwood。


據 Google Cloud 機器學習、系統和云人工智能副總裁 Amin Vahdat 介紹,TPU Ironwood 性能較前代高性能 TPU(v5p)提升了 10 倍以上,每個 Ironwood 單元搭載超過 9,000 顆芯片,每個單元可提供 42.5 exaflops 計算能力,是當今世界上最快的超級計算機 El Capitan 每個艙體性能的 24 倍,可以很好地滿足 Gemini 2.5 等 AI 模型日益增長的計算需求。

自去年與英偉達強強聯手以來,谷歌提供了非常廣泛的基于英偉達 GPU 的產品,這意味著用戶可以使用英偉達的最新硬件在 Google Cloud 上訓練生成式 AI 模型。今年,谷歌進一步推出了搭載英偉達 B200 和 GB200 Blackwell GPU 的 A4 和 A4X 虛擬機,顯著增強了 GPU 產品組合。據透露,Google Cloud 還將成為首批提供英偉達下一代 Vera Rubin GPU 的公司之一,該 GPU 每個機架可提供高達 15 exaflops 的 FP4 推理性能。

除了芯片之外,在谷歌看來,存儲是最大程度減少訓練和推理瓶頸的關鍵組件,而為了實現更高的吞吐量和更低的延遲,谷歌此次在存儲層面也進行了一系列更新,包括:

  • Hyperdisk Exapools:提供超大規模器的最高聚合性能和容量塊存儲,每個 AI 集群的容量高達 EB,性能高達每秒 TB 級;

  • 隨處緩存:能夠智能地將數據保存在靠近加速器的位置,將存儲延遲減少高達 70% ,并顯著加快訓練時間;

  • 快速存儲:這是谷歌的第一個區域對象存儲解決方案,與最快的同類云解決方案相比,隨機讀寫延遲降低了 5 倍。

軟件層面,谷歌推出了三項針對 AI 推理的重大增強功能,包括:

  • Google Kubernetes Engine (GKE) 推理:GKE 中的新推理功能,包括新一代 AI 感知擴展和負載平衡功能,可根據內部基準測試將服務成本降低 30% 、將尾部延遲減少 60% 并將吞吐量提高 40%;

  • Pathways 上線:由 Google DeepMind 開發,支持先進的多主機推理,可實現動態擴展,并以最優成本提供卓越的性能;

  • vLLM 可用性:將 vLLM 引入 TPU,使得已使用 vLLM 針對 GPU 優化 PyTorch 的客戶能夠輕松且經濟高效地在 TPU 上運行其工作負載,從而最大限度地利用其投資并提升靈活性。

AI 模型持續深入企業級場景

正是基于以上在 AI 超級計算機硬件和軟件等層面的持續性能提升,使得谷歌可以提供更加智能、更低成本、更低門檻的 AI 工具,而這,恰恰是企業級規模化 AI 應用的重要前提。


其中,Gemini 作為谷歌功能最強大的 AI 模型系列,兩周前谷歌就提前釋出了 Gemini 2.5 Pro 公開預覽版。據 Pichai 介紹,Gemini 2.5 Pro 現已在 AI Studio、Vertex AI 和 Gemini 應用程序中向所有人開放。

而在本次大會上,谷歌方面再次宣布,Gemini 2.5 Flash 即將登陸 Vertex AI。Gemini 2.5 Flash 是谷歌專為低延遲和成本效益而優化的主力模型,適用于實時摘要和文檔探索,其特點是能夠根據提示的復雜程度調整推理水平。此外,響應時間也可以根據問題的復雜程度進行調整,這意味著它需要更長的時間來響應需要事實核查的查詢。

除了 Gemini,谷歌還是為數不多提供涵蓋所有模式(包括圖像、語音、音樂和視頻)模型的公司,所有這些模型在本次大會上也有突破性的進展:

  • Imagen 3(文本轉圖像模型):改進了圖像生成和修復功能,可以重建圖像中缺失或損壞的部分。此次更新顯著提升了對象移除的質量,帶來更自然、更流暢的編輯體驗,在 LMArena 上排名第一;

  • Chirp 3(音頻生成模型):只需輸入 10 秒音頻就可以創建自定義語音,使企業能夠個性化配置呼叫中心、創作內容并建立獨特的品牌聲音。此外,新的轉錄功能還可以在多人對話中分離并識別單個說話人,顯著提高會議摘要、音頻分析和多方通話錄音等應用的轉錄清晰度和可用性;

  • Lyria(業界首款企業級文本轉音樂模型):可以將簡單的文本提示轉換為 30 秒的音樂片段,能夠生成高保真音頻,捕捉細微的差別,并呈現豐富細膩且涵蓋多種類型的音樂,用于企業營銷活動、產品發布、沉浸式店內體驗和其他數字內容創作;

  • Veo 2(視頻生成模型):推出智能擦除功能,可以去除不需要的背景圖像、logo 或干擾元素,無需手動修飾即可進行專業編輯;智能擴展功能,能延展現有視頻畫面素材,幫助用戶針對不同屏幕尺寸和平臺優化視頻規格;電影級運鏡技術,提供專業級的鏡頭構圖、拍攝角度與節奏把控方案;智能補幀,用戶只需設定視頻片段的起始與結束幀,即可自動生成流暢的過渡畫面。


在演示中,Vertex AI 產品總監 Nenshad Bardoliwalla 展示了如何協同以上工具制作音樂會宣傳視頻,并配有自定義音樂和復雜的編輯功能,例如從視頻片段中刪除不需要的元素。看下來整體操作非常絲滑,Bardoliwalla 表示:“只有 Vertex AI 能夠將所有這些模型以及第三方模型整合到一個平臺上?!?/p>

值得一提的是,今年大會開場前的現場 DJ 表演中的音樂視覺效果也是由谷歌 DeepMind 的視頻模型 Veo 2 生成。走 T 臺的花豹、水中徜徉的千紙鶴、吃冰淇淋的鸚鵡、水杯中跳水的運動員...... 這些馬行空的畫面和恰到好處的 BGM 卡點還是非常令人印象深刻的。

Vertex AI 模型矩陣擴展至 200+

平臺層面,我們看到 Vertex AI 自 2021 年發布至今,已經從一個模型托管與訓練平臺,轉變成一個模型訓練和部署的綜合平臺。僅在去年,Vertex AI 上 Gemini 的使用量就增長了 40 倍以上,目前每月 API 調用量達數十億次。

通過自動化和加速常規關鍵任務流程,Vertex AI 幫助諸多企業顯著提升了業務效率。例如,電商巨頭 Wayfair 通過自動化產品目錄優化流程,屬性更新速度提升 5 倍,運營效率大幅提升;全球能源企業 AES 運用生成式 AI 代理自動執行安全審計,使得審計成本驟降 99%,耗時從 14 天壓縮至 1 小時;德國商業銀行(Commerzbank) 為投資咨詢電話生成 AI 摘要,使得行政處理時間銳減 66%。

據 Kurian 介紹,Vertex AI 模型矩陣中目前擁有 200 多個模型,包括 Google 模型、來自 Anthropic、AI21 和 Mistral 等公司的第三方模型,以及 Gemma 和 Llama 等開放模型。最近,谷歌還添加了來自 CAMB.AI、Qodo 的模型,以及來自艾倫研究所 (The Allen Institute) 的完整開源模型組合。

在本次大會上,Vertex AI 也迎來了一系列新的進展:

  • Vertex AI 監控面板:可以實時追蹤使用量、吞吐量、延遲等關鍵指標,并提供錯誤診斷功能,讓企業可以全面掌握 AI 運行狀態;

  • 模型訓練與調優:支持基于 Gemini、Imagen、Veo 等谷歌原生模型,以及嵌入、翻譯模型和 Gemma、Llama、Mistral 等開源模型,以安全可靠的方式使用自有數據進行定制化訓練與調優;

  • Vertex AI 模型優化器:依托谷歌對 Gemini 的深度理解,根據企業對質量、速度和成本的偏好,自動將查詢路由至最佳性能模型和工具組合;

  • 實時 API(Live API):通過流式傳輸音視頻數據至 Gemini,實現真正的對話式交互,可以實時處理并響應富媒體內容,為沉浸式多模態應用開啟全新可能。

顛覆多智能體生態交互模式

對于近兩年來始終處于 AI 應用頂流圈的 Agent,幾乎也是本次大會現場的重頭戲。鑒于現場信息量很大,這里著重挑選幾個關注度較高的發布做下介紹。

其中最受關注的首當其沖是業界首個標準智能體交互協議——Agent2Agent 協議。該協議旨在幫助企業支持多智能體生態系統,使智能體能夠相互打通而不受底層技術的限制,也就是說,無論它們是由哪個供應商提供的,或者是基于哪個框架構建的都不受影響。

這一特性使得構建由多個專職智能體組成的企業級智能系統成為可能。例如,在企業級流程中,某個智能體可以負責候選人篩選,另一個安排面試時間,還有一個負責背景調查,而這一切都可以在統一的 agentic 接口中完成。

Kurian 表示:“Agent2Agent 協議目前可以支持包括埃森哲、Box、德勤、Salesforce、SAP、ServiceNow 和 TCS 等在內的 50 多家合作伙伴的企業應用平臺,他們有著共同的愿景,即讓智能體能夠在整個智能體生態系統中更順滑地運行。”

谷歌強調的這種互操作性,意味著谷歌把自己定位為異構 AI 生態系統中的連接點,這或許也預示著其正在擺脫云計算早期階段那種封閉式的模式。

與此同時,面向非技術人員,谷歌還升級了 Google Agentspace,包括 Agent Gallery 和 Agent Designer 等,用以幫助每一位企業員工用好 AI。在演示中,谷歌展示了一位銀行客戶經理如何使用這些工具分析客戶投資組合、預測現金流問題,并自動起草與客戶的溝通——所有這些都無需編寫任何代碼。

Kurian 透露,Agentspace 現已集成到 Chrome 瀏覽器中,這意味著用戶可以直接在瀏覽器中搜索公司數據,從而簡化工作流程并提高工作效率。

與此同時,谷歌還升級了 Google Agentspace,用以幫助每一位員工用好 AI。Kurian 透露,Agentspace 現已集成到 Chrome 瀏覽器中,這意味著用戶可以直接在瀏覽器中搜索公司數據,從而簡化工作流程并提高工作效率。

應用場景層面,谷歌現場演示了一系列 Agent,主要包括 Customer Agents、Creative Agents、Data Agents、Coding Agents 和 Security Agents 五大類。

其中 Customer Agents 能夠綜合和推理企業面向客戶的業務場景中各種不同類型的多模態信息,包括文本、音頻、圖像和視頻等等,并且以類似人類的語音和對話方式自然地進行溝通和互動,能夠代表用戶連接企業應用程序。不得不說,現場演示的 demo 還是比較驚艷的。

Data Agents 在企業工作流中也是非常重要的一部分,借助谷歌數據平臺 BigQuery 企業可以充分整合結構化和非結構化數據,并使用直接集成到 BigQuery 中的 Apache Iceberg 等開放格式,此外還可以使用 BigQuery 訪問任何存儲系統、任何 SaaS 應用或任何云平臺中的數據。

Coding Agents 應該是業界目前大家最為熟悉的應用場景,據介紹,如今谷歌已有超過 25% 的新代碼都是由 AI 生成,然后再交由工程師審核。Gemini 的快速性能、超長的上下文窗口和先進的推理能力使其非常適合用于編碼輔助。目前,谷歌已經在 Google Cloud、Android Studio、Firebase Studio 以及 IDE 中提供 Gemini Code Assist,隨著最新的 Code Assist Agent 發布,將進一步幫助用戶實現從代碼到整個軟件開發生命周期的各項工作的提效。

“未來將由我們所有人共同建設”

“我們正在提供一系列令人驚嘆的創新,并讓這些創新輕松地融入到企業現有的技術環境中?!盞urian 表示,Google Cloud 正致力于通過以下四個主要方式讓谷歌的創新更容易被采用:第一,更好的跨云網絡;第二,通過與 ISV 的合作改善 Google Cloud 集成方式和效率;第三,通過與服務合作伙伴合作推出各類型的 Agent;第四,通過 Google Cloud 提供開放的多云平臺并構建互操作性,進而加快 AI 應用的價值實現速度。

“我們很榮幸能與大家一起攜手構建這種全新的云服務方式,未來將由我們所有人共同建設” 。Kurian 強調。


可以看到,經過多年的前沿技術革新,谷歌對 AI 邊界的探索正不斷拓寬,從單一工具到端到端的 AI 平臺,從通用領域到垂直行業,從封閉到開放生態的構建,從 AI 試水到規模化部署?,F如今,谷歌的模型 + 平臺 + 芯片三位一體的差異化優勢正逐步顯現。

由北電數智主辦的首屆酒仙橋論壇,將于 2025 年 4 月 15 日 -20 日在北京數字經濟算力中心舉辦。本屆論壇以“AI 開啟新質生產力元年”為主題,匯聚產學研各界專家,聚焦“產業創新應用、生態發展與數智未來”三大議題,深入解析 AI 技術演進方向,挖掘場景落地實踐,鏈接技術、資本與產業資源,推動科技與產業深度融合。

圍繞 AI 在科研和工業場景的創新應用,酒仙橋分論壇特設「星火國產 AI 原生專場」,邀請產業鏈上下游的標桿企業與高校 / 科研機構,共探 AI 的產業融合之道。感興趣的小伙伴可以掃描二維碼或者點擊閱讀原文預約直播。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
獨家披露:辛瓦爾喪命內幕

獨家披露:辛瓦爾喪命內幕

西樓飲月
2025-04-15 21:56:35
氣壞了,登貝萊賽后沒領最佳球員獎便徑直走向更衣室

氣壞了,登貝萊賽后沒領最佳球員獎便徑直走向更衣室

懂球帝
2025-04-16 05:57:14
“誰讓你改的去問誰!”三河禁色通報來了,但涉嫌侮辱公眾智商

“誰讓你改的去問誰!”三河禁色通報來了,但涉嫌侮辱公眾智商

二向箔
2025-04-15 19:25:42
加拿大將對部分美國商品給予為期6個月關稅減免,旨在為企業調整供應鏈提供過渡

加拿大將對部分美國商品給予為期6個月關稅減免,旨在為企業調整供應鏈提供過渡

界面新聞
2025-04-15 22:04:42
偉大的10-8!趙心童淘汰名將,中國斯諾克創紀錄,周躍龍德比大勝

偉大的10-8!趙心童淘汰名將,中國斯諾克創紀錄,周躍龍德比大勝

劉姚堯的文字城堡
2025-04-16 03:01:23
歐冠狂歡夜:巴薩5-3+巴黎5-4,攜手晉級4強!多特+維拉贏球出局

歐冠狂歡夜:巴薩5-3+巴黎5-4,攜手晉級4強!多特+維拉贏球出局

侃球熊弟
2025-04-16 03:44:15
哭麻了!現代梁祝,妻子去世,丈夫日夜抱著妻子遺像!最后殉情!

哭麻了!現代梁祝,妻子去世,丈夫日夜抱著妻子遺像!最后殉情!

觀察鑒娛
2025-04-15 10:34:35
10家大醫院專家齊發聲:這10種病純屬忽悠,其實不用治!

10家大醫院專家齊發聲:這10種病純屬忽悠,其實不用治!

小刀99
2025-04-15 11:14:19
特朗普破防了,中國就是不理他!

特朗普破防了,中國就是不理他!

大象新聞
2025-04-15 15:10:04
這次能否成功?巴黎6年4進歐冠半決賽,此前最佳成績是亞軍

這次能否成功?巴黎6年4進歐冠半決賽,此前最佳成績是亞軍

雷速體育
2025-04-16 06:51:11
景德鎮撞死一家三口司機當庭鞠躬道歉,辯稱天太晚看不見

景德鎮撞死一家三口司機當庭鞠躬道歉,辯稱天太晚看不見

中國新聞周刊
2025-04-15 16:43:38
針對不婚不育年輕人,國家又出新政策了!網友:有閨女的天塌了…

針對不婚不育年輕人,國家又出新政策了!網友:有閨女的天塌了…

派大星紀錄片
2025-04-15 15:26:41
外媒:歐足聯批準了皇馬VS阿森納次回合關閉伯納烏頂棚的要求

外媒:歐足聯批準了皇馬VS阿森納次回合關閉伯納烏頂棚的要求

直播吧
2025-04-16 00:29:15
145%關稅重壓,美國訂單為何逆勢暴漲?中國工廠老板說出扎心真相

145%關稅重壓,美國訂單為何逆勢暴漲?中國工廠老板說出扎心真相

歸史
2025-04-15 18:19:40
感謝這屆神通廣大的網友!江西一家三口被撞案,肇事者父母都被扒

感謝這屆神通廣大的網友!江西一家三口被撞案,肇事者父母都被扒

青青子衿
2025-04-16 02:19:11
中國留學生自曝在俄羅斯遭歧視,有人貼中文標語,公然侮辱中國人

中國留學生自曝在俄羅斯遭歧視,有人貼中文標語,公然侮辱中國人

可達鴨面面觀
2025-04-15 14:47:38
特朗普,最新發聲!美股股指期貨,集體跳水!

特朗普,最新發聲!美股股指期貨,集體跳水!

證券時報e公司
2025-04-15 21:38:31
武岡二中國家二級保護300年銀杏被砍,教務處:砍樹者已經被刑拘

武岡二中國家二級保護300年銀杏被砍,教務處:砍樹者已經被刑拘

正在新聞
2025-04-15 13:42:15
沙溢一嘴烤瓷牙,比他暴瘦36斤還嚇人,上次被牙嚇到的還是劉濤呢

沙溢一嘴烤瓷牙,比他暴瘦36斤還嚇人,上次被牙嚇到的還是劉濤呢

鄉野小珥
2025-04-16 00:54:03
萬斯在社交媒體上發帖詢問,是不是應該把對華關稅提升到300%?

萬斯在社交媒體上發帖詢問,是不是應該把對華關稅提升到300%?

風華講史
2025-04-15 09:37:15
2025-04-16 07:08:49
InfoQ incentive-icons
InfoQ
有內容的技術社區媒體
11017文章數 51223關注度
往期回顧 全部

科技要聞

小鵬汽車MPV車型改款上市,35.98萬起

頭條要聞

中國不理他特朗普破防了 稱中國為"敵對貿易國家"

頭條要聞

中國不理他特朗普破防了 稱中國為"敵對貿易國家"

體育要聞

惡性循環!錫伯杜的壓榨哲學是對是錯?

娛樂要聞

娛樂圈模范夫妻塌房?私生活曝光!

財經要聞

李強:以更大力度促進消費擴大內需

汽車要聞

19.99萬起 廣汽本田P7能在新能源分一杯羹?

態度原創

時尚
藝術
親子
數碼
健康

春天穿“韓系少女風”的你,美到離譜!

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

親子要聞

寶寶為了吃冰淇淋有多努力,還會提前查看媽媽是否睡著。

數碼要聞

Beats 推出全新充電線系列

在中國,到底哪些人在吃“偉哥”?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 博湖县| 太白县| 乐亭县| 航空| 勐海县| 凤凰县| 弋阳县| 普陀区| 滕州市| 武隆县| 固安县| 通榆县| 邓州市| 古丈县| 荣昌县| 罗城| 东乡县| 邹平县| 上饶市| 农安县| 盘锦市| 平遥县| 苏尼特左旗| 钦州市| 湘乡市| 宜阳县| 长岛县| 阿克| 白朗县| 清新县| 怀远县| 通辽市| 昭苏县| 格尔木市| 合阳县| 汕头市| 庄河市| 洛川县| 进贤县| 苗栗县| 全州县|