谷歌 DeepMind 正式推出了他們迄今為止最智能的AI模型——Gemini 2.5。這次發布的第一個版本是Gemini 2.5 Pro 實驗版 (Experimental),谷歌稱其為“思考型模型”,在多個主流基準測試中實現了大幅領先,尤其在推理和代碼能力上表現驚人
劃重點
谷歌長期探索提升AI推理能力的方法,比如強化學習(RL)和思維鏈(Chain-of-Thought)提示。之前的 Gemini 2.0 Flash Thinking 是首次嘗試,而Gemini 2.5 通過顯著增強的基礎模型和改進的后訓練技術,將這種“思考”能力提升到了新高度,并直接內建到模型中。這意味著未來的谷歌模型將能更好地處理復雜問題,支持更強大的、具備上下文感知能力的AI智能體(Agents)
Gemini 2.5 Pro 實驗版:性能炸裂,直接看數據!
這次的 2.5 Pro 實驗版絕非浪得虛名,它在衡量人類偏好的LMArena 排行榜上直接登頂,且優勢顯著,顯示出其強大的能力和高質量的輸出風格
以下是它在多個關鍵基準測試中的單次嘗試(pass@1)成績,對比了包括 OpenAI、Anthropic、Grok、DeepSeek 等友商模型(數據來源為谷歌官方及第三方榜單):
核心亮點解讀:
超強推理:在GPQA、AIME 2025 等高難度推理基準上表現卓越。特別是Humanity's Last Exam 無工具 18.8%的成績
高級編碼:相比 2.0 有巨大飛躍,擅長創建視覺效果好的Web應用、代碼智能體應用、代碼轉換和編輯。在行業標準SWE-Bench Verified 上,使用自定義智能體設置達到 63.8%
繼承并強化 Gemini 優勢:
?原生多模態:依然能理解文本、音頻、圖像、視頻甚至代碼庫。
?超長上下文窗口:發布即支持 100 萬 token,性能優于前代,即將支持 200 萬 token!處理海量數據和復雜信息源的能力更強
我用三個提示測試了一下Gemini 2.5 Pro 的前端代碼能力表現,總體感覺僅就前段來看Gemini 2.5 Pro不如deepseek v3 最新版,缺少了一些細節
提示1:幫我制作一個賽博朋克貪吃蛇游戲,在單個HTML中運行
Gemini 2.5 實現效果
作為對比,這是deepseek v3 0324
提示2:Create a single HTML file containing CSS and JavaScript to generate an animated weather card. The card should visually represent the following weather conditions with distinct animations: Wind: (e.g., moving clouds, swaying trees, or wind lines) Rain: (e.g., falling raindrops, puddles forming) Sun: (e.g., shining rays, bright background) Snow: (e.g., falling snowflakes, snow accumulating) Show all the weather card side by side The card should have a dark background. Provide all the HTML, CSS, and JavaScript code within this single file. The JavaScript should include a way to switch between the different weather conditions (e.g., a function or a set of buttons) to demonstrate the animations for each
Gemini 2.5 實現效果:
deepseek v3 0324 實現效果
提示3:模擬一個太陽系行星運動,在單個HTML中運行
Gemini 2.5 實現效果
deepseek v3 0324 實現效果
如何體驗
Gemini 2.5 Pro 實驗版現在已經可以在以下平臺體驗
Google AI Studio:開發者和企業用戶可以立即開始試驗
Gemini App (桌面和移動端):Gemini Advanced 用戶可以在模型下拉菜單中選擇。
此外,未來幾周內:
? 將登陸Vertex AI平臺。
? 將公布定價,并提供更高的速率限制,方便規模化生產使用
參考:
https://blog.google/technology/google-deepmind/gemini-model-thinking-updates-march-2025/#gemini-2-5-thinking
?星標AI寒武紀,好內容不錯過?
用你的贊和在看告訴我~
求贊
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.