å‰›å‰›ï¼Œè°·æŒæ£å¼æŽ¨å‡ºæ–°ä¸€ä»£ AI 模型 Gemini 2.5,主打“æ€è€ƒ - é©—è‰ - 回ç”â€çš„æ™ºèƒ½æŽ¨ç†èƒ½åŠ›ï¼Œå®˜æ–¹ç¨±å…¶ç‚ºâ€œç›®å‰æœ€æ™ºèƒ½çš„ AI 模型â€ã€‚
據谷æŒç¨±ï¼Œé€™å€‹æœ€æ–°ç‰ˆæœ¬å°‡â€œé¡¯è‘—å¢žå¼·çš„åŸºç¤Žæ¨¡åž‹èˆ‡ç¶“éŽæ”¹é€²çš„åŽè¨“ç·´è¨è¨ˆâ€çµåˆèµ·ä¾†ï¼Œç”±æ¤ç²å¾—更好的整體性能。該公å¸å®£ç¨±ï¼ŒGemini 2.5 Pro 實驗版在ç†è§£èƒ½åŠ›ã€æ•¸å¸èƒ½åŠ›ã€ç·¨ç¢¼èƒ½åŠ›ç‰å¸¸è¦‹çš„ AI 基準測試指標上å‡å·²é ˜å…ˆäºŽ OpenAIã€Anthropicã€xAI 乃至 DeepSeek。
據悉,谷æŒå°è©²æ¨¡åž‹é€²è¡Œäº†å¤šé …æ ¸å¿ƒèƒ½åŠ›å‡ç´šã€‚
多模態ç†è§£æ–¹é¢ï¼Œæ”¯æŒæ–‡æœ¬ã€åœ–åƒã€éŸ³é »ã€è¦–é »ã€ä»£ç¢¼æ··åˆè¼¸å…¥ï¼Œå¯åŒæ™‚分æžä¸åŒæ¨¡æ…‹çš„ä¿¡æ¯å¹¶é—œè¯æŽ¨ç†ï¼›100 è¬ token 上下文窗å£ï¼ˆç´„ 75 è¬å–®è©žï¼‰ï¼Œèƒ½ä¸€æ¬¡æ€§è§£æžã€ŠæŒ‡ç’°çŽ‹ã€‹ä¸‰éƒ¨æ›²çš„å…¨éƒ¨æ–‡æœ¬ï¼Œæœªä¾†å°‡å‡ç´šè‡³ 200 è¬ token,進一æ¥å¼·åŒ–長文檔處ç†èƒ½åŠ›ã€‚
Google AI Studio 產å“ç¶“ç† Logan Kilpatrick 在 X(原 Twitter)上表示,Gemini 2.5 Pro æ˜¯â€œé¦–å€‹æ”¯æŒæ›´é«˜è«‹æ±‚速率é™åˆ¶å’Œè¨ˆè²»çš„實驗性模型â€ã€‚
在代碼生æˆèƒ½åŠ›æ–¹é¢ï¼ŒAider Polyglot 代碼編輯測試:得分 68.6%,超越 OpenAI å’Œ Anthropic çš„åŒé¡žæ¨¡åž‹ï¼›SWE-bench Verified 測試(真實代碼任務測試):以 63.8% 的準確率僅次于 Claude 3.7 Sonnet(70.3%)。
在數å¸èˆ‡ç§‘å¸æŽ¨ç†æ–¹é¢ï¼Œåœ¨â€œäººé¡žæœ€åŽè€ƒè©¦â€ï¼ˆå¤šæ¨¡æ…‹ç¶œåˆæ¸¬è©¦ï¼‰ä¸ï¼Œä»¥ 18.8% çš„æº–ç¢ºçŽ‡é ˜å…ˆå¤šæ•¸ç«¶å“,且無需ä¾è³´å¤–部計算工具,完全ä¾é 模型自身推ç†èƒ½åŠ›ã€‚
DeepMind CEO Demis Hassabis 在 X 上發帖稱,Gemini 2.5 Pro 是“一款éžå¸¸æ£’的先進模型,在 LMArena 上以驚人的 +39 ELO 得分排å第一,而且在多模態推ç†ã€ç·¨ç¢¼èˆ‡ STEM ç‰æ–¹é¢å‡å¯¦ç¾äº†é¡¯è‘—改進。â€
è°·æŒé‚„æåˆ°ï¼Œæ¤ç•ªåœ¨è³ªé‡ä¸Šçš„巨大飛èºï¼Œæ£æ˜¯ç”±äºŽ Gemini 新版本“推ç†â€æ¨¡åž‹çš„åŸºæœ¬å±¬æ€§ã€‚å…¶èƒ½å¤ é€æ¥è™•ç†ä»»å‹™å¹¶åšå‡ºæ›´æ˜Žæ™ºçš„æ±ºç–ï¼Œèƒ½å¤ æ ¹æ“šå¾©é›œçš„æç¤ºè©žæä¾›æ›´å¥½çš„ç”æ¡ˆå’ŒéŸ¿æ‡‰çµæžœã€‚
ç‰¹åˆ¥è²æ˜Žï¼šä»¥ä¸Šå…§å®¹(å¦‚æœ‰åœ–ç‰‡æˆ–è¦–é »äº¦åŒ…æ‹¬åœ¨å…§)為自媒體平臺“網易號â€ç”¨æˆ¶ä¸Šå‚³å¹¶ç™¼å¸ƒï¼Œæœ¬å¹³è‡ºåƒ…æä¾›ä¿¡æ¯å˜å„²æœå‹™ã€‚
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.