谷歌推出Gemini 2.5 Flash:融合思考能力與高效性能的新一代AI模型,Google稱其為"性價比最高的思考模型",在AI質量與成本的平衡中處于領先地位
Gemini 2.5 Flash被描述為谷歌首個"完全混合推理模型",允許用戶根據需要開啟或關閉"思考"功能
在大模型競技場LMArena的"困難提示"測試中,Gemini 2.5 Flash表現強勁,僅次于2.5 Pro模型,但其體積和成本卻顯著更低
精細的思考控制
為了滿足不同應用場景對質量、成本和延遲的不同需求,Google為用戶提供了設置"思考預算"的功能,可以精細控制模型在思考過程中生成的最大令牌數。較高的預算允許模型進行更深入的推理以提高質量,但模型不會在簡單問題上浪費資源—它會根據任務復雜度自動決定需要多少思考
如果用戶希望保持最低的成本和延遲,同時仍然比2.0 Flash獲得性能提升,可以將思考預算設為0。開發者還可以通過API參數或在Google AI Studio和Vertex AI中的滑塊設置特定的思考階段令牌預算。對于2.5 Flash,預算范圍可從0到24576個令牌不等
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.