網易首頁 > 網易號 > 正文申請入駐

能力超越DeepSeek-R1？Claude推出的全球首個混合推理模型什么樣

2025-02-26 08:05:03　來源: 揚帆出海官方

黑龍江舉報

分享至

揚帆出海作者丨汪醬

25日凌晨，Anthropic投下了兩個“王炸”。

一是號稱目前全球首個混合推理模型Claude 3.7 Sonnet——一個模型，兩種思考模式，既能快速響應用戶提問，也能如DeepSeek一般展示深入的推理過程。

二是智能編程工具Claude Code——這一編程工具能直接理解并操作開發者的代碼庫，并且可以一次性完成超45分鐘以上的人工任務，開發、編碼、測試流程全包攬，在代碼能力的完整性和完成性上遠超其它大模型。

會思考的Claude 3.7 Sonnet

自DeepSeek上線以來，我們已經料想到AI大模型賽道會有源源不斷的活水涌上來，只不過無論上涌的速度，還是能力的追趕，都太快了。Claude 3.7 Sonnet正是其中一個。

根據Anthropic官方的解釋，他們認為推理是前沿模型的一種集成能力，而不是完全獨立的模型，因此Claude 3.7 Sonnet和市場上其他推理模型有所不同，它既是一個普通的LLM（能夠生成文本并理解語言模式），同時也是一個推理模型（能夠將復雜的問題拆解成一個個步驟，顯示出其達成最終解決方案的思維路線）。

（圖：讓其寫五個世界上任何地方都找不到的原創笑話，Claude 3.7 Sonnet展示了思考過程）

值得一提的是，根據AWS生成式人工智能副總裁Vasi Philomin表示，Claude 3.7 Sonnet的擴展推理思維在數學競賽、物理、編碼、深度分析等方面能力能為客戶帶來最大收益，比如可以構建更為復雜的GenAI驅動的應用程序。

（圖：Claude 3.7 Sonnet在遵循指令、一般推理、多模態能力和代理編碼方面表現出色，擴展思維在數學和科學上有顯著提升）

根據早期測試顯示，Claude 3.7 Sonnet對于復雜代理工作流具有非常優越的精確性，能力甚至超過OpenAI o1和DeepSeek R1。

（圖：該測試評估了AI模型解決現實世界中軟件問題的能力，Claude 3.7 Sonnet在SWE-bench Verified測試中展示了最先進的性能）

此外，當通過API使用Claude 3.7 Sonnet時，用戶還能夠控制預算進行思考，比如給其提供一個token的數值，告訴它思考不得超過該數量的token，就能夠一定程度上控制預算（目前最高輸出限制為128K個token），但需要注意的是，這一方式也會影響模型回答的速度和答案的質量。

安全性方面，Claude 3.7 Sonnet能夠更加準確地區分請求的正確性和錯誤性，因此減少了45%的“不必要拒絕”，這意味著Claude 3.7 Sonnet能夠更加流暢快速地響應用戶需求。

從其目前的模型形態來看，對于企業級使用者更加友好。目前，Claude 3.7 Sonnet已經可以適用于所有Claude的訂閱計劃，比如免費版、專業版、團隊版、企業版，同時不僅能通過Anthropic API接入訪問，還可以通過Amazon Bedrock、Google Cloud的Vertex AI進行訪問，除免費版外的所有版本均支持擴展思考模式。

至于定價，無論哪種模式，其API定價均保持不變（和前代的模型一致），輸入100萬個token收費3美元，輸出100萬個token收費15美元（其中包括思考過程中使用的token）。相比之下，我們發現OpenAI o3-mini（早于Claude發布的能推理的模型）要更加便宜，輸入定價1.1美元/1M token，輸出為4.4美元/1M token。

寫代碼“神器”：Claude Code

雖然Claude 3.7 Sonnet的編碼能力已經很強了（經官方測試），但Anthropic還是想將編碼能力進一步拉高，進而推出了Claude Code這一專門的智能編程工具。目前，這一工具的功能還在持續優化中，因此尚未正式上線，僅作為研究預覽版限量開放，并將根據用戶反饋來進行改進。

根據Anthropic官方表示，Claude Code的定位是一個AI編程助手，能力覆蓋從搜索、閱讀代碼、編輯、運行、測試、推送代碼到GitHub等全流程。最值得關注的是，Claude Code能直接理解開發者的代碼庫，并且無縫集成到開發環境之中，經過測試，Claude Code已經能夠在單個會話中完成通常需要45分鐘以上的人工工作，極大降低人工成本。

結語

自DeepSeek推出后，AI大模型賽道無疑已經拉響了軍備競賽警報，各大科技公司紛紛加大投入，加速研發更加先進、更加智能的AI模型。比如前有OpenAI的o3-mini，憑借其出色的性能和靈活性，在多個應用場景中展現出了強大的競爭力。而現在，Claude 3.7 Sonnet的橫空出世，更是將這場競賽推向了一個新的高潮。

這場AI大模型的軍備競賽，不僅能推動技術的快速發展，同時也將在更多領域發揮關鍵作用，從優化業務流程、提升工作效率、降低運營成本等多個方面為企業提供助力。而可以預見的是，在這場競賽中脫穎而出的AI模型，無疑也將成為各個行業的首選工具，為行業的數字化轉型和智能化升級提供強有力的支持。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.