揚帆出海 作者丨汪醬
25日凌晨,Anthropic投下了兩個“王炸”。
一是號稱目前全球首個混合推理模型Claude 3.7 Sonnet——一個模型,兩種思考模式,既能快速響應用戶提問,也能如DeepSeek一般展示深入的推理過程。
二是智能編程工具Claude Code——這一編程工具能直接理解并操作開發者的代碼庫,并且可以一次性完成超45分鐘以上的人工任務,開發、編碼、測試流程全包攬,在代碼能力的完整性和完成性上遠超其它大模型。
會思考的Claude 3.7 Sonnet
自DeepSeek上線以來,我們已經料想到AI大模型賽道會有源源不斷的活水涌上來,只不過無論上涌的速度,還是能力的追趕,都太快了。Claude 3.7 Sonnet正是其中一個。
根據Anthropic官方的解釋,他們認為推理是前沿模型的一種集成能力,而不是完全獨立的模型,因此Claude 3.7 Sonnet和市場上其他推理模型有所不同,它既是一個普通的LLM(能夠生成文本并理解語言模式),同時也是一個推理模型(能夠將復雜的問題拆解成一個個步驟,顯示出其達成最終解決方案的思維路線)。
(圖:讓其寫五個世界上任何地方都找不到的原創笑話,Claude 3.7 Sonnet展示了思考過程)
值得一提的是,根據AWS生成式人工智能副總裁Vasi Philomin表示,Claude 3.7 Sonnet的擴展推理思維在數學競賽、物理、編碼、深度分析等方面能力能為客戶帶來最大收益,比如可以構建更為復雜的GenAI驅動的應用程序。
(圖:Claude 3.7 Sonnet在遵循指令、一般推理、多模態能力和代理編碼方面表現出色,擴展思維在數學和科學上有顯著提升)
根據早期測試顯示,Claude 3.7 Sonnet對于復雜代理工作流具有非常優越的精確性,能力甚至超過OpenAI o1和DeepSeek R1。
(圖:該測試評估了AI模型解決現實世界中軟件問題的能力,Claude 3.7 Sonnet在SWE-bench Verified測試中展示了最先進的性能)
此外,當通過API使用Claude 3.7 Sonnet時,用戶還能夠控制預算進行思考,比如給其提供一個token的數值,告訴它思考不得超過該數量的token,就能夠一定程度上控制預算(目前最高輸出限制為128K個token),但需要注意的是,這一方式也會影響模型回答的速度和答案的質量。
安全性方面,Claude 3.7 Sonnet能夠更加準確地區分請求的正確性和錯誤性,因此減少了45%的“不必要拒絕”,這意味著Claude 3.7 Sonnet能夠更加流暢快速地響應用戶需求。
從其目前的模型形態來看,對于企業級使用者更加友好。目前,Claude 3.7 Sonnet已經可以適用于所有Claude的訂閱計劃,比如免費版、專業版、團隊版、企業版,同時不僅能通過Anthropic API接入訪問,還可以通過Amazon Bedrock、Google Cloud的Vertex AI進行訪問,除免費版外的所有版本均支持擴展思考模式。
至于定價,無論哪種模式,其API定價均保持不變(和前代的模型一致),輸入100萬個token收費3美元,輸出100萬個token收費15美元(其中包括思考過程中使用的token)。相比之下,我們發現OpenAI o3-mini(早于Claude發布的能推理的模型)要更加便宜,輸入定價1.1美元/1M token,輸出為4.4美元/1M token。
寫代碼“神器”:Claude Code
雖然Claude 3.7 Sonnet的編碼能力已經很強了(經官方測試),但Anthropic還是想將編碼能力進一步拉高,進而推出了Claude Code這一專門的智能編程工具。目前,這一工具的功能還在持續優化中,因此尚未正式上線,僅作為研究預覽版限量開放,并將根據用戶反饋來進行改進。
根據Anthropic官方表示,Claude Code的定位是一個AI編程助手,能力覆蓋從搜索、閱讀代碼、編輯、運行、測試、推送代碼到GitHub等全流程。最值得關注的是,Claude Code能直接理解開發者的代碼庫,并且無縫集成到開發環境之中,經過測試,Claude Code已經能夠在單個會話中完成通常需要45分鐘以上的人工工作,極大降低人工成本。
結語
自DeepSeek推出后,AI大模型賽道無疑已經拉響了軍備競賽警報,各大科技公司紛紛加大投入,加速研發更加先進、更加智能的AI模型。比如前有OpenAI的o3-mini,憑借其出色的性能和靈活性,在多個應用場景中展現出了強大的競爭力。而現在,Claude 3.7 Sonnet的橫空出世,更是將這場競賽推向了一個新的高潮。
這場AI大模型的軍備競賽,不僅能推動技術的快速發展,同時也將在更多領域發揮關鍵作用,從優化業務流程、提升工作效率、降低運營成本等多個方面為企業提供助力。而可以預見的是,在這場競賽中脫穎而出的AI模型,無疑也將成為各個行業的首選工具,為行業的數字化轉型和智能化升級提供強有力的支持。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.