今天凌晨,Anthropic 推出迄今為止最強模型:Claude3.5Sonnet。
作為Claude3.5 系列的排頭兵,Claude3.5Sonnet各項評估指數力壓Claude 3 Opus 和 GPT-4o。
更厲害的是:它免費可用!
今年的AI行業,真是太精彩了!
OpenAI 不再一家獨大,Anthropic接連推出Claude 3.0、Claude3.5 系列模型,力壓之前的 GPT-4,以及現在的 GPT-4o。
GPT-5 如果再不出來,OpenAI 最強大模型的王座,將岌岌可危。
言歸正傳。
Claude 3.5 Sonnet是 Claude 3.5 系列的首個模型,今年晚些時候,Anthropic還會陸續推出Claude 3.5 Haiku和Claude 3.5 Opus等版本。
從 Claude 3 系列開始,Anthropic 將模型分為Opus、 Sonnet和Haiku3個版本。
大家可以把它們理解成Opus(大杯)、Sonnet(中杯)、Haiku(小杯)。
而這一次,是把中等參數模型 Sonnet 的 3.5 升級版放了出來。
Claude 3.5 Sonnet 在哪些方面做了升級?
?更強的指令理解、內容創作能力(可以理解為——更通人性);
?基準測試全面碾壓 Gemini 1.5 Pro、Llama-400b,大部分優于 GPT-4o;
?輸出速度更快(是 Claude 3 Opus 的兩倍);
?成本更低(API 成本是Claude 3 Opus 的五分之一);
?在編碼、視覺處理等復雜任務中表現出色。
拿視覺處理能力來說:Claude 3.5 Sonnet 在所有標準視覺基準上都超過了 Claude 3 Opus。
甚至幾乎全面強于,GPT-4o。
下圖為 Claude 3.5 Sonnet 與 Claude 3 Opus、GPT-4o、Gemini 1.5 Pro 在視覺數學推理、科學圖表、視覺問答、圖表 QA、文件視覺 QA 任務中的性能比較。
編碼能力是 Claude 3.5 Sonnet 進化的重點之一,
在內部編碼評估中,Claude 3.5 Sonnet 解決了 64% 的問題。相比之下,Claude 3 Opus 只解決了 38%,差距不止一點點。
新功能——Artifacts。
Artifacts是一項擴展用戶與 Claude 交互方式的新功能。
當用戶要求 Claude 生成代碼片段、文本文檔或網站設計等內容時,這些工具會出現在他們的對話旁邊的專用窗口中。
Artifacts創建了一個動態工作空間,用戶可以在其中實時查看、編輯和構建 Claude 的創作,將人工智能生成的內容無縫集成到用戶的項目和工作流當中。
Artifacts 將很快擴展到支持團隊協作。
在不久的將來,團隊將能夠安全地將他們的知識、文檔和正在進行的工作集中在一個共享空間中,而 Claude 則將充當我們的最強 AI 隊友。
OK,今天的分享就到這里。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.