沒有絲毫預(yù)告,DeepSeek 今晚在 Hugging Face上放出了最新的 DeepSeek-V3-0324 模型。
這個新模型參數(shù)達(dá) 685B,目前在官方網(wǎng)站、APP 和小程序上已經(jīng)可以體驗(關(guān)閉深度思考)。
這并不是之前呼聲很高的 R2 ,而是一次小版本更新,但依然有不少亮點,甚至在某些能力已經(jīng)與 Claude 3.7 Sonnet 相當(dāng)接近。
從網(wǎng)友反饋的實測效果來看,V3-0324 有這些提升:
·編碼能力已經(jīng)接近 Claude3.7 了,比之前的老版本 v3 能力要強(qiáng)。
·提升幅度大約與 Sonnet 3.5 到 Sonnet 3.6 一樣,甚至還要大一點。
·與 R1 相比,V3-0324 在生成前端代碼方面有了明顯改進(jìn)。
·數(shù)學(xué)能力也有提升,能像推理模型一樣能夠解題。
當(dāng)然,V3-0324 也繼續(xù)開源,而且是 MIT 開源許可,意味著比上一版更加開放了。
更多體驗細(xì)節(jié),也歡迎大家在留言區(qū)與我們分享。
今晚的 V3 小版本更新已經(jīng)有不少亮點,也更讓人期待即將到來的 R2。
APPSO 也會持續(xù)關(guān)注,第一時間帶來最新動態(tài)。
Hugging Face 鏈接
https://huggingface.co/deepseek-ai/DeepSeek-V3-0324/tree/main
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.