DeepSeek昨夜上新！新舊版V3對比實測，代碼能力飆升，震驚海外用戶

2025-03-25 07:55:52　來源: 智東西

北京舉報

分享至

智東西
作者陳駿達
編輯漠影

智東西3月25日報道，昨日晚間，DeepSeek在開源平臺悄然上線了升級后的DeepSeek-V3模型。新模型的版本號為DeepSeek-V3-0324，模型參數(shù)為6850億，較早期版本的6710億有小幅增長。不過，DeepSeek尚未放出新版模型的系統(tǒng)卡，我們暫時無法獲取關(guān)于這款模型的更多信息。

開源地址：https://huggingface.co/deepseek-ai/DeepSeek-V3-0324

同時，DeepSeek也將DeepSeek-V3模型的開源協(xié)議更新為與DeepSeek-R1一致的MIT協(xié)議，這一協(xié)議更為寬松，允許模型蒸餾、商用等行為，給了開發(fā)者更多的自主權(quán)。

新版DeepSeek-V3上線后，智東西第一時間進行了代碼、數(shù)學和通用能力等多方面的測試，并關(guān)注到廣大網(wǎng)友的測試結(jié)果。據(jù)眾多已經(jīng)體驗上這款模型的網(wǎng)友分享，升級后的DeepSeek-V3在代碼、數(shù)學等方面有明顯的性能提升。

一位海外AI博主稱，DeepSeek終于能在代碼領(lǐng)域和Anthropic的Claude Sonnet 3.5一決高下了。而之前，Claude Sonnet 3.5在程序員圈內(nèi)擁有極高的聲譽，無論諸多模型在代碼上的成績?nèi)绾巫兓绦騿T依舊更青睞使用Claude系列模型。

在智東西的測試中，新版DeepSeek-V3在網(wǎng)站開發(fā)能力、UI設計方面展現(xiàn)出巨大的進步，在輸入“設計一個美觀的個人博客網(wǎng)站，帶有科技感，直接開發(fā)成可用網(wǎng)頁”的提示詞之后，直接獲得了如下的網(wǎng)頁效果。

新版DeepSeek-V3在2分鐘的時間內(nèi)交付了一個總計400多行代碼、設計精良的網(wǎng)站，據(jù)其介紹，網(wǎng)站采用了粒子背景動畫、賽博朋克UI（霓虹光效、懸浮動畫和科技感配色）等設計元素，標題使用打字機動畫，按鈕具備光波擴散效果。

這一網(wǎng)站還使用了響應式設計，能自動適配手機和桌面設備。

而當舊版DeepSeek-V3獲得相同的指令時，其解決方案僅有100多行代碼，輸出的結(jié)果在審美上也不如新版的DeepSeek-V3。

有網(wǎng)友稱，這次的“小更新”比預期中的更大，改進顯著，尤其是在數(shù)學方面。

智東西將之前實測中，曾難倒舊版DeepSeek-V3和DeepSeek-R1的一道數(shù)學題交給新版DeepSeek-V3。這次，DeepSeek-V3輸出的token與原版DeepSeek-V3總量明顯更長，單次輸出達到了輸出上限，點擊繼續(xù)生成后，DeepSeek-V3繼續(xù)思考，但這次的答案依舊是錯誤的。

不過，從錯誤的答案中，我們也能觀察到一些新的變化，如今的DeepSeek-V3在給出最終答案后，會進行一定程度的反思，并修改自己的解題過程。

而在智東西先前測試的文科類問題上，新版DeepSeek-V3的答案變得更為全面。智東西的測試問題為：“布須曼人喝不喝牛奶？”舊版DeepSeek-V3對這一問題的回答僅有三小段話，信息量不多。

新版DeepSeek-V3采用了更為結(jié)構(gòu)化的回答模式，分析的內(nèi)容更為全面，補充了更多的背景信息，同時生成的速度依舊比較理想。

這也印證了部分網(wǎng)友總結(jié)出來的特點：新版DeepSeek-V3像是V3與R1的結(jié)合體，更傾向用長輸出解決問題。

新版DeepSeek-V3的發(fā)布，也讓諸多網(wǎng)友不禁遐想：新版V3都來了，R2和V4還會遠嗎？

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.