智東西
作者 陳駿達
編輯 漠影
智東西3月25日報道,昨日晚間,DeepSeek在開源平臺悄然上線了升級后的DeepSeek-V3模型。新模型的版本號為DeepSeek-V3-0324,模型參數(shù)為6850億,較早期版本的6710億有小幅增長。不過,DeepSeek尚未放出新版模型的系統(tǒng)卡,我們暫時無法獲取關(guān)于這款模型的更多信息。
開源地址:https://huggingface.co/deepseek-ai/DeepSeek-V3-0324
同時,DeepSeek也將DeepSeek-V3模型的開源協(xié)議更新為與DeepSeek-R1一致的MIT協(xié)議,這一協(xié)議更為寬松,允許模型蒸餾、商用等行為,給了開發(fā)者更多的自主權(quán)。
新版DeepSeek-V3上線后,智東西第一時間進行了代碼、數(shù)學和通用能力等多方面的測試,并關(guān)注到廣大網(wǎng)友的測試結(jié)果。據(jù)眾多已經(jīng)體驗上這款模型的網(wǎng)友分享,升級后的DeepSeek-V3在代碼、數(shù)學等方面有明顯的性能提升。
一位海外AI博主稱,DeepSeek終于能在代碼領(lǐng)域和Anthropic的Claude Sonnet 3.5一決高下了。而之前,Claude Sonnet 3.5在程序員圈內(nèi)擁有極高的聲譽,無論諸多模型在代碼上的成績?nèi)绾巫兓绦騿T依舊更青睞使用Claude系列模型。
在智東西的測試中,新版DeepSeek-V3在網(wǎng)站開發(fā)能力、UI設計方面展現(xiàn)出巨大的進步,在輸入“設計一個美觀的個人博客網(wǎng)站,帶有科技感,直接開發(fā)成可用網(wǎng)頁”的提示詞之后,直接獲得了如下的網(wǎng)頁效果。
新版DeepSeek-V3在2分鐘的時間內(nèi)交付了一個總計400多行代碼、設計精良的網(wǎng)站,據(jù)其介紹,網(wǎng)站采用了粒子背景動畫、賽博朋克UI(霓虹光效、懸浮動畫和科技感配色)等設計元素,標題使用打字機動畫,按鈕具備光波擴散效果。
這一網(wǎng)站還使用了響應式設計,能自動適配手機和桌面設備。
而當舊版DeepSeek-V3獲得相同的指令時,其解決方案僅有100多行代碼,輸出的結(jié)果在審美上也不如新版的DeepSeek-V3。
有網(wǎng)友稱,這次的“小更新”比預期中的更大,改進顯著,尤其是在數(shù)學方面。
智東西將之前實測中,曾難倒舊版DeepSeek-V3和DeepSeek-R1的一道數(shù)學題交給新版DeepSeek-V3。這次,DeepSeek-V3輸出的token與原版DeepSeek-V3總量明顯更長,單次輸出達到了輸出上限,點擊繼續(xù)生成后,DeepSeek-V3繼續(xù)思考,但這次的答案依舊是錯誤的。
不過,從錯誤的答案中,我們也能觀察到一些新的變化,如今的DeepSeek-V3在給出最終答案后,會進行一定程度的反思,并修改自己的解題過程。
而在智東西先前測試的文科類問題上,新版DeepSeek-V3的答案變得更為全面。智東西的測試問題為:“布須曼人喝不喝牛奶?”舊版DeepSeek-V3對這一問題的回答僅有三小段話,信息量不多。
新版DeepSeek-V3采用了更為結(jié)構(gòu)化的回答模式,分析的內(nèi)容更為全面,補充了更多的背景信息,同時生成的速度依舊比較理想。
這也印證了部分網(wǎng)友總結(jié)出來的特點:新版DeepSeek-V3像是V3與R1的結(jié)合體,更傾向用長輸出解決問題。
新版DeepSeek-V3的發(fā)布,也讓諸多網(wǎng)友不禁遐想:新版V3都來了,R2和V4還會遠嗎?
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.