99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

DeepSeek-V3深夜驚爆上新!代碼數(shù)學飆升劍指GPT-5,一臺Mac可跑

0
分享至

新智元報道

編輯:編輯部

【新智元導讀】685B的DeepSeek-V3新版本,就在昨夜悄悄上線了。參數(shù)量685B的V3,代碼數(shù)學推理再次顯著提升,甚至代碼追平Claude 3.7,網(wǎng)友們實測后大呼強到離譜!有人預測說,按照此前的節(jié)奏,DeepSeek-R2大概率幾周內(nèi)就將上線。

昨晚,DeepSeek-V3悄然升級!

新模型版本為DeepSeek-V3-0324,參數(shù)量為6850億,相較上個版本參數(shù)增幅不大(6710億)。


從發(fā)布時間和技術(shù)特點來看,DeepSeek-V3-0324,很可能是DeepSeek-R2的基礎(chǔ)架構(gòu)。

所以按照DeepSeek一貫的產(chǎn)品發(fā)布節(jié)奏(先推出基礎(chǔ)模型,幾周后再發(fā)布專門的推理增強版)來看,DeepSeek-R2很可能在幾周后就將上線!

升級后的V3在代碼、數(shù)學推理能力上,得到顯著提升。尤其是代碼領(lǐng)域,不少網(wǎng)友直呼「眼前一亮」。

相較于上一版,從一個球在超立方體彈跳的Python腳本,即可看出V3代碼性能的改善。


甚至,它還能解鎖Claude 3.7 Sonnet很多玩法,代碼可以與之正面較量。

值得一提的是,DeepSeek V3另一大亮點在于采用MIT開源協(xié)議,上個版本還是自定義許可證。

這不僅可以自由修改、分發(fā)模型,還支持模型蒸餾、商業(yè)化應用。

模型文件總計641GB,主要以model-00035-of-000163.safetensors形式存在

685B雖大,但也能在消費級設(shè)備上跑起來。

這不,蘋果機器學習工程師Awni Hannun就基于MLX框架和4-bit量化,在512GB M3 Ultra實現(xiàn)了超過20 token/s的運行速度。



這種量化方式直接將模型的磁盤占用空間減少到352GB。


有M3 Ultra的童鞋們,可以按照下面的方式使用llm-mlx跑起來:

llm mlx download-model mlx-community/DeepSeek-V3-0324-4bit
llm chat -m mlx-community/DeepSeek-V3-0324-4bit

若是本地跑不了的朋友,除了官網(wǎng)之外,還可以在OpenRouter上體驗。

體驗地址:openrouter.ai/chat?models=deepseek/deepseek-chat-v3-0324:free

相比起某些會在發(fā)布前數(shù)月就開始大肆宣傳造勢的O和A開頭的AI公司,DeepSeek這種低調(diào)辦大事的風格可謂是天壤之別。

沒有白皮書,沒有博客文章,只有一個空白的README文件和模型權(quán)重本身——上線即可直接可以下載使用。

新版V3代碼能力飆升,追平Claude 3.7

遺憾的是,DeepSeek尚未公布新版模型的系統(tǒng)卡,暫時無法窺探更多技術(shù)細節(jié)。

官方小助手的更新提示

不過,這并未阻擋全網(wǎng)對新模型的熱情,已有機構(gòu)、網(wǎng)友紛紛對V3展開通用能力、代碼、數(shù)學等多維度的測評。

根據(jù)網(wǎng)友Xeophon的自測,DeepSeek-V3-0324所有指標性能暴漲,擊敗了Claude 3.5 Sonnet,成為目前最強的非推理模型。


就代碼能力來看,DeepSeek-V3-0324同樣能夠與Claude 3.5 Sonnet一決高下。


另外,在Aider的多語言基準測試中,DeepSeek-V3-0324拿下55%成績,較前代版本顯著提升,成為僅次于Sonnet 3.7的非推理類模型第二名。

其表現(xiàn)已可媲美R1和o3-mini等具備推理能力的模型。


網(wǎng)友「karminski-牙醫(yī)」還帶來了全網(wǎng)最速的代碼實測,新模型直接干翻了DeepSeek R1,與Claude 3.7相匹敵。


在 KCORES大模型競技場中,Claude-3.7-Sonnet-Thinking無疑是LLM當之無愧的王者,DeepSeek-V3-0324以328.3分拿下第三名,僅次于Claude 3.5 Sonnet。


他還展開了四項評測,20個小球碰撞測試,上個版本結(jié)果擠成一團,DeepSeek-V3-0324在物理模擬上表現(xiàn)更好。



在mandelbrot-set-meet-libai測試中,DeepSeek-V3-0324沒有過多變化,較初版僅僅低了2分,完成度提升很高。



還有火星任務測試中,DeepSeek-V3-0324星球渲染正確,所有模型中位列第三。



九大行星測試,DeepSeek-V3-0324真正繪制出了太陽系的完整圖。



此外,DeepSeek-V3-0324在Misguided Attention基準上,躍居非推理類模型榜首,甚至超越了Claude Sonnet 3.7(非推理模型)。


令人驚訝的是,它現(xiàn)在能解決一些此前只有推理模型才能處理的提示,比如「4升水壺問題」。

V3-0324似乎學會了識別推理循環(huán),并跳出循環(huán)——這種能力甚至是許多專業(yè)推理模型都不具備的。

顏色越深代表特定提示的正確響應次數(shù)越多

接下來,看看DeepSeek-V3-0324在多項實測中的具體表現(xiàn)如何。

網(wǎng)友實測,一個提示即出網(wǎng)頁

網(wǎng)友「Deepanshu Sharma」表示,更新后的DeepSeek-V3-0324簡直「強的過分了」。

他用這個新模型一氣呵成創(chuàng)建了一個新網(wǎng)站,編寫了800多行代碼,一次都沒有出錯!

「看到這些厲害的開源模型不斷給大公司施加壓力,迫使他們以低成本構(gòu)建更好的模型,真是太棒了!」Deepanshu寫道。



網(wǎng)友「Risphere」體驗完新的DeepSeek-V3-0324后表示,其在編碼方面已經(jīng)與Claude 3.7 Sonnet處于同一水平上了。

要知道,Claude模型一直以來都是公認的代碼能力最強的模型。



不僅如此,Risphere甚至認為DeepSeek-V3-0324在前端開發(fā)方面超越了o1-pro和GPT-4.5!

要知道,o1-pro可是需要付費200美元每月的ChatGPT Pro會員才可以體驗的模型。


Petri Kuittinen體驗完DeepSeek-V3-0324后認為,「Anthropic和OpenAI遇上麻煩了!」。

他使用了一段非常簡短的提示詞就制作出了一個精美的響應式網(wǎng)頁,提示詞如下:

Create a great-looking responsive front page for AI company. Include everything in one HTML5 file.

為AI公司創(chuàng)建一個看起來很棒的響應式首頁。將所有內(nèi)容包含在一個HTML5文件中。

Petri認為,DeepSeek-V3-0324是在前端編程上也優(yōu)于DeepSeek-R1。

他完成的這個網(wǎng)站共有958行代碼,包括所有圖像,而且也適合手機上觀看。



左右滑動查看

不只是編程問題,數(shù)學競賽也難不倒它。

數(shù)學博士、奧賽金牌得主Jasper用AIME 2025中的題目測試了一下DeepSeek-V3-0324,它順利解決了。

Jasper表示,他現(xiàn)在對開源AI模型最終獲勝更有信心了!


編碼智能體Cline的速度很快,第一時間更新了DeepSeek-V3-0324。

他們還給出了使用的理由,DeepSeek-V3-0324在編碼任務上性能與Claude 3.7 Sonnet不相上下,價格卻低了53倍。


不止如此,Cline還表示,DeepSeek-V3-0324較之前的版本增加了60%的專家(從160增加到256),使用了FP8精度訓練將計算效率翻倍,不僅使前端編碼能力增強,數(shù)學與邏輯能力也有所提升。


DeepSeek注定改變?nèi)駻I格局

這次DeepSeek-V3的突然上線,節(jié)奏也與過去他們在圣誕節(jié)期間發(fā)布V3、幾周后推出R1的模式完全吻合。

本來,業(yè)界就一直傳聞R2將在4月亮相,V3的上線基本吹響了R2的前奏。

先進開源推理模型的影響,已經(jīng)不必多說了。如果它們能免費提供,那原本只有財力雄厚的大型機構(gòu)才能獲得的高級AI系統(tǒng),會變得人人可用。

而如果DeepSeek-R2能延續(xù)R1的發(fā)展路線,但它很可能會直接單挑OpenAI捂著的大炸彈GPT-5。這就讓OpenAI靠封閉生態(tài)和雄厚資金支持帶來的壟斷,被徹底打破。

當OpenAI和Anthropic還在為模型設(shè)置付費訪問限制時,DeepSeek已經(jīng)實現(xiàn)了封閉模型無法達到的爆發(fā)式創(chuàng)新。

而中美AI差異,已經(jīng)日漸縮小,全球AI格局已被重塑。幾個月前,大部分分析師估計,中國在AI能力上落后美國1-2年,今天這一差距已經(jīng)縮小至3-6個月,甚至呈現(xiàn)中國領(lǐng)先的趨勢。

而開源的方式,甚至還解決了中國公司的特殊挑戰(zhàn)(受限于英偉達先進芯片),因為更注重在算力有限的情況下達到有競爭力的性能,現(xiàn)在這已成為中國企業(yè)的潛在優(yōu)勢。

就像Android系統(tǒng)一樣,憑著廣泛的普及性和數(shù)千開發(fā)者的集體創(chuàng)新,DeepSeek很可能最終超越封閉系統(tǒng)。

誰將通過AI擁有對世界最大的影響力?讓我們拭目以待。

參考資料: HNYZ

https://venturebeat.com/ai/deepseek-v3-now-runs-at-20-tokens-per-second-on-mac-studio-and-thats-a-nightmare-for-openai/

https://x.com/TheXeophon/status/1904225899957936314

https://x.com/cline/status/1904275590678786545

https://x.com/karminski3/status/1904212084306653648

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
“新型啃老”正在全國蔓延:孩子不上班也不伸手要錢,3000塊能活

“新型啃老”正在全國蔓延:孩子不上班也不伸手要錢,3000塊能活

巢客HOME
2025-04-05 23:19:55
郎咸平:關(guān)稅大戰(zhàn)的目標除了中國還有一個

郎咸平:關(guān)稅大戰(zhàn)的目標除了中國還有一個

新浪財經(jīng)
2025-04-07 15:12:15
字節(jié)跳動員工吐槽:好多人以為自己年薪60萬,平均每個月五萬塊工資......實際上根本不是這么回事兒

字節(jié)跳動員工吐槽:好多人以為自己年薪60萬,平均每個月五萬塊工資......實際上根本不是這么回事兒

營銷報
2025-03-08 16:12:53
拒絕讓步!被我們約談后,沃爾瑪仍在要求中國供應商單方面降價!

拒絕讓步!被我們約談后,沃爾瑪仍在要求中國供應商單方面降價!

青青子衿
2025-04-08 00:09:08
一貨車進入甘肅蘭州西沙黃河大橋時撞到限高桿,駕駛員不幸身亡

一貨車進入甘肅蘭州西沙黃河大橋時撞到限高桿,駕駛員不幸身亡

大風新聞
2025-04-08 09:23:03
關(guān)稅反制,最受益的7大行業(yè)(附名單)

關(guān)稅反制,最受益的7大行業(yè)(附名單)

小波股事歷程
2025-04-07 23:42:05
國王18分逆轉(zhuǎn)活塞:拉文43+8三分賽季新高 德羅贊37分小薩三雙

國王18分逆轉(zhuǎn)活塞:拉文43+8三分賽季新高 德羅贊37分小薩三雙

醉臥浮生
2025-04-08 09:36:11
恭喜!48歲馬布里官宣與中國歌手汪妤凌結(jié)婚 自稱中國女婿

恭喜!48歲馬布里官宣與中國歌手汪妤凌結(jié)婚 自稱中國女婿

醉臥浮生
2025-04-07 19:48:42
歐盟委員會提議對一系列美國進口商品征收25%的反制關(guān)稅

歐盟委員會提議對一系列美國進口商品征收25%的反制關(guān)稅

財聯(lián)社
2025-04-08 01:51:04
網(wǎng)傳特朗普總統(tǒng)競選時,手持的競選特制吉他,其實是貴州制造的!

網(wǎng)傳特朗普總統(tǒng)競選時,手持的競選特制吉他,其實是貴州制造的!

小星球探索
2025-04-07 14:30:29
重磅反制!中國對美國豬肉再加34%?關(guān)稅,進口豬肉有望繼續(xù)大減

重磅反制!中國對美國豬肉再加34%?關(guān)稅,進口豬肉有望繼續(xù)大減

詩詞中國
2025-04-07 12:56:42
“推遲90天傳言”的市場影響:美股瞬間暴漲2.5萬億美元,但只持續(xù)了七分鐘

“推遲90天傳言”的市場影響:美股瞬間暴漲2.5萬億美元,但只持續(xù)了七分鐘

華爾街見聞官方
2025-04-08 06:27:03
北大院長面試學霸:他們像一個模具打造出的“家具”,一無所知!

北大院長面試學霸:他們像一個模具打造出的“家具”,一無所知!

尚曦讀史
2025-04-06 20:45:03
中國女婿!馬布里社媒官宣與汪妤凌登記結(jié)婚!

中國女婿!馬布里社媒官宣與汪妤凌登記結(jié)婚!

直播吧
2025-04-07 19:17:08
外媒:特朗普政府推動美軍高級官員“清洗行動”,美駐北約海軍中將被解職

外媒:特朗普政府推動美軍高級官員“清洗行動”,美駐北約海軍中將被解職

環(huán)球網(wǎng)資訊
2025-04-08 10:29:29
廣東今年汛期略偏早,或現(xiàn)二十年一遇洪水!高溫干旱風險高

廣東今年汛期略偏早,或現(xiàn)二十年一遇洪水!高溫干旱風險高

南方都市報
2025-04-08 10:23:11
不出意外,常規(guī)賽打完,西部前10的最終排名如下

不出意外,常規(guī)賽打完,西部前10的最終排名如下

毒舌NBA
2025-04-08 10:26:25
A股市場全線下跌,滬指跌大跌245點,今天的A股是怎么了

A股市場全線下跌,滬指跌大跌245點,今天的A股是怎么了

投資觀
2025-04-07 15:01:18
某省體制內(nèi)員工:出差吃飯財務系統(tǒng)記賬,小數(shù)點后兩位清清楚楚!領(lǐng)導也得走流程

某省體制內(nèi)員工:出差吃飯財務系統(tǒng)記賬,小數(shù)點后兩位清清楚楚!領(lǐng)導也得走流程

西虹市閑話
2025-04-07 14:22:18
阿門超強數(shù)據(jù)曝光!防守勇士球員9中0 全明星后衛(wèi)碰到他該頭疼了

阿門超強數(shù)據(jù)曝光!防守勇士球員9中0 全明星后衛(wèi)碰到他該頭疼了

羅說NBA
2025-04-08 07:01:28
2025-04-08 11:07:00
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
12486文章數(shù) 66006關(guān)注度
往期回顧 全部

科技要聞

特朗普堅持征收關(guān)稅 周一美科技股劇烈震蕩

頭條要聞

美方威脅進一步對華加征50%關(guān)稅 商務部回應

頭條要聞

美方威脅進一步對華加征50%關(guān)稅 商務部回應

體育要聞

極限一穿四,他把韓國主場打到靜音

娛樂要聞

尷尬!甲亢哥想聯(lián)動大張偉,卻被迫錄節(jié)目

財經(jīng)要聞

"中國版平準基金"橫空出世 央行表態(tài)

汽車要聞

途昂Pro的五套組合拳打完 看清油車的自我救贖

態(tài)度原創(chuàng)

游戲
旅游
藝術(shù)
教育
公開課

《絲之歌》新實機截圖:"鴿王"當真要來了嗎?

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

教育要聞

布朗大學5.1億美元聯(lián)邦資助遭凍結(jié),成第五所受罰高校!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 威信县| 汾西县| 连山| 平原县| 江川县| 大庆市| 昌吉市| 江西省| 磐安县| 武义县| 马龙县| 克什克腾旗| 扶余县| 曲阳县| 大同县| 建水县| 潞西市| 确山县| 宁津县| 阜南县| 绍兴县| 长岭县| 佛坪县| 新龙县| 濮阳县| 淮北市| 清河县| 沾益县| 巴彦县| 前郭尔| 三台县| 林州市| 颍上县| 会理县| 龙岩市| 新营市| 临澧县| 陈巴尔虎旗| 正蓝旗| 水富县| 杭锦旗|