網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

一體機，阻礙DeepSeek性能的最大絆腳石！

2025-03-10 23:25:05　來源: AI全球總部

北京舉報

分享至

一體機是DeepSeek交付的最佳方式嗎？

恰恰相反，一體機是阻礙DeepSeek提升推理性能的最大絆腳石。

為啥？

只因DeepSeek這個模型有點特殊，它是個高稀疏度的MoE模型。

MoE這種混合專家模型，設計的初衷是通過“激活一堆專家中的少量專家”，來達到減少計算量、提升推理效率的目標。

舉個例子，MoE模型好比是一個超級大飯店的后廚，這個后廚里有幾百個大廚，每個大廚擅長做不同菜系川菜廚子、魯菜廚子、湘菜廚子…

這些廚子就相當于不同領域的專家。

其中有個人是廚師長，廚師長不負責炒菜，他清楚地知道每個廚師擅長做什么菜。

這個廚師長就是MoE模型中的門控網(wǎng)絡。

每次顧客點菜的時候，廚師長（門控網(wǎng)絡）會根據(jù)顧客點菜的需求以及自己對廚師能力的了解，安排擅長做這些菜的廚子炒菜。

這樣，酒店的后廚就不必為每位廚師安排灶眼，只需少量灶眼（比如8個），供那些需要上崗炒菜（被激活）的廚師使用就可以了。

這就相當于MoE的原理：只激活少量專家，從而大幅降低計算量。

是不是看起來很不錯，但是有一點很重要：不參與炒菜的廚子們雖然不占用灶眼，但是還是要擠在后廚隨時等待召喚。

也就是說，MoE模型里那些未激活專家，雖然不消耗算力，但它們的參數(shù)量仍然要占用顯存/內(nèi)存，帶來巨大的存儲開銷和調(diào)度復雜性。

回過頭來，我們再來看DeepSeek-R1/V3，是稀疏度極高的MoE模型（總參數(shù)量6710億，激活量370億）。

按照DeepSeek官方的最新披露，模型每層256個專家，只有8個被激活（V3的Transformer 層數(shù)設置為 61 層）。

好比你的飯店有60多個后廚房間，每個屋里放256個廚師，同時只有8個廚師干活，其他待命。

你想想，恐怕只有新東方廚師專修學院才這么干吧。

這就意味著，你需要配置超高的一體機（大顯存、大內(nèi)存），才能夠運行滿血版DeepSeek。

事實證明，目前的狀況也的確如此，市面上的“真·滿血DeepSeek一體機”價格都是100萬起，甚至要大幾百萬。

把MoE模型裝進一體機的不科學之處在于↓

我花了大錢買了一堆不能同時干活的專家，只為他們可以減少計算量。
然而，這種一體機部署模式算力是我買斷的，難道不應該讓他們盡量都干活，從而讓算力最大化使用嗎？
我的顯存/內(nèi)存/硬盤都是為了裝下6710億參數(shù)，但實際干活只有370億參數(shù)…

所以，我們的觀點是：

一體機其實是運行DeepSeek這種MoE模型的最差選擇，更適合運行那些非MoE的全參數(shù)激活模型。

這一點，大家如果仔細看上周DeepSeek官方在知乎披露的推理優(yōu)化架構就明白了。

人家說的很清楚，要想獲得“更大的吞吐、更低的延遲”，核心就是要使用「大規(guī)模跨節(jié)點專家并行」。

你一體機就單個節(jié)點、8張卡，勉強裝下所有專家，還并行個毛線啊？

按照DeepSeek給出的官方參考推理架構（專家并行、數(shù)據(jù)并行、PD分離）：

Prefill階段：部署單元4節(jié)點（32張H800），32路專家并行和數(shù)據(jù)并行。
Decode階段：部署單元18節(jié)點（144張H800），144路專家并行和數(shù)據(jù)并行。

這就意味著，一個22節(jié)點的集群（176張卡），才能發(fā)揮出最優(yōu)的推理吞吐和延遲。（讓每個專家獲得足夠的輸入，都忙活起來，而不是“占著茅坑不拉屎

正因為這種采用這種大規(guī)模并行架構，DeepSeek官方給出的單服務器平均推理性能才高得離譜（輸入：73.7k tokens/s，輸出14.8k tokens/s）。

而一體機廠商們給出的性能，輸出+輸入的總和最多也不過4k tokens/s。

當然，我們并不是要否定大模型一體機，只是一體機不適合部署MoE模型，讓它跑個稠密模型，不需要大規(guī)模并行的，還是很好的。

眼下DeepSeek一體機滿天飛，更多的還是滿足客戶的情緒價值：本地化、開箱即用、專屬性……

尤其在數(shù)據(jù)隱私方面，一體機有著無與倫比的優(yōu)勢，不只是合規(guī)，更能切實有效的保護數(shù)據(jù)不出域。

比如，很多通過API、WEB或APP提供DeepSeek服務的供應商，在他們的用戶協(xié)議里可能赫然寫著“…我們可能會將服務所收集的輸入及對應輸出，用于本協(xié)議下服務的優(yōu)化…”。

這對于大部分企業(yè)級客戶來說，這都是無法接受的，所以本地化部署肯定是剛需，這也是目前DeepSeek一體機火爆的原因（即便性能不佳）。

其實，很多企業(yè)過去兩年自己囤過算力，此時參考DeepSeek的大規(guī)模并行架構，部署起來，相信會有不錯的效果。

而滿血版的DeepSeek一體機，企業(yè)可以量預算而行，不要硬上：

第一，蒸餾版，體積小性能好，效果差點不耽誤練手；
第二，最近新模型層出不窮，可以嘗試下非MoE架構的小體積新模型；
第三，相信不久的將來下一代DeepSeek就會發(fā)布，屆時再下手也不遲。

大模型的前方是星辰大海，但我們，才剛剛上路呢。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

為什么日本出不來DeepSeek？

虎嗅APP 2025-04-24 21:34:12
9 跟貼 9
實測訊飛曉醫(yī)VS DeepSeek-R1，誰是更懂你的家庭健康助手？

量子位 2025-03-08 19:20:56
0 跟貼 0

DeepSeek開口說話了反應超神無限打斷只要兩行代碼15分鐘

量子位 2025-03-07 14:20:34
0 跟貼 0

DeepSeek應用如何落地？解鎖性能釋放x多模態(tài)融合xRAG增強

量子位 2025-03-07 22:58:40
0 跟貼 0
DeepSeek應用如何落地？解鎖“性能x多模態(tài)xRAG”技術組合密碼！

量子位 2025-03-07 22:29:18
0 跟貼 0

DeepSeek引爆AI革命，誰能笑到最后？

量子位 2025-03-11 17:16:22
0 跟貼 0

傳統(tǒng)MVP模型不成立了，AI時代要更多預測剛需場景

量子位 2025-04-22 14:14:16
0 跟貼 0
DeepSeek開口說話了：只要15分鐘就能讓DeepSeek開口說話

量子位 2025-03-10 18:03:15
0 跟貼 0

這魚為啥一定要燙，飯店后廚親自揭秘

資訊正當午 2025-04-22 17:28:29
8 跟貼 8
后廚分享現(xiàn)在的飯店，都是在用預制菜，網(wǎng)友：還有啥是真的

奇妙觀探 2025-04-24 16:44:17
0 跟貼 0
英國人來中國旅游，去飯店目睹后廚被嚇到，中國人咋可以這樣

位標史探 2025-04-21 07:24:05
0 跟貼 0
楓葉漫談：痛苦的新生·還是幸福的滅亡

楓葉漫談 2025-04-24 14:54:02
1405 跟貼 1405
黃梅瑩：我這輩子最正確的決定，就是與兒子劃清界限，不做絆腳石

阿器談史 2025-04-24 09:41:40
13 跟貼 13
韓國聲稱DeepSeek在未經(jīng)用戶同意情況下將用戶數(shù)據(jù)傳輸?shù)絿?外交部回應

人民網(wǎng) 2025-04-25 10:08:12
0 跟貼 0
450 萬、DeepSeek 部署大單：邯鄲市中心醫(yī)院

云頭條 2025-04-22 19:36:12
0 跟貼 0
DeepSeek概念股反彈，天娛數(shù)科漲停

每日經(jīng)濟新聞 2025-04-25 09:45:10
0 跟貼 0
影像超越佳能攜多樣化專業(yè)影像解決方案亮相CCBN 2025

中關村在線 2025-04-24 01:39:37
0 跟貼 0
離大譜！火災時，餐館員工隱瞞災情忙收費，完事還拋下顧客先跑了

燭照四方 2025-04-24 23:22:17
1 跟貼 1
別讓情緒化應對成為解決厭學的“絆腳石”

經(jīng)濟觀察報 2025-02-13 17:34:04
0 跟貼 0
寶馬官宣用 DeepSeek，老美成最大輸家，這枚科技核彈終于要炸了

文昌每日談 2025-04-25 09:20:04
0 跟貼 0
媒體:董明珠稱"海歸派里有間諜絕不會用" 很違背常識

新民周刊 2025-04-24 18:45:08
56071 跟貼 56071
炊事兵是會做飯的兵，不是一個入伍的廚子

資深觀眾劉根紅 2025-04-21 20:55:51
0 跟貼 0
1.9萬億天價成本！日本曝光全球最大驅(qū)逐艦，參數(shù)碾壓055？

劉參謀戰(zhàn)史庫 2025-04-24 17:23:21
4 跟貼 4
車主為了過年審，竟更改了輪胎上的參數(shù)，真是把別人當傻子了！

微微看點 2025-04-24 17:19:05
0 跟貼 0
一塊硬盤的容量256TB，網(wǎng)友們見狀當場傻眼，網(wǎng)友：這是啥設備用的

博聞視角 2025-04-24 16:23:19
0 跟貼 0
婆婆指責兒媳5年不回婆家過年，兒子：“她不想伺候20口人吃飯”

莎莉說情感 2025-04-24 14:10:06
8 跟貼 8
董明珠正在發(fā)動一場非國民運動，很危險

熊太行 2025-04-24 15:47:49
26905 跟貼 26905
巴特勒傷退追夢登全美第1熱搜：推倒阿門隔山打牛美媒曬罪行狂批

顏小白的籃球夢 2025-04-24 10:52:28
2629 跟貼 2629
孩子爸爸開家長會，全程沒聽老師的講話，忙著拍視頻

動態(tài)新聞 2025-04-24 19:59:52
1081 跟貼 1081
京東宣布多項舉措保障騎手權益，外賣超時20分鐘以上免單。劉強東化身騎手給用戶送外賣，商家：多點競爭對商家和客戶都好

河南都市頻道 2025-04-22 14:56:12
0 跟貼 0
大瓜？卸任第2天，劉國梁公司版圖曝光，與王楠夫婦共創(chuàng)500億項目

體育有點水 2025-04-24 12:00:15
2105 跟貼 2105
微軟發(fā)布首個開源2B參數(shù)規(guī)模原生1bit LLM：BitNet，單CPU就能跑

量子位 2025-04-23 16:13:42
0 跟貼 0
上海車展某品牌請來網(wǎng)紅跳青海搖，現(xiàn)場一群人圍觀拍照

眾橫四海 2025-04-24 11:26:59
7821 跟貼 7821
擁抱新能源，別克“逍遙”超級融合架構引領智能化浪潮

電動邦 2025-04-24 11:26:53
5 跟貼 5
鄉(xiāng)里土廚子喝不出好茶葉但會用茶葉做菜，炒一鍋茶香蝦外酥里嫩

飯匹兄弟官方賬號 2025-04-22 11:21:25
1 跟貼 1
o3并非獨門秘技，谷歌已發(fā)背后關鍵機制，方法更簡單、成本更低

量子位 2024-12-23 14:42:33
0 跟貼 0
滿載蘆葦?shù)某r貨船在鴨綠江航行丹東和新義州的高樓盡收眼底

火煉樹 2025-04-24 11:43:06
1680 跟貼 1680
生于1984年，馬玥已任遼寧錦州北鎮(zhèn)市代市長

澎湃新聞 2025-04-24 21:18:36
451 跟貼 451
Excel配合Deepseek，制作合同到期提醒，讓老板眼前一亮

Excel從零到一 2025-04-21 20:06:38
5 跟貼 5
不應該！賽后廣廈球迷豎中指，大罵“遼G”，隔空侮辱遼寧隊

南海浪花 2025-04-24 12:02:27
1334 跟貼 1334

網(wǎng)友要求嚴懲汪小菲張?zhí)m，解救孩子，稱大S比竇娥還冤！

錢小刀娛樂

2025-04-24 22:05:08

印度外長蘇杰生：中國比印度發(fā)展得好，是因為有西方國家的幫助！

跳跳歷史

2025-04-24 14:49:19

真鎖學區(qū)了？！最新消息：南京又有多校通知退檔！

南京擇校

2025-04-24 22:54:28

3000億公斤！嫦娥五號發(fā)現(xiàn)月球水庫，美國6次登月為什么沒發(fā)現(xiàn)？

火星一號

2025-03-19 15:47:32

兩國可能合并，一旦成功將成為超級大國，或終結美國一家獨大局面

史二了

2024-07-27 17:12:02

30歲小伙娶無手老婆，美得不像話，網(wǎng)友：換我，我也娶

農(nóng)村情感故事

2025-04-24 17:51:24

人生四大關，看看你過了幾個？

國學雜談

2025-04-24 19:48:02

三觀炸裂！奧運冠軍公開炮轟76歲恩師：披著羊皮的狼，逼我吃藥！

拳擊時空

2025-03-25 06:48:33

國乒今天迎戰(zhàn)張本美和！突尼斯賽4月25日賽程公布，中日4場對決

全言作品

2025-04-25 06:41:19

中國腦梗發(fā)病率世界第一！提醒：罪魁禍首被揪出，3種蔬菜要少吃

39健康網(wǎng)

2025-04-02 10:31:30

劉強東取餐沒被認出，問話也愛搭不理，老板娘腸子悔青喊話求合影

大歪歪

2025-04-24 16:13:32

參加2025蘇迪曼杯的韓國羽毛球隊兵發(fā)廈門，世界一姐安洗瑩復出

峰云峰雨

2025-04-25 09:15:29

歷史上的金兀朮：你知道他很壞，但你可能想不到他有多“強”！

好賢觀史記

2025-03-28 09:52:35

抱緊大腿！一步登天！中國空間站首位外籍航天員竟來自這個國家！

飯?zhí)鞕C

2025-04-23 15:59:05

女兒和父親同床睡到12歲體檢報告讓全家沉默

妍薇情感驛站

2025-04-14 09:50:59

遠超比亞迪！暴賺4800億，出口114萬輛，這家汽車巨頭悶聲發(fā)大財

毒sir財經(jīng)

2025-04-24 19:43:20

一瓶飲用水988元！內(nèi)含三顆天然水晶，高端水到底誰在買？

揚子晚報

2025-04-23 20:48:04

董明珠“間諜論”爭議升級！胡錫進要求她公開道歉：嚴重詆毀海歸

阿鳧愛吐槽

2025-04-24 09:05:27

肌肉撕裂＋賽季報銷！皇馬1億天才隕落，無緣世俱杯，恐危及生涯

阿泰希特

2025-04-25 08:54:46

特朗普開出降稅條件，中方拒絕，三架專機同時抵華，反攻剛剛開始

說天說地說實事

2025-04-25 07:37:24

手機 / 數(shù)碼

房產(chǎn) / 家居

一體機，阻礙DeepSeek性能的最大絆腳石！

這屆上海車展，沒人靠流量活著

牛彈琴：形勢很危險 中國兩個重要鄰國又到了戰(zhàn)爭邊緣

牛彈琴：形勢很危險 中國兩個重要鄰國又到了戰(zhàn)爭邊緣

拒當黑八倒霉蛋！廣廈又站到了遼寧面前

黃曉明生二胎！葉柯產(chǎn)女住上海高級醫(yī)院

王興注定“永無寧日”

純電CLA L及Vision V概念車 奔馳這次玩大了

態(tài)度原創(chuàng)

iPhone 17全系要用12GB內(nèi)存 只因大模型不夠用

清徐現(xiàn)代 有溫度有態(tài)度

熱聞|清明假期將至，熱門目的地有哪些?

晨報|老滾4RE性別Mod重新上架 Remedy新作6月發(fā)售

雷蛇首款垂直鼠標Pro Click V2 Vertical Edition發(fā)布，120美元

牛彈琴：形勢很危險中國兩個重要鄰國又到了戰(zhàn)爭邊緣

牛彈琴：形勢很危險中國兩個重要鄰國又到了戰(zhàn)爭邊緣

純電CLA L及Vision V概念車奔馳這次玩大了

iPhone 17全系要用12GB內(nèi)存只因大模型不夠用

清徐現(xiàn)代有溫度有態(tài)度