99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

一體機,阻礙DeepSeek性能的最大絆腳石!

0
分享至

一體機是DeepSeek交付的最佳方式嗎?

恰恰相反,一體機是阻礙DeepSeek提升推理性能的最大絆腳石。



為啥?

只因DeepSeek這個模型有點特殊,它是個高稀疏度的MoE模型。

MoE這種混合專家模型,設計的初衷是通過“激活一堆專家中的少量專家”,來達到減少計算量、提升推理效率的目標。

舉個例子,MoE模型好比是一個超級大飯店的后廚,這個后廚里有幾百個大廚,每個大廚擅長做不同菜系川菜廚子、魯菜廚子、湘菜廚子…

這些廚子就相當于不同領域的專家。



其中有個人是廚師長,廚師長不負責炒菜,他清楚地知道每個廚師擅長做什么菜。

這個廚師長就是MoE模型中的門控網(wǎng)絡。



每次顧客點菜的時候,廚師長(門控網(wǎng)絡)會根據(jù)顧客點菜的需求以及自己對廚師能力的了解,安排擅長做這些菜的廚子炒菜。



這樣,酒店的后廚就不必為每位廚師安排灶眼,只需少量灶眼(比如8個),供那些需要上崗炒菜(被激活)的廚師使用就可以了。

這就相當于MoE的原理:只激活少量專家,從而大幅降低計算量。



是不是看起來很不錯,但是有一點很重要:不參與炒菜的廚子們雖然不占用灶眼,但是還是要擠在后廚隨時等待召喚。

也就是說,MoE模型里那些未激活專家,雖然不消耗算力,但它們的參數(shù)量仍然要占用顯存/內(nèi)存,帶來巨大的存儲開銷和調(diào)度復雜性。



回過頭來,我們再來看DeepSeek-R1/V3,是稀疏度極高的MoE模型(總參數(shù)量6710億,激活量370億)。

按照DeepSeek官方的最新披露,模型每層256個專家,只有8個被激活(V3的Transformer 層數(shù)設置為 61 層)。

好比你的飯店有60多個后廚房間,每個屋里放256個廚師,同時只有8個廚師干活,其他待命。

你想想,恐怕只有新東方廚師專修學院才這么干吧。



這就意味著,你需要配置超高的一體機(大顯存、大內(nèi)存),才能夠運行滿血版DeepSeek。

事實證明,目前的狀況也的確如此,市面上的“真·滿血DeepSeek一體機”價格都是100萬起,甚至要大幾百萬。



把MoE模型裝進一體機的不科學之處在于↓

我花了大錢買了一堆不能同時干活的專家,只為他們可以減少計算量。
然而,這種一體機部署模式算力是我買斷的,難道不應該讓他們盡量都干活,從而讓算力最大化使用嗎?
我的顯存/內(nèi)存/硬盤都是為了裝下6710億參數(shù),但實際干活只有370億參數(shù)…

所以,我們的觀點是:

一體機其實是運行DeepSeek這種MoE模型的最差選擇,更適合運行那些非MoE的全參數(shù)激活模型。

這一點,大家如果仔細看上周DeepSeek官方在知乎披露的推理優(yōu)化架構就明白了。

人家說的很清楚,要想獲得“更大的吞吐、更低的延遲”,核心就是要使用「大規(guī)模跨節(jié)點專家并行」。

你一體機就單個節(jié)點、8張卡,勉強裝下所有專家,還并行個毛線啊?



按照DeepSeek給出的官方參考推理架構(專家并行、數(shù)據(jù)并行、PD分離):

Prefill階段:部署單元4節(jié)點(32張H800),32路專家并行和數(shù)據(jù)并行。
Decode階段:部署單元18節(jié)點(144張H800),144路專家并行和數(shù)據(jù)并行。

這就意味著,一個22節(jié)點的集群(176張卡),才能發(fā)揮出最優(yōu)的推理吞吐和延遲。(讓每個專家獲得足夠的輸入,都忙活起來,而不是“占著茅坑不拉屎



正因為這種采用這種大規(guī)模并行架構,DeepSeek官方給出的單服務器平均推理性能才高得離譜(輸入:73.7k tokens/s,輸出14.8k tokens/s)。

而一體機廠商們給出的性能,輸出+輸入的總和最多也不過4k tokens/s。



當然,我們并不是要否定大模型一體機,只是一體機不適合部署MoE模型,讓它跑個稠密模型,不需要大規(guī)模并行的,還是很好的。

眼下DeepSeek一體機滿天飛,更多的還是滿足客戶的情緒價值:本地化、開箱即用、專屬性……



尤其在數(shù)據(jù)隱私方面,一體機有著無與倫比的優(yōu)勢,不只是合規(guī),更能切實有效的保護數(shù)據(jù)不出域。

比如,很多通過API、WEB或APP提供DeepSeek服務的供應商,在他們的用戶協(xié)議里可能赫然寫著“…我們可能會將服務所收集的輸入及對應輸出,用于本協(xié)議下服務的優(yōu)化…”。



這對于大部分企業(yè)級客戶來說,這都是無法接受的,所以本地化部署肯定是剛需,這也是目前DeepSeek一體機火爆的原因(即便性能不佳)。

其實,很多企業(yè)過去兩年自己囤過算力,此時參考DeepSeek的大規(guī)模并行架構,部署起來,相信會有不錯的效果。

而滿血版的DeepSeek一體機,企業(yè)可以量預算而行,不要硬上:

第一,蒸餾版,體積小性能好,效果差點不耽誤練手;
第二,最近新模型層出不窮,可以嘗試下非MoE架構的小體積新模型;
第三,相信不久的將來下一代DeepSeek就會發(fā)布,屆時再下手也不遲。

大模型的前方是星辰大海,但我們,才剛剛上路呢。



特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
網(wǎng)友要求嚴懲汪小菲張?zhí)m,解救孩子,稱大S比竇娥還冤!

網(wǎng)友要求嚴懲汪小菲張?zhí)m,解救孩子,稱大S比竇娥還冤!

錢小刀娛樂
2025-04-24 22:05:08
印度外長蘇杰生:中國比印度發(fā)展得好,是因為有西方國家的幫助!

印度外長蘇杰生:中國比印度發(fā)展得好,是因為有西方國家的幫助!

跳跳歷史
2025-04-24 14:49:19
真鎖學區(qū)了?!最新消息:南京又有多校通知退檔!

真鎖學區(qū)了?!最新消息:南京又有多校通知退檔!

南京擇校
2025-04-24 22:54:28
3000億公斤!嫦娥五號發(fā)現(xiàn)月球水庫,美國6次登月為什么沒發(fā)現(xiàn)?

3000億公斤!嫦娥五號發(fā)現(xiàn)月球水庫,美國6次登月為什么沒發(fā)現(xiàn)?

火星一號
2025-03-19 15:47:32
兩國可能合并,一旦成功將成為超級大國,或終結美國一家獨大局面

兩國可能合并,一旦成功將成為超級大國,或終結美國一家獨大局面

史二了
2024-07-27 17:12:02
30歲小伙娶無手老婆,美得不像話,網(wǎng)友:換我,我也娶

30歲小伙娶無手老婆,美得不像話,網(wǎng)友:換我,我也娶

農(nóng)村情感故事
2025-04-24 17:51:24
人生四大關,看看你過了幾個?

人生四大關,看看你過了幾個?

國學雜談
2025-04-24 19:48:02
三觀炸裂!奧運冠軍公開炮轟76歲恩師:披著羊皮的狼,逼我吃藥!

三觀炸裂!奧運冠軍公開炮轟76歲恩師:披著羊皮的狼,逼我吃藥!

拳擊時空
2025-03-25 06:48:33
國乒今天迎戰(zhàn)張本美和!突尼斯賽4月25日賽程公布,中日4場對決

國乒今天迎戰(zhàn)張本美和!突尼斯賽4月25日賽程公布,中日4場對決

全言作品
2025-04-25 06:41:19
中國腦梗發(fā)病率世界第一!提醒:罪魁禍首被揪出,3種蔬菜要少吃

中國腦梗發(fā)病率世界第一!提醒:罪魁禍首被揪出,3種蔬菜要少吃

39健康網(wǎng)
2025-04-02 10:31:30
劉強東取餐沒被認出,問話也愛搭不理,老板娘腸子悔青喊話求合影

劉強東取餐沒被認出,問話也愛搭不理,老板娘腸子悔青喊話求合影

大歪歪
2025-04-24 16:13:32
參加2025蘇迪曼杯的韓國羽毛球隊兵發(fā)廈門,世界一姐安洗瑩復出

參加2025蘇迪曼杯的韓國羽毛球隊兵發(fā)廈門,世界一姐安洗瑩復出

峰云峰雨
2025-04-25 09:15:29
歷史上的金兀朮:你知道他很壞,但你可能想不到他有多“強”!

歷史上的金兀朮:你知道他很壞,但你可能想不到他有多“強”!

好賢觀史記
2025-03-28 09:52:35
抱緊大腿!一步登天!中國空間站首位外籍航天員竟來自這個國家!

抱緊大腿!一步登天!中國空間站首位外籍航天員竟來自這個國家!

飯?zhí)鞕C
2025-04-23 15:59:05
女兒和父親同床睡到12歲 體檢報告讓全家沉默

女兒和父親同床睡到12歲 體檢報告讓全家沉默

妍薇情感驛站
2025-04-14 09:50:59
遠超比亞迪!暴賺4800億,出口114萬輛,這家汽車巨頭悶聲發(fā)大財

遠超比亞迪!暴賺4800億,出口114萬輛,這家汽車巨頭悶聲發(fā)大財

毒sir財經(jīng)
2025-04-24 19:43:20
一瓶飲用水988元!內(nèi)含三顆天然水晶,高端水到底誰在買?

一瓶飲用水988元!內(nèi)含三顆天然水晶,高端水到底誰在買?

揚子晚報
2025-04-23 20:48:04
董明珠“間諜論”爭議升級!胡錫進要求她公開道歉:嚴重詆毀海歸

董明珠“間諜論”爭議升級!胡錫進要求她公開道歉:嚴重詆毀海歸

阿鳧愛吐槽
2025-04-24 09:05:27
肌肉撕裂+賽季報銷!皇馬1億天才隕落,無緣世俱杯,恐危及生涯

肌肉撕裂+賽季報銷!皇馬1億天才隕落,無緣世俱杯,恐危及生涯

阿泰希特
2025-04-25 08:54:46
特朗普開出降稅條件,中方拒絕,三架專機同時抵華,反攻剛剛開始

特朗普開出降稅條件,中方拒絕,三架專機同時抵華,反攻剛剛開始

說天說地說實事
2025-04-25 07:37:24
2025-04-25 10:35:00
AI全球總部
AI全球總部
全球最新、最酷AI解決方案
996文章數(shù) 717關注度
往期回顧 全部

科技要聞

這屆上海車展,沒人靠流量活著

頭條要聞

牛彈琴:形勢很危險 中國兩個重要鄰國又到了戰(zhàn)爭邊緣

頭條要聞

牛彈琴:形勢很危險 中國兩個重要鄰國又到了戰(zhàn)爭邊緣

體育要聞

拒當黑八倒霉蛋!廣廈又站到了遼寧面前

娛樂要聞

黃曉明生二胎!葉柯產(chǎn)女住上海高級醫(yī)院

財經(jīng)要聞

王興注定“永無寧日”

汽車要聞

純電CLA L及Vision V概念車 奔馳這次玩大了

態(tài)度原創(chuàng)

手機
家居
旅游
游戲
數(shù)碼

手機要聞

iPhone 17全系要用12GB內(nèi)存 只因大模型不夠用

家居要聞

清徐現(xiàn)代 有溫度有態(tài)度

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

晨報|老滾4RE性別Mod重新上架 Remedy新作6月發(fā)售

數(shù)碼要聞

雷蛇首款垂直鼠標Pro Click V2 Vertical Edition發(fā)布,120美元

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 曲阳县| 漳浦县| 永修县| 广丰县| 聂荣县| SHOW| 江津市| 射洪县| 阿城市| 辉南县| 南宁市| 黄平县| 安国市| 武强县| 长子县| 北京市| 南丹县| 贵溪市| 河北区| 张家川| 贵南县| 贺州市| 肥东县| 宁城县| 竹北市| 蓬溪县| 汪清县| 云浮市| 沧州市| 汉中市| 肥城市| 眉山市| 奉贤区| 繁峙县| 合作市| 陇南市| 淮南市| 白玉县| 闻喜县| 福清市| 托克逊县|