99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

DeepSeek再次震驚全球:一天到底能賺多少錢?官方突然宣布!

0
分享至

突然宣布!暫停DeepSeek API服務

【導讀】DeepSeek一天能賺多少錢?官方突然揭秘!潞晨科技暫停DeepSeek API

服務

大家好,一起關注一下關于DeepSeek的最新消息!

DeepSeek首次披露:理論成本利潤率545%

當市場以為DeepSeek的開源周內容發布完畢之后,3月1日,DeepSeek宣布了“One More Thing”,突然揭秘V3/R1推理系統,公開了大規模部署成本和收益。


根據《DeepSeek-V3/R1推理系統概覽》的文章,假定GPU租賃成本為2美元/小時,總成本為87072美元/天;如果所有tokens全部按照DeepSeek R1的定價計算,理論上一天的總收入為562027美元/天,成本利潤率為545%。

據官方披露,DeepSeek-V3/R1推理系統的優化目標是:更大的吞吐,更低的延遲。

為了實現這兩個目標,DeepSeek使用大規模跨節點專家并行(Expert Parallelism / EP)。首先EP使得batch size大大增加,從而提高GPU矩陣乘法的效率,提高吞吐。其次EP使得專家分散在不同的GPU上,每個 GPU 只需要計算很少的專家(因此更少的訪存需求),從而降低延遲。

但EP同時也增加了系統的復雜性。復雜性主要體現在兩個方面:

EP引入跨節點的傳輸。為了優化吞吐,需要設計合適的計算流程使得傳輸和計算可以同步進行。

EP涉及多個節點,因此天然需要Data Parallelism(DP),不同的DP之間需要進行負載均衡。

因此,DeepSeek介紹了如何使用EP增大batch size,如何隱藏傳輸的耗時,如何進行負載均衡。

大規模跨節點專家并行(Expert Parallelism / EP)

由于DeepSeek-V3/R1的專家數量眾多,并且每層256個專家中僅激活其中8個。模型的高度稀疏性決定了必須采用很大的overall batch size,才能給每個專家提供足夠的expert batch size,從而實現更大的吞吐、更低的延時。需要大規模跨節點專家并行(Expert Parallelism / EP)。

采用多機多卡間的專家并行策略來達到以下目的:

Prefill:路由專家EP32、MLA和共享專家DP32,一個部署單元是4節點,32個冗余路由專家,每張卡9個路由專家和1個共享專家。

Decode:路由專家EP144、MLA和共享專家DP144,一個部署單元是18 節點,32個冗余路由專家,每張卡2個路由專家和1個共享專家。

計算通信重疊

多機多卡的專家并行會引入比較大的通信開銷,所以使用了雙batch重疊來掩蓋通信開銷,提高整體吞吐。

對于prefill階段,兩個batch的計算和通信交錯進行,一個batch在進行計算的時候可以去掩蓋另一個batch的通信開銷;


對于decode階段,不同階段的執行時間有所差別,所以把attention部分拆成了兩個stage,共計5個stage的流水線來實現計算和通信的重疊。


盡可能地負載均衡

由于采用了很大規模的并行(包括數據并行和專家并行),如果某個GPU的計算或通信負載過重,將成為性能瓶頸,拖慢整個系統;同時其他GPU因為等待而空轉,造成整體利用率下降。因此需要盡可能地為每個GPU分配均衡的計算負載、通信負載。

  1. PrefillLoadBalancer

    1. 核心問題:不同數據并行(DP)實例上的請求個數、長度不同,導致core-attention計算量、dispatch發送量也不同。

    2. 優化目標:各GPU的計算量盡量相同(core-attention計算負載均衡)、輸入的token數量也盡量相同(dispatch發送量負載均衡),避免部分GPU處理時間過長。

  2. DecodeLoadBalancer

    1. 核心問題:不同數據并行(DP)實例上的請求數量、長度不同,導致core-attention計算量(與KVCache占用量相關)、dispatch發送量不同。

    2. 優化目標:各GPU的KVCache占用量盡量相同(core-attention計算負載均衡)、請求數量盡量相同(dispatch發送量負載均衡)。

  3. Expert-ParallelLoadBalancer

    1. 核心問題:對于給定MoE模型,存在一些天然的高負載專家(expert),導致不同GPU的專家計算負載不均衡。

    2. 優化目標:每個GPU上的專家計算量均衡(即最小化所有GPU的dispatch接收量的最大值)。


線上系統的實際統計數據

DeepSeekV3和R1的所有服務均使用H800GPU,使用和訓練一致的精度,即矩陣計算和dispatch傳輸采用和訓練一致的FP8格式,core-attention計算和combine傳輸采用和訓練一致的BF16,最大程度保證了服務效果。

另外,由于白天的服務負荷高,晚上的服務負荷低,因此實現了一套機制,在白天負荷高的時候,用所有節點部署推理服務。晚上負荷低的時候,減少推理節點,以用來做研究和訓練。在最近的24小時里(北京時間2025/02/27 12:00至2025/02/28 12:00),DeepSeek-V3和R1推理服務占用節點總和,峰值占用為278個節點,平均占用226.75個節點(每個節點為8個H800GPU)。假定GPU租賃成本為2美金/小時,總成本為87072美元/天。


在24小時統計時段內,DeepSeek-V3和R1:

輸入token總數為608B,其中342Btokens(56.3%)命中KVCache硬盤緩存。

輸出token總數為168B。平均輸出速率為20~22tps,平均每輸出一個token的KVCache長度是4989。

平均每臺H800的吞吐量為:對于prefill任務,輸入吞吐約73.7ktokens/s(含緩存命中);對于decode任務,輸出吞吐約14.8ktokens/s。

以上統計包括了網頁、APP和API的所有負載。如果所有tokens全部按照DeepSeek-R1的定價計算,理論上一天的總收入為562027美元,成本利潤率為545%。當然實際上沒有這么多收入,因為V3的定價更低,同時收費服務只占了一部分,另外夜間還會有折扣。


有網友將DeepSeek與OpenAI進行對比,表示:“‘成本利潤率545%’,等一下,所以你是說我被OpenAI搶劫了?”


潞晨科技暫停DeepSeek API服務

就在DeepSeek披露大規模部署成本和收益之后,潞晨科技突然宣布:“尊敬的用戶,潞晨云將在一周后停止提供DeepSeek API服務,請盡快用完您的余額。如果沒用完,我們全額退款。”


此前2月4日晚間,華為計算微信公眾號發文表示,DeepSeek-R1系列模型的開源,因其出色的性能和低廉的開發成本,已引發全球的熱切討論和關注。潞晨科技攜手昇騰,聯合發布基于昇騰算力的DeepSeek-R1系列推理API,及云鏡像服務。

但近期潞晨科技CEO尤洋指出,滿血版DeepSeek-R1每百萬token(輸出)定價16元,如果每日輸出1000億token,一個月算下來接入方企業可獲得4800萬元收入。據他測算,完成1000億token的輸出,需要約4000臺搭載H800的機器,以目前H800的市價或者折舊來計算,每月僅機器成本就達4.5億元,因此企業方可能面臨每月4億元的虧損,“用戶越多,服務成本越高,虧損越多”。


3月1日下午4點,潞晨科技CEO尤洋發文回應DeepSeek公布的理論成本利潤率。


公開資料顯示,潞晨科技是一家致力于“解放AI生產力”的全球性企業,團隊核心成員來自美國加州大學伯克利分校,斯坦福大學,清華大學,北京大學等國內外知名高校。主營業務包括分布式軟件系統,大規模人工智能平臺,以及企業級云計算解決方案。公司旨在打造一個開源低成本AI大模型開發系統Colossal-AI,作為深度學習框架的內核,幫助企業最大化人工智能訓練效率的同時最小化人工智能的訓練成本。

來源:中國基金報記者 泰勒

為偉大思想而生!

AI+時代,互聯網思想(wanging0123),

第一必讀自媒體

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
動真格了?中國空軍大批軍機升空,美媒:五角大樓大批高官被辭

動真格了?中國空軍大批軍機升空,美媒:五角大樓大批高官被辭

傲氣經說
2025-04-23 09:16:01
雪上加霜!鄭欽文出局僅1天,又收到了2個壞消息,難奪大滿貫冠軍

雪上加霜!鄭欽文出局僅1天,又收到了2個壞消息,難奪大滿貫冠軍

侃球熊弟
2025-04-26 23:03:10
謝霆鋒兩個兒子現身演唱會,網友:很像謝霆鋒年輕的時候

謝霆鋒兩個兒子現身演唱會,網友:很像謝霆鋒年輕的時候

紅星新聞
2025-04-26 23:10:22
過安檢能讓多少人“身敗名裂”?網友分享太炸裂,一看一個不吱聲

過安檢能讓多少人“身敗名裂”?網友分享太炸裂,一看一個不吱聲

奇特短尾矮袋鼠
2024-06-26 20:24:41
全球PC出貨量大漲6.7%:聯想遙遙領先 華為仍是Others

全球PC出貨量大漲6.7%:聯想遙遙領先 華為仍是Others

快科技
2025-04-24 11:25:12
對話越野拉力賽“扳手哥”:當時用扳手代替方向盤跑了八九十公里,今年還要參賽

對話越野拉力賽“扳手哥”:當時用扳手代替方向盤跑了八九十公里,今年還要參賽

紅星新聞
2025-04-26 19:09:23
"球王"出世?被外媒稱"丑陋但強大"的中國巨艦,排水量達30000噸

"球王"出世?被外媒稱"丑陋但強大"的中國巨艦,排水量達30000噸

Hi秒懂科普
2025-04-17 12:48:04
陳皮和它是絕配,這樣搭配泡水喝,痰沒了,脾胃好了,陽氣也足了

陳皮和它是絕配,這樣搭配泡水喝,痰沒了,脾胃好了,陽氣也足了

環京快爆
2025-03-26 14:17:36
八旬老人臥床后才明白:存錢給自己養老,是我此生做過最蠢的決定

八旬老人臥床后才明白:存錢給自己養老,是我此生做過最蠢的決定

烙任情感
2025-04-26 07:32:08
外交部正式官宣,我外長有重大行動

外交部正式官宣,我外長有重大行動

龍視國際
2025-04-25 21:35:14
頂流花倒貼糊咖小生?蔡徐坤直播被封?陳妍希新戀情?王一博張譯對打?姨太問答

頂流花倒貼糊咖小生?蔡徐坤直播被封?陳妍希新戀情?王一博張譯對打?姨太問答

毒舌扒姨太
2025-04-26 22:31:10
云南省公開第三輪中央生態環境保護督察整改方案

云南省公開第三輪中央生態環境保護督察整改方案

開屏新聞客戶端
2025-04-26 10:45:08
又一名90后干部被查,已有多人倒在鄉鎮領導崗位上

又一名90后干部被查,已有多人倒在鄉鎮領導崗位上

澎湃新聞
2025-04-26 19:52:27
網友都說“減肥20斤堪比整容”!我一味不語,只管埋頭看辣目洋子

網友都說“減肥20斤堪比整容”!我一味不語,只管埋頭看辣目洋子

楊哥歷史
2025-04-10 10:08:30
河南一女子偷情被鄰居發現,鄰居:想讓我保密,得答應我一個條件

河南一女子偷情被鄰居發現,鄰居:想讓我保密,得答應我一個條件

五元講堂
2024-10-27 19:35:16
小玥兒慶生日 S媽連發兩文喊話訴委屈 汪小菲母子玩笑對話解氣回懟

小玥兒慶生日 S媽連發兩文喊話訴委屈 汪小菲母子玩笑對話解氣回懟

草莓解說體育
2025-04-27 01:15:32
不可思議!被中國用核武器轟炸45次的羅布泊,現在變成這樣了!

不可思議!被中國用核武器轟炸45次的羅布泊,現在變成這樣了!

今日養生之道
2025-04-25 10:29:45
姆巴佩本賽季已打入34球,超過C羅在皇馬的第一個賽季進球數

姆巴佩本賽季已打入34球,超過C羅在皇馬的第一個賽季進球數

懂球帝
2025-04-27 05:48:10
張蘭失去的俏江南,現在居然在張蘭前夫汪璽手里,真相原來是這樣

張蘭失去的俏江南,現在居然在張蘭前夫汪璽手里,真相原來是這樣

她時尚丫
2025-04-23 15:14:13
美國表示:中方若還要在南海繼續“挑釁”,美軍將直接動用武力!

美國表示:中方若還要在南海繼續“挑釁”,美軍將直接動用武力!

阿綏談史
2025-04-21 20:59:44
2025-04-27 06:56:49
互聯網思想 incentive-icons
互聯網思想
AI時代,互聯網思想觀察
2269文章數 16854關注度
往期回顧 全部

科技要聞

百度心響實測:“能用版Manus”開了個好頭

頭條要聞

伊朗港口爆炸致14死700多傷:大火延燒 調查困難

頭條要聞

伊朗港口爆炸致14死700多傷:大火延燒 調查困難

體育要聞

SGA38+5+6雷霆險勝灰熊4-0橫掃晉級,莫蘭特傷停皮蓬30+11+4

娛樂要聞

金掃帚獎出爐,包貝爾意外獲“影帝”

財經要聞

韓國的"宇樹科技" 是怎樣被財閥毀掉的?

汽車要聞

充電5分鐘續航100公里 探訪華為兆瓦超充站

態度原創

藝術
數碼
教育
本地
公開課

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

數碼要聞

AMD修補高危安全漏洞!歷代Zen架構CPU 100%中招

教育要聞

市重點招生題目,有的同學說計算量很大

本地新聞

云游湖北 | 漢川文旅新體驗:千年陶藝邂逅湖光

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 漯河市| 青浦区| 平舆县| 木兰县| 连州市| 屯门区| 自贡市| 牙克石市| 叙永县| 资中县| 大关县| 丰台区| 疏附县| 南和县| 巴林左旗| 屏山县| 巧家县| 丰顺县| 河源市| 繁昌县| 怀宁县| 沛县| 铁岭县| 普宁市| 巢湖市| 临安市| 常山县| 凤台县| 彭水| 迭部县| 科技| 旬阳县| 岑巩县| 衡东县| 金乡县| 宜丰县| 嵊州市| 张家口市| 新晃| 仁怀市| 无锡市|