DeepSeek首次披露大模型成本利潤率
DeepSeek再拋出重磅炸彈。
3月1日,DeepSeek首次發文披露了DeepSeek-V3/R1推理系統的成本和理論收入數據。這也是第一個詳細披露了自身成本結構的大模型公司。
圖源:微博
DeepSeek 統計了2月27日24點至2月28日24點的數據,假定GPU租賃成本為2美元每小時,則可以計算得出運營一天的算力總成本為87072美元,約人民幣63萬元。而如果所有的tokens均以R1的價格計費來看,則每日總收入將為562027美元,約人民幣409萬元,成本利潤率高達545%。
圖源:微博
用總收入減去成本,就可以得到凈利潤474955美元。換言之,理論上DeepSeek的每日凈利潤高達474955美元,約人民幣346萬元。
數據一公布,市場瞬間轟動,引發業界廣泛討論,不少業內人士也被震驚。
但是,有一點需要十分注意,這個凈利潤必須強調只是理論上的。
為什么呢?
因為這個理論數據實際上是高度簡化和理想化的處理結果,實際運營中的問題是更加復雜多樣的,因此實際利潤與理論數據存在較大偏差。
前不久,DeepSeek就已經宣布下調夜間空閑時段(即北京時間每天00:30到08:30)的API調用價格,DeepSeek-V3降至原價的50%,DeepSeek-R1降至25%。
因此,面對外界一片驚嘆質疑聲,DeepSeek方面出來澄清并表示,實際上并沒有那么多的收入,因為 V3 的定價更低,同時收費服務只占了一部分,另外夜間還會有折扣,所以實際收入低于理論值。
圖源:知乎
這也符合DeepSeek創始人梁文鋒一貫的態度和原則,“我們的原則是不貼錢,也不賺取暴利。這個價格也是在成本之上稍微有點利潤。”
從2月24日到28日,DeepSeek舉行了“開源周”,連續放了5天Infra相關的庫。事實上,這次的成本披露其實只是DeepSeek開源周第六天的一個驚喜彩蛋,對于市場的絕大多數人來說,利潤是最直觀最震撼的。
但顯然,DeepSeek的開源周為業界帶來的震撼也是一個更比一個猛。
下面我們簡單了解一下。
第一天,DeepSeek正式發布開源項目 FlashMLA,是專為Hopper GPU優化的高效MLA解碼內核,針對可變長度序列服務進行了優化。
第二天,DeepSeek發布DeepEP,這是一個專為混合專家系統(MoE)和專家并行(EP)設計的通信庫,旨在優化分布式訓練和推理中的通信效率。
第三天,DeepSeek發布DeepGEMM,這是一個專為NVIDIA Hopper GPU優化的CUDA庫,專注于FP8通用矩陣乘法,具有簡潔、高效、可與專家調優庫相媲美的性能。
第四天,DeepSeek主要發布了兩個開源項目,一個是由梁文鋒本人親自參與底層代碼的DualPipe,可用于雙向并行計算,有效降低訓練時間;另一個是EPLB,也叫專家并行負載均衡器,可自動平衡GPU負載,避免部分顯卡過載或閑置。
第五天,DeepSeek發布了最后一個開源項目Fire-Flyer File System,即3FS并行文件系統,是一種高速文件系統,利用SSD硬件協同設計和RDMA高速網絡,顯著提高數據處理效率。
可以說,DeepSeek這種直白坦誠實屬少見,最后甚至公開成本結構,算是給驚喜不斷的開源周一個完美收官。
盈利爭議致兩家AI公司創始人互撕
這邊,DeepSeek美美收官開源周,545%的理論成本利潤率的震撼力尚未減弱;那邊,兩家國產AI公司卻因為DeepSeek這次坦誠布公而撕了起來。
事情的起因是DeepSeek在知乎社區發布了那篇帶有成本利潤計算的文章,超高利潤率引發廣泛討論,一些用戶主動讓潞晨科技創始人尤洋的點評。
為什么是尤洋呢,因為在各家爭相部署DeepSeek的時候,他一直保持明確的反對態度。
此前,他曾在個人微博發文表示:“如果滿血的DeepSeek R1每日輸出1000億token,那么每月的機器成本是4.5億,虧損4億!”此話一出,也引起了不少人對DeepSeek經營狀況的擔憂。
圖源:微博
很快,尤洋在知乎發文回應了關于DeepSeek公布的理論成本利潤率,表示懷疑,認為DeepSeek的數據對計算MaaS(Model as a Service,模型即服務)成本沒有參考價值,并稱DeepSeek目前尚不具備成為一款合格MaaS產品的條件
同日,尤洋的潞晨科技宣布將在一周后停供DeepSeek API。
圖源:潞晨科技公眾號
然而,意識到發言不當后,3月2日,尤洋發文致歉,表示,“本人昨天情緒太沖動,說了一些讓人誤解deepseek infrastructure團隊的話。Deepseek infrastructure團隊技術一流并給開源社區做出巨大貢獻。本人誠摯道歉,已經刪除不當表述,感謝大家提醒!”
但目前該道歉內容已不可見。
圖源:潞晨科技公眾號
尤洋的多次表態其實也引起了與另一家AI Infra公司硅基流動創始人袁進輝的矛盾。硅基流動正好就是國內最早一批提供DeepSeek部署服務、承接其流量的公司之一。
和尤洋“基于大模型的Mass服務不賺錢”的立場相反,袁進輝及硅基流動更關注動態變化,將快速跟進并提供DeepSeek的MaaS服務看作當下最正確的決策。
立場相悖的兩人此前就因為4億虧損的合理性有過一輪“交鋒”,袁進輝認為虧損 4億是使用了錯誤的架構進行估計。
而這次,袁進輝也在知乎評論區表示DeepSeek披露的大規模部署成本和收益,“顛覆了很多人認知”,力挺其數據可靠性。
圖源:知乎
戲劇性的發展就此展開。
尤洋直接開撕,發文《坑人的硅基流動》,點名批評硅基流動。此時雙方的爭論點已經從DeepSeek的成本利潤,變成了兩家公司的愛恨。
當然,袁進輝也在第一時間出來回應,不僅表明公司運營思路,更是直接提起“潞晨代碼抄襲”舊案。雙方都是一股濃濃的火藥味。
不過,目前二人都已刪除相關言論,畢竟公司創始人的在外的言行很大程度上代表了公司形象,這樣互相開撕,除了讓吃瓜群眾不亦樂乎,于公司而言并無好處。
關于DeepSeek的成本利潤到底如何計算,其實各有各的道理,無非是立場不同觀點不同方法不同所致。
雖然是一出鬧劇,但倒也讓三方受益,既能打開知名度,有不錯的熱度,也讓原本熱度就高的再上一層樓。
DeepSeek讓英偉達也開始焦慮
DeepSeek坦白的開源和技術披露,無疑是行業罕見。有網友認為DeepSeek這一系列操作足以說明大模型的推理成本可以更低,極有可能爆發新一輪價格戰,同行面臨用降價維持競爭力的巨大壓力。
這個看法顯然相當合理,畢竟有公司靠更物美價廉的操作火爆全球,那些砸下巨額資金的公司要怎么面對市場和投資者呢?
作為行業龍頭,英偉達自然壓力也不小。
美東時間2月26日盤后,英偉達發布了截至2025年1月26日的2025財年第四季度財報,以及2026財年第一財季的業績指引。
圖源:微博
這份財報備受業界關注,因為這是DeepSeek橫空出世后,英偉達公布的第一份財報。自去年DeepSeek出現并迅速火爆全球開始,華爾街對于英偉達GPU的需求前景開始表示擔憂。低成本高效能的AI模型的成功,讓不少投資者對AI芯片的巨額支出感到懷疑。
因此,這份財報無論對英偉達還是市場投資者都至關重要。
財報顯示,英偉達第四財季總營收393.31億美元,較去年同期增長78%,其中數據中心業務收入356億美元,同比增長93%。第四財季凈利潤220.66億美元,同比增長72%。第四季度調整后EPS為0.89美元,同比增長71%。英偉達全年實現營收1304.97億美元,同比增長114%;凈利潤728.80億美元,同比增長145%。
總的來說,英偉達四季度營收雖然放緩,但仍創新高,遠遠超越了市場預期,可以在一定程度上緩解之前的市場擔憂情緒。
但是,依然有部分投資者認為英偉達這次業績表現不夠理想,并不能緩解投資者的焦慮。
英偉達未來或許要出臺更多措施,不僅要彰顯目前研發投入的巨額成本是值得的,還要在后續投入中控制成本,實現“物美價廉”,挽回更多投資者的心。
足可見,DeepSeek的超高利潤率,其實在某種程度上也在倒逼其他企業尋求更高效、經濟的研發模式,未來的AI大模型競爭可能會朝著高效、低成本的方向發展。
作者 | 唐仁
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.