網易首頁 > 網易號 > 正文申請入駐

DeepSeek：黑天鵝降臨硅谷

2025-01-27 16:47:52　來源: 茶狐看世界本尊

浙江舉報

分享至

這是一個信息爆炸的時代，也是一個信息嚴重污染的時代。所以，我對任何信息都不會輕信，尤其是面對重大利好，更加「存疑」。對我來說，排除信息污染的最好辦法，就是交叉對比，正反面都看。

過去48小時內，我幾乎都泡在X上，瀏覽各種關于Deep Seek的消息，在英語世界，基本上是壓倒性正面評價，這時候，我就特別想看看負面的評論，找了一圈，的確有。

主要分為兩類：

一類，為了反而反，尤其是一些海外的反中人士，任何關于中國的新聞，他們都會給出負面的評價，這類信息簡直就是垃圾。但看看也好，至少可以知道垃圾是什么樣子。

另一類，是業內人士的負面評價，其中第一個，也是最鷹派的聲音，居然來自一個華裔業內人士——Alexandr Wang。

首先，此人的名字有點奇怪，第一次看到，我以為是CNBC拼錯了，一般情況下，Alexander是英語中最常見的拼寫形式，也是國際通用的版本。而Alexandr，則是某些東歐語言（如俄語、捷克語等）的拼寫形式。一個美國華裔，居然用東歐的名字，有點蹊蹺。但我定睛一看，確實是Alexandr。

其次，這位王先生，不僅名字奇怪，更有著與眾不同的背景。他出生于1997年，是Scale AI的創始人兼CEO。24歲時，Alexandr Wang成為了世界上最年輕的「白手起家」的億萬富翁。根據福布斯的說法，截至2024年7月，他的身價為20億美元。

他是中國移民的兒子，父母都在洛斯阿拉莫斯國家實驗室（Los Alamos National Laboratory）擔任物理學家，核武器就誕生在這個實驗室。中國人能在這種單位工作，非常罕見。

Alexandr 從小就對數學和計算機編程充滿熱情。他在2013年獲得了美國隊的數學奧林匹克資格。在十幾歲時，他就在美版知乎Quora擔任軟件程序員。隨后，他在麻省理工學院學習計算機科學，但中途退學，創辦了Scale AI，成了硅谷的AI神童。

Alexandr說：Deep Seek至少有5萬張英偉達H100顯卡，只不過因為制裁的原因，不方便說而已。事后，我看了好幾遍CNBC電視臺的采訪，他的原話是as my understanding，也就是「按照我的理解」，而沒有任何實錘的證據。

根據Deep Seek的說法，訓練模型只用了2048張H800顯卡，也就是H100的閹割版，價格也只有H100（3萬美刀）的三分之一。正因為用了低配的硬件，才體現了Deep Seek的創新價值。

而Alexandr Wang暗示了，Deep Seek只不過也是大力出奇跡而已，根本沒有什么創新。

那么5萬張H100顯卡意味著什么呢？

今年，馬斯克用全球最大AI超算Colossus轟動了整個世界，這臺超算也只配備了10萬張英偉達H100顯卡。

即便Alexandr Wang說的是真話，5萬張英偉達H100顯卡，總價就至少15億美元。折合一百多億人民幣。一個小小的幻方公司，能拿出這么多錢嗎？就算有，H100美國禁運，中國大陸根本沒貨，也很難買到。

再退一步講，就算Deep Seek能拿出這么多錢，買5萬張英偉達H100顯卡，它的成本就和Open AI不相上下了，但Deep Seek是開源免費的，而Open AI要200美元一個月。

因為Deep Seek，我也是人生第一次，學會了用API。我用中國手機開了一個賬戶，就送10元人民幣，我用Deep Seek API翻譯文本，百萬輸入 tokens才2元，用了一個晚上，才花了0.11元。這已經不能算白菜價了，幾乎就是免費！從售價倒推成本，Deep Seek也不可能擁有5萬張H100顯卡。

總之，無論從哪個角度看，Alexandr Wang的論點都站不住腳，但他的說法，依然有價值。

一方面，證明了Deep Seek的技術真的牛叉，已經牛到要用5萬張H100顯卡才能訓練。

另一方面，說明Deep Seek的影響力太大，以至于Alexandr Wang有點慌了，口不擇言。

那么，為啥Alexandr Wang要慌呢？

我不是什么AI專家，但根據我這幾天索閱讀的大量信息理解，Deep Seek可能是一只巨型的黑天鵝，她正在硅谷的上空游蕩。

1/ 目前，訓練頂級AI大模型的成本極其高昂。OpenAI等巨頭，需要擁有數萬個H100顯卡的大型數據中心。每塊最低3萬美元，總價就要十幾億美元，而且耗電量驚人，需要一整座發電廠提供電力。他們僅在訓練模型上，就要花費數億美元。

2/ Deep Seek突然出現并說：「哈哈，如果我們花 500 萬美元做這件事會怎么樣？」他們不只是說說而已，而是真的做到了。Deep Seek的模型在許多任務上，甚至擊敗了 GPT-4 和 Claude。硅谷的人工智能世界，瞬間就懵了，AI天才Alexandr Wang語無倫次了。

3/ DeepSeek怎么做到的？他們從頭開始重新思考一切。傳統AI就像是把每個數字都寫成 32 位小數。而DeepSeek 說：「如果我們只使用8位小數呢？」結果，它仍然足夠準確！瞬間，所需內存就減少了75%。

4/ 然后是他們的「多標記」系統。普通人工智能的閱讀方式就像一年級學生一樣：「鵝......鵝......鵝......曲......項......向......天......歌」，逐字閱讀。但DeepSeek一次讀完整段話。速度快2倍，準確率高90%，當你處理數十億個單詞時，這一點很重要。

5/ 但真正聰明的是：他們建立了一個「專家系統」，而沒有使用一個試圖了解一切的大型人工智能（比如讓一個人同時成為醫生、律師、工程師、木匠），只在需要時才激活特定專家，節省了大量參數。

6/ 而傳統模型呢？所有1.8萬億參數始終處于活動狀態。與此同時，DeepSeek總共6710億個參數，一次只激活370億。這就像擁有一支龐大的團隊，但只召集每個任務真正需要的專家。

7/ 結果令人震驚，訓練成本：數億美元 → 500萬美元；所需GPU：100000 → 2000 ； API 成本：便宜 95%；可以在普通游戲顯卡上運行，而不是數據中心硬件。

8/ 最瘋狂的部分——DeepSeek是開源的（完全免費）。任何人都可以使用，代碼是公開的。技術論文解釋了一切，這不是魔術，只是令人難以置信的巧妙工程。現在x最流行的一個梗，Open AI → Closed AI（閉源AI），取而代之的是DeepSeek，才是真正的Open AI （開源AI）。

9/ 為什么DeepSeek很重要？因為它打破了「只有大型科技公司才能涉足人工智能」的神話。你不再需要價值數十億美元的數據中心，幾個好的游戲顯卡，就可以做到這一點。

10/ 對英偉達來說，這很可怕。他們的整個商業模式都建立在利潤率高達90%的昂貴顯卡的基礎上，比如售價高達三四萬美元的H100，奇貨可居，有錢都買不到。如果每個人都能突然用普通的游戲顯卡做AI……那么，你就知道問題所在了。

11/ 關鍵在于：DeepSeek 的團隊不到200人，但Meta的團隊僅薪酬就超過了DeepSeek 的整個訓練預算……而Meta的模型卻不如DeepSeek。

12/ 這是一個經典的顛覆故事：既有者優化現有流程，而顛覆者重新思考根本方法。

13/ DeepSeek就像一次地震，余震太大：人工智能開發變得更加容易，競爭加劇，大型科技公司的「護城河」看起來更像水溝，硬件要求（和成本）大幅下降

14/ 當然，OpenAI 等巨頭不會坐以待斃。但一切都要顛覆，再也不是大力出奇跡的模式了。

DeepSeek這只黑天鵝，扇動翅膀，整個硅谷都會被波及，效應可以總結為以下幾點。

AI初創企業危機：Deep Seek的高性能可能導致大量購買英偉達顯卡的AI初創企業破產，釋放大量二手GPU。對Scale AI的CEO兼創始人Alexandr Wang來說，這是攸關生死的存亡之爭，口出惡言，也可以理解。

數據中心業務受挫：大型數據中心運營商，其租用英偉達顯卡的商業模式將受到沖擊。

科技巨頭減緩采購：科技巨頭們可能因庫存積壓，減少對英偉達顯卡的采購。

英偉達前景堪憂：上述因素疊加，可能導致英偉達的業務全面下滑。

X上，有一個金融大V說了一句：deepseek better not be the real deal...（deepseek 最好不是真的......）然后配了一張讓人不寒而栗的圖。

75年高點：圖表顯示，美國股市位于75年來的最高點。

Magnificent 7：這個詞指的是目前美國股市中表現最好的七家科技巨頭公司，它們在很大程度上推動了美國股市的上漲。

兩次泡沫：分別是上世紀60年代的Nifty 50泡沫和90年代的互聯網泡沫。這兩次泡沫都導致了股市崩盤，這一次，deepseek來了...美股會崩嗎？

最后，我們再看一看，Deep Seek團隊剛在康奈爾發表的論文，其中每一個作者都值得我們銘記，大部分都是30歲以下的年輕人，來自國內的頂尖大學，有的還在讀博士，其中，無人具有海外的學術背景。這再次表明中國在大學教育質量上已經趕上美國，并且未來幾十年中國在STEM畢業生方面將占據絕對的數量優勢。

正如DeepSeek創始人梁文鋒所說：我們的價值在于團隊，通過這個過程不斷成長和積累專業知識。建立一個能夠持續創新的團隊，才是我們真正的護城河。

聲明：個人原創，僅供參考

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.