這是一個信息爆炸的時代,也是一個信息嚴重污染的時代。所以,我對任何信息都不會輕信,尤其是面對重大利好,更加「存疑」。對我來說,排除信息污染的最好辦法,就是交叉對比,正反面都看。
過去48小時內,我幾乎都泡在X上,瀏覽各種關于Deep Seek的消息,在英語世界,基本上是壓倒性正面評價,這時候,我就特別想看看負面的評論,找了一圈,的確有。
主要分為兩類:
一類,為了反而反,尤其是一些海外的反中人士,任何關于中國的新聞,他們都會給出負面的評價,這類信息簡直就是垃圾。但看看也好,至少可以知道垃圾是什么樣子。
另一類,是業內人士的負面評價,其中第一個,也是最鷹派的聲音,居然來自一個華裔業內人士——Alexandr Wang。
首先,此人的名字有點奇怪,第一次看到,我以為是CNBC拼錯了,一般情況下,Alexander是英語中最常見的拼寫形式,也是國際通用的版本。而Alexandr,則是某些東歐語言(如俄語、捷克語等)的拼寫形式。一個美國華裔,居然用東歐的名字,有點蹊蹺。但我定睛一看,確實是Alexandr。
其次,這位王先生,不僅名字奇怪,更有著與眾不同的背景。他出生于1997年,是Scale AI的創始人兼CEO。24歲時,Alexandr Wang成為了世界上最年輕的「白手起家」的億萬富翁。根據福布斯的說法,截至2024年7月,他的身價為20億美元。
他是中國移民的兒子,父母都在洛斯阿拉莫斯國家實驗室(Los Alamos National Laboratory)擔任物理學家,核武器就誕生在這個實驗室。中國人能在這種單位工作,非常罕見。
Alexandr 從小就對數學和計算機編程充滿熱情。他在2013年獲得了美國隊的數學奧林匹克資格。在十幾歲時,他就在美版知乎Quora擔任軟件程序員。隨后,他在麻省理工學院學習計算機科學,但中途退學,創辦了Scale AI,成了硅谷的AI神童。
Alexandr說:Deep Seek至少有5萬張英偉達H100顯卡,只不過因為制裁的原因,不方便說而已。事后,我看了好幾遍CNBC電視臺的采訪,他的原話是as my understanding,也就是「按照我的理解」,而沒有任何實錘的證據。
根據Deep Seek的說法,訓練模型只用了2048張H800顯卡,也就是H100的閹割版,價格也只有H100(3萬美刀)的三分之一。正因為用了低配的硬件,才體現了Deep Seek的創新價值。
而Alexandr Wang暗示了,Deep Seek只不過也是大力出奇跡而已,根本沒有什么創新。
那么5萬張H100顯卡意味著什么呢?
今年,馬斯克用全球最大AI超算Colossus轟動了整個世界,這臺超算也只配備了10萬張英偉達H100顯卡。
即便Alexandr Wang說的是真話,5萬張英偉達H100顯卡,總價就至少15億美元。折合一百多億人民幣。一個小小的幻方公司,能拿出這么多錢嗎?就算有,H100美國禁運,中國大陸根本沒貨,也很難買到。
再退一步講,就算Deep Seek能拿出這么多錢,買5萬張英偉達H100顯卡,它的成本就和Open AI不相上下了,但Deep Seek是開源免費的,而Open AI要200美元一個月。
因為Deep Seek,我也是人生第一次,學會了用API。我用中國手機開了一個賬戶,就送10元人民幣,我用Deep Seek API翻譯文本,百萬輸入 tokens才2元,用了一個晚上,才花了0.11元。這已經不能算白菜價了,幾乎就是免費!從售價倒推成本,Deep Seek也不可能擁有5萬張H100顯卡。
總之,無論從哪個角度看,Alexandr Wang的論點都站不住腳,但他的說法,依然有價值。
一方面,證明了Deep Seek的技術真的牛叉,已經牛到要用5萬張H100顯卡才能訓練。
另一方面,說明Deep Seek的影響力太大,以至于Alexandr Wang有點慌了,口不擇言。
那么,為啥Alexandr Wang要慌呢?
我不是什么AI專家,但根據我這幾天索閱讀的大量信息理解,Deep Seek可能是一只巨型的黑天鵝,她正在硅谷的上空游蕩。
1/ 目前,訓練頂級AI大模型的成本極其高昂。OpenAI等巨頭,需要擁有數萬個H100顯卡的大型數據中心。每塊最低3萬美元,總價就要十幾億美元,而且耗電量驚人,需要一整座發電廠提供電力。他們僅在訓練模型上,就要花費數億美元。
2/ Deep Seek突然出現并說:「哈哈,如果我們花 500 萬美元做這件事會怎么樣?」他們不只是說說而已,而是真的做到了。Deep Seek的模型在許多任務上,甚至擊敗了 GPT-4 和 Claude。硅谷的人工智能世界,瞬間就懵了,AI天才Alexandr Wang語無倫次了。
3/ DeepSeek怎么做到的?他們從頭開始重新思考一切。傳統AI就像是把每個數字都寫成 32 位小數。而DeepSeek 說:「如果我們只使用8位小數呢?」結果,它仍然足夠準確!瞬間,所需內存就減少了75%。
4/ 然后是他們的「多標記」系統。普通人工智能的閱讀方式就像一年級學生一樣:「鵝......鵝......鵝......曲......項......向......天......歌」,逐字閱讀。但DeepSeek一次讀完整段話。速度快2倍,準確率高90%,當你處理數十億個單詞時,這一點很重要。
5/ 但真正聰明的是:他們建立了一個「專家系統」,而沒有使用一個試圖了解一切的大型人工智能(比如讓一個人同時成為醫生、律師、工程師、木匠),只在需要時才激活特定專家,節省了大量參數。
6/ 而傳統模型呢?所有1.8萬億參數始終處于活動狀態。與此同時,DeepSeek總共6710億個參數,一次只激活370億。這就像擁有一支龐大的團隊,但只召集每個任務真正需要的專家。
7/ 結果令人震驚,訓練成本:數億美元 → 500萬美元;所需GPU:100000 → 2000 ; API 成本:便宜 95%;可以在普通游戲顯卡上運行,而不是數據中心硬件。
8/ 最瘋狂的部分——DeepSeek是開源的(完全免費)。任何人都可以使用,代碼是公開的。技術論文解釋了一切,這不是魔術,只是令人難以置信的巧妙工程。現在x最流行的一個梗,Open AI → Closed AI(閉源AI),取而代之的是DeepSeek,才是真正的Open AI (開源AI)。
9/ 為什么DeepSeek很重要?因為它打破了「只有大型科技公司才能涉足人工智能」的神話。你不再需要價值數十億美元的數據中心,幾個好的游戲顯卡,就可以做到這一點。
10/ 對英偉達來說,這很可怕。他們的整個商業模式都建立在利潤率高達90%的昂貴顯卡的基礎上,比如售價高達三四萬美元的H100,奇貨可居,有錢都買不到。如果每個人都能突然用普通的游戲顯卡做AI……那么,你就知道問題所在了。
11/ 關鍵在于:DeepSeek 的團隊不到200人,但Meta的團隊僅薪酬就超過了DeepSeek 的整個訓練預算……而Meta的模型卻不如DeepSeek。
12/ 這是一個經典的顛覆故事:既有者優化現有流程,而顛覆者重新思考根本方法。
13/ DeepSeek就像一次地震,余震太大:人工智能開發變得更加容易,競爭加劇,大型科技公司的「護城河」看起來更像水溝,硬件要求(和成本)大幅下降
14/ 當然,OpenAI 等巨頭不會坐以待斃。但一切都要顛覆,再也不是大力出奇跡的模式了。
DeepSeek這只黑天鵝,扇動翅膀,整個硅谷都會被波及,效應可以總結為以下幾點。
AI初創企業危機:Deep Seek的高性能可能導致大量購買英偉達顯卡的AI初創企業破產,釋放大量二手GPU。對Scale AI的CEO兼創始人Alexandr Wang來說,這是攸關生死的存亡之爭,口出惡言,也可以理解。
數據中心業務受挫:大型數據中心運營商,其租用英偉達顯卡的商業模式將受到沖擊。
科技巨頭減緩采購:科技巨頭們可能因庫存積壓,減少對英偉達顯卡的采購。
英偉達前景堪憂:上述因素疊加,可能導致英偉達的業務全面下滑。
X上,有一個金融大V說了一句:deepseek better not be the real deal...(deepseek 最好不是真的......)然后配了一張讓人不寒而栗的圖。
75年高點:圖表顯示,美國股市位于75年來的最高點。
Magnificent 7:這個詞指的是目前美國股市中表現最好的七家科技巨頭公司,它們在很大程度上推動了美國股市的上漲。
兩次泡沫:分別是上世紀60年代的Nifty 50泡沫和90年代的互聯網泡沫。這兩次泡沫都導致了股市崩盤,這一次,deepseek來了...美股會崩嗎?
最后,我們再看一看,Deep Seek團隊剛在康奈爾發表的論文,其中每一個作者都值得我們銘記,大部分都是30歲以下的年輕人,來自國內的頂尖大學,有的還在讀博士,其中,無人具有海外的學術背景。這再次表明中國在大學教育質量上已經趕上美國,并且未來幾十年中國在STEM畢業生方面將占據絕對的數量優勢。
正如DeepSeek創始人梁文鋒所說:我們的價值在于團隊,通過這個過程不斷成長和積累專業知識。建立一個能夠持續創新的團隊,才是我們真正的護城河。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.