文章作者丨貝恩公司:Peter Hanbury and Jue Wang,慎思行采編翻譯
個人微信丨hello_SSX
成立于2023年的中國人工智能初創公司DeepSeek在業內迅速掀起了波瀾。這家員工不到200人的公司得到了量化基金幻方量化(管理著80億美元資產)的支持,在OpenAI宣布價值5000億美元的星際之門項目的前一天,該公司發布了其開源模型DeepSeek R1。
DeepSeek的與眾不同之處在于其極具成本效益的前景。該公司聲稱,使用2,000個Nvidia H800圖形處理器(GPU)訓練模型的成本僅為600萬美元,而GPT-4的成本為8,000萬至1億美元,Meta的LLaMA 3需要16,000個H100 GPU。雖然這種比較相差甚遠,但理解其中的可能性是有價值的。
DeepSeek的迅速普及凸顯了其潛在的影響力。短短幾天內,它就成為美國應用商店中最受歡迎的免費應用,催生了700多個開源衍生產品(而且還在不斷增加),并被微軟、AWS和Nvidia AI平臺采用。
DeepSeek的性能似乎是建立在一系列工程創新的基礎上,這些創新大大降低了推理成本,同時也提高了訓練成本。其mixture-of-experts(MoE)架構在處理每個標記時只激活6710億個參數中的370億個,在不犧牲性能的情況下減少了計算開銷。公司還優化了提煉技術,允許將大型模型的推理能力轉移到小型模型中。通過使用強化學習,DeepSeek無需進行大量的監督微調即可提高性能。此外,它的多頭潛在注意力(MHLA)機制將內存使用率降低到了5%,而以前的方法只有13%。
除了模型架構,DeepSeek還改進了數據處理方式。它采用FP8混合精度的混合/低精度計算方法,降低了計算成本。優化的獎勵函數可確保計算能力分配給高價值的訓練數據,避免在冗余信息上浪費資源。公司還采用了稀疏性技術,使模型能夠預測特定輸入所需的參數,從而提高速度和效率。DeepSeek的硬件和系統級優化進一步提高了性能。公司開發了內存壓縮和負載平衡技術,以最大限度地提高效率。具體來說,一種新穎的優化技術是使用PTX編程而不是CUDA,從而使DeepSeek工程師能夠更好地控制GPU指令的執行,提高GPU的使用效率。此外,DeepSeek還利用DualPipe算法改進了GPU之間的通信,使GPU能夠在訓練過程中更有效地進行通信和計算。
到目前為止,這些結果并不令人驚訝;事實上,它們與人工智能效率的大趨勢相吻合(見圖1)。更令人驚訝的是,一家開源的中國初創公司已經設法縮小或至少顯著縮小了與領先的專有模型之間的性能差距。
圖1
由于創新,人工智能推理成本迅速下降,DeepSeek也順應了這一趨勢
注:大規模多任務語言理解(MMLU)衡量大型語言模型(LLM)理解語言和解決問題的能力,結果由模型提供者報告或通過外部評估得出;83分和42分是性能基準,越高越好。
資料來源:A16Z;貝恩分析
懷疑和市場影響
盡管DeepSeek聲稱如此,但仍存在一些不確定因素。訓練模型的真實成本仍未得到證實,人們猜測該公司是否混合使用了高端和低端GPU。此外,還有人提出了知識產權方面的問題,特別是有關提煉所使用的來源和方法。一些批評者認為,DeepSeek并沒有從根本上引入新技術,而只是對現有技術進行了改進。盡管如此,董事會和領導團隊現在正密切關注人工智能效率的提高會如何影響長期投資計劃和戰略。
有幾種催化劑可以有效抵消效率的提高,并維持當前的人工智能基礎設施投資水平。
培訓
5大催化劑將維持對培訓計算的強勁需求,抵消效率的提高
繼續推動“曼哈頓計劃”的科學應用案例(如研究突破、新藥發現等)
盡管后幾代模型可以有效降低成本,但首次訓練下一代大型模型的成本仍然很高
競爭加劇和人工智能軍備競賽,尤其是針對開源模型,但也針對前沿專有模型
用于新模式(如音頻、視頻、機器人與文本)的訓練數據/參數數量不斷增加,生成的合成數據也在增加
增加政府贊助(如星際之門)和支持性法規,促進人工智能的持續研發
推理
推理成本以每年至少10倍的速度持續下降,對推理計算的需求持續增長
通過企業生成式人工智能用例部署(如代碼生成),終端用戶的采用率不斷提高,橫向工具(如Perplexity、ChatGPT)的日常使用率大幅上升
每個用戶使用更多推理繁重的大型語言模型功能(如視頻生成),以及在數十億設備(如手機、物聯網傳感器)上進行大規模推理的邊緣擴散,人工智能的使用強度將會增加
可能的人工智能市場情景
DeepSeek 的影響可能會以多種方式展開。
在看漲的情況下,效率的不斷提高將導致推理成本的降低,從而刺激更多的人工智能應用——這種模式被稱為杰文悖論(Jevon's paradox),即成本降低推動需求增加。在推理成本下降的同時,高端培訓和先進的人工智能模型可能會繼續成為大量投資的理由,從而確保在尖端人工智能能力方面的支出保持強勁。
適度情景表明,人工智能培訓成本保持穩定,但人工智能推理基礎設施支出將減少30%至50%。在這種情況下,云服務提供商的資本支出將從每年800億至1000億美元之間減少到650億至850億美元之間,雖然低于目前的預測,但仍比2023年的水平增加了2至3倍。
在看跌的情況下,人工智能培訓預算縮減,推理基礎設施支出大幅下降。云提供商的資本支出可能降至400 億至600億美元之間,雖然低于目前的預測,但仍比2023年的水平高出1.5倍至2倍。
消除噪音
在各種猜測中,一些看法可能有助于了解事件的來龍去脈:
重大飛躍,不足為奇:推理成本一直在穩步下降,DeepSeek的創新加速了這一趨勢,而非完全顛覆。
不要反應過度:人工智能的應用將繼續強勁擴張,盡管投資的速度和形式可能會發生變化。
推理只是其中的一部分:最大的參與者仍在競相建立下一代模型,以開啟前沿應用和更大的潛在市場。
各細分市場的影響:模型層的軍備競賽愈演愈烈,開源與專有的較量成為關鍵戰場,數據中心硬件的短期波動和中期走強將使應用程序廠商受益。
能源需求:鑒于電力供應的限制,到2030年的近期需求不太可能發生實質性變化;長期影響仍不確定。
總體而言,對人工智能能力的需求依然強勁。隨著效率的提高,數據中心、硬件提供商和人工智能應用程序開發人員將繼續發展,創造新的可能性。
首席執行官手冊:現在該做什么
對于首席執行官們來說,DeepSeek事件與其說是一家公司的事,不如說是人工智能未來的信號。教訓是顯而易見的:人工智能創新的步伐是快速和迭代的,突破可能來自意想不到的地方。
高管們可以采取三個關鍵步驟:
避免過度反應,但要做好成本擾動的準備。DeepSeek的模型可能不會對人工智能企業的生存構成威脅,但它凸顯了人工智能成本的快速下降。企業應為人工智能推理成本大幅降低的世界做好準備,從而實現更廣泛的應用和新的競爭態勢。
密切關注市場信號。密切關注資本支出趨勢、GPU需求和人工智能采用率。如果基礎設施支出放緩,可能表明效率的提高正在重塑人工智能經濟學 。隨著企業加速采用人工智能,企業必須迅速采取行動,將人工智能融入其核心戰略。
超越生產力——將人工智能視為商業模式的催化劑。人工智能的真正贏家將是那些利用人工智能重新定義其核心產品而不僅僅是削減成本的企業。首席執行官們應該推動企業超越自動化,實現人工智能驅動的創新——無論是在產品開發、客戶個性化還是全新服務方面。
未來幾個月需要關注的重要信號
影響較小的跡象
圍繞成本和利用其他模式(如OpenAI)的理論得到證實
揭示重要的“隱藏”成本或資源(如GPU)暴露
有明顯證據表明,DeepSeek是在其他模型上訓練出來的
人工智能市場繼續關注前沿/更先進的訓練模型
DeepSeek努力在中國以外地區獲得相關性
衍生模型和競爭者的快速增長
低成本開源模型日益普及,使人工智能推理能更快地適應產品市場需求
新進入者迅速使該領域商品化
隨著成本下降,人工智能工具被迅速采用
企業人工智能對高端高性能機型的需求依然強勁;領先的人工智能實驗室實施人工智能模型訪問限制和提煉控制。
市場軌跡發生重大變化的跡象
數據中心和云計算人工智能支出放緩
主要云服務提供商推遲或縮減人工智能基礎設施擴張計劃
人工智能初創企業縮減圖形處理器(GPU)訂單或云人工智能合同
半導體需求疲軟
主要企業(Nvidia、AMD、臺積電等)下調與人工智能相關的收益和資本支出
GPU前置時間縮短;高端芯片二級市場定價下降
人工智能驅動的電力需求放緩
云提供商下調耗電量預測
能源供應商報告直流電增長低于預期
在非西方市場,企業采用的人工智能模式已從美國供應商轉向其他國家和地區;
美國對人工智能芯片出口發布新限制,和/或中國要求采用國產機型;
前沿模型要么“退出”,因為它們通過提煉失去了價值,要么大大提高了效率;
編輯 | Jinya
清流學苑2025Q1課程安排
我們將在3月1~2日在北京再次推出我們清流學苑的經典課程《問題解決營》的升級版,歡迎感興趣的朋友掃碼了解和報名。
我們也將在3月29~30日在上海推出我們的清流學苑的新晉課程《關鍵洞察營》,歡迎感興趣的朋友掃碼了解和報名。
常言道“不出正月都是年”,因此慎思行年度經典文章大禮包活動將持續至正月正式結束,歡迎大家掃碼填問卷,獲取大禮包。
進一步交流
進入專業社群展開深度討論
慎思行通過微信等平臺覆蓋超過10萬戰略人、咨詢人等各類專業人士。我們也構建了專業社群,推動戰略與咨詢領域的問題討論、信息交流和機會分享,社群已有超過5年歷史,并成為了頂尖專業人士感知市場前沿,獲得實踐經驗的首要選擇。入群請添加慎思君微信,并提供名片。
現在微信公眾號更改規則,如果你不特地點進來,很可能看不到我們的推送了。希望喜歡【慎思行】的讀者朋友們將本號【設為星標★】,方便找到我們;也歡迎點擊右下角的【在看】。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.