網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

DeepSeek-R1下載量破千萬(wàn)：不是AI的斯普特尼克時(shí)刻，是開(kāi)源勝利

2025-02-17 19:08:14　來(lái)源: 數(shù)據(jù)猿DataYuan

北京舉報(bào)

分享至

發(fā)布僅僅一個(gè)月左右，DeepSeek-R1成為Hugging Face平臺(tái)上有史以來(lái)最受歡迎的模型，其衍生出的數(shù)千個(gè)變體模型下載量突破了1000萬(wàn)次！2月14日，Hugging Face聯(lián)合創(chuàng)始人Clément Delangue在推特上激動(dòng)宣布。

從Delangue分享的圖表中可以明顯看出，DeepSeek-R1（黃線）的下載量增長(zhǎng)曲線幾乎呈現(xiàn)出“垂直起飛”的態(tài)勢(shì)，其他開(kāi)源大模型，如Llama、Stable Diffusion、Mistral等增速相對(duì)緩慢。

這是繼DeepSeek AI智能助手登頂美區(qū)App Store免費(fèi)下載榜之后另一個(gè)振奮人心的消息。

我們來(lái)看看DeepSeek AI智能助手上架一個(gè)月后表現(xiàn)如何？

2月14日，它在生產(chǎn)工具類別下依然高居第三，排行榜的榜首被ChatGPT奪回，Google Gemini排在第四位。

在DeepSeek的評(píng)論區(qū)里，不少用戶給出了高度評(píng)價(jià)：

“取消GPT訂閱。我喜歡能夠閱讀它的‘推理’過(guò)程......更不用說(shuō)我在我的MacBook 上運(yùn)行了14b和32b本地模型。比Apple Intelligence好多了......我認(rèn)為如果DeepSeek能夠用更少的錢把事情做好，蘋果應(yīng)該解雇負(fù)責(zé)蘋果智能研究的人。”

“五星好評(píng)！我最近有機(jī)會(huì)使用DeepSeek，我必須說(shuō)，它徹底改變了我處理數(shù)據(jù)分析和決策的方式.....真正讓我印象深刻的是它提供的定制和靈活性......感謝DeepSeek創(chuàng)造了如此強(qiáng)大且用戶友好的解決方案！”

不過(guò)整體而言，DeepSeek的評(píng)分僅為4.1分，與兩大競(jìng)爭(zhēng)對(duì)手ChatGPT（4.9 分）和Google Gemini（4.8 分）仍有差距。

考慮到ChatGPT和Gemini經(jīng)過(guò)多輪優(yōu)化，UI/UX設(shè)計(jì)更為成熟，用戶體驗(yàn)也更流暢；而DeepSeek雖然在AI模型壓縮和輕量化方面表現(xiàn)出色，但用戶在實(shí)際使用中仍可能遇到響應(yīng)延遲、服務(wù)器不穩(wěn)定、訪問(wèn)受限等問(wèn)題。此外，作為一款來(lái)自中國(guó)的產(chǎn)品，其在美國(guó)市場(chǎng)的信任度相對(duì)較低。在這樣的背景下，DeepSeek依然能取得當(dāng)前的口碑和下載量，已相當(dāng)可觀。

回顧過(guò)去一個(gè)月，DeepSeek頻頻登上各大媒體的頭版頭條，成為科技公司和風(fēng)投界熱議的焦點(diǎn)。

憑借推出“平價(jià)好用”的大語(yǔ)言模型，這家總部位于杭州的公司更是引發(fā)了市場(chǎng)對(duì)“燒錢”型AI模式的深刻反思，同時(shí)也在一定程度上攪動(dòng)了美股市場(chǎng)。

1月27日，隨著其AI智能助手登頂美區(qū)App Store免費(fèi)下載榜，納斯達(dá)克指數(shù)暴跌超3%，一度觸及19204.95點(diǎn)；標(biāo)普500指數(shù)則下跌1.46%，最低降至5962.92點(diǎn)。

隨著FOMO（Fear of Missing Out）情緒的消退，目前兩大指數(shù)均已有所修復(fù)，在上周五，納指重新站上20000點(diǎn)，標(biāo)普500指數(shù)則回升至6,114.63點(diǎn)。

DeepSeek 為什么“震撼”了美國(guó)？

先上結(jié)論，主要有四個(gè)點(diǎn)對(duì)美國(guó)產(chǎn)生了極大的“震撼”：

1.極低的訓(xùn)練成本：DeepSeek團(tuán)隊(duì)聲稱僅花費(fèi)了600萬(wàn)美元就訓(xùn)練出了 R1，而GPT-4的訓(xùn)練成本預(yù)計(jì)高達(dá)數(shù)億美元。

2.中國(guó)AI研究實(shí)力的證明：美國(guó)一直在限制對(duì)中國(guó)的AI芯片出口（如 Nvidia GPU），但DeepSeek仍能取得突破，說(shuō)明芯片封鎖并未阻止中國(guó)AI的發(fā)展。

3.開(kāi)源且提供極其寬松的許可：DeepSeek-R1采用MIT許可證，比Meta的 Llama 還要開(kāi)放，任何人都可以免費(fèi)使用、修改和二次開(kāi)發(fā)，甚至商用化。

4.推理過(guò)程（reasoning traces）的公開(kāi)：這點(diǎn)很重要。以往，OpenAI在發(fā)布A1時(shí)并沒(méi)有公開(kāi)推理過(guò)程，而推理過(guò)程的公開(kāi)可以幫助小模型快速進(jìn)行知識(shí)蒸餾（distillation），讓小模型的訓(xùn)練成本更低、速度更快。

其實(shí)，DeepSeek在“爆火”之前，英文技術(shù)社區(qū)已經(jīng)對(duì)它進(jìn)行了一段時(shí)間的關(guān)注了。

在HackerNews上，最早的討論可追溯至 2024 年 9 月，當(dāng)時(shí)一名用戶表示 DeepSeek的性能看起來(lái)不錯(cuò)，但對(duì)用戶條款、隱私政策等存疑，而其他用戶則回復(fù)道：“這是個(gè)開(kāi)源模型，便宜又好用，不用太擔(dān)心。”

2024年10月發(fā)布的一篇名為“DeepSeek v2.5 – 一個(gè)和GPT-4相當(dāng)?shù)拈_(kāi)源大語(yǔ)言模型，但價(jià)格便宜95%” 的帖子也引發(fā)了熱烈討論，足見(jiàn)許多開(kāi)發(fā)者都在尋找更經(jīng)濟(jì)實(shí)用的大語(yǔ)言模型。但大部分評(píng)論者認(rèn)為，DeepSeek v2.5在功能完整度和性能上并不能完全替代GPT-4，更多是以極具優(yōu)勢(shì)的價(jià)格覆蓋了基本需求，幫助開(kāi)發(fā)者大幅降低日常研發(fā)和調(diào)用成本。

10月到12月之間，我們可以看到依舊有不少討論DeepSeek的帖子。

接下來(lái)的劇情就是，1月20日，DeepSeek正式推出了R-1。這是一個(gè)在數(shù)學(xué)、代碼生成和自然語(yǔ)言推理等任務(wù)上，可與OpenAI的o1模型相媲美，但對(duì)計(jì)算資源消耗卻遠(yuǎn)低于市面主流大模型的全新大語(yǔ)言模型。隨著DeepSeek的AI智能助手沖上美區(qū)蘋果免費(fèi)應(yīng)用排行榜第一，美國(guó)科技公司的股價(jià)受到重創(chuàng)。

在匿名職場(chǎng)社交平臺(tái)Blind上，一位Meta員工爆料，DeepSeek對(duì)Meta GenAI業(yè)務(wù)部門造成了巨大沖擊：

“管理層擔(dān)心如何證明GenAI業(yè)務(wù)部門的巨額成本是合理的。當(dāng)GenAI業(yè)務(wù)部門的每一位領(lǐng)導(dǎo)的收入都超過(guò)完全培訓(xùn)DeepSeek v3的成本時(shí)，他們將如何面對(duì)更高的領(lǐng)導(dǎo)層？何況我們有幾十位這樣的領(lǐng)導(dǎo)。Deepseek-R1讓事情變得更加可怕。我不能透露機(jī)密信息，但它很快就會(huì)公開(kāi)。GenAI本應(yīng)是一個(gè)專注于工程的小型組織，但由于一群人想加入影響力爭(zhēng)奪戰(zhàn)并人為地增加組織的招聘人數(shù)，每個(gè)人都輸了。”

一名谷歌員工在回復(fù)中也給出了最受支持的觀點(diǎn)：

“DeepSeek的做法的確瘋狂。但這對(duì)整個(gè)行業(yè)是好事，我們正在實(shí)時(shí)見(jiàn)證公開(kāi)競(jìng)爭(zhēng)如何有效地推動(dòng)創(chuàng)新。”

盡管不確定Meta GenAI部門是否真如帖子所言那樣焦灼，但可以肯定的是，OpenAI、谷歌、Anthropic等AI巨頭正在切實(shí)感受到來(lái)自DeepSeek的壓力，并紛紛加快更新產(chǎn)品以鞏固自身優(yōu)勢(shì)。

1月31日，OpenAI宣布推出全新推理模型o3-mini，并首次向免費(fèi)用戶開(kāi)放。作為OpenAI推理系列中的最新產(chǎn)品，o3-mini相較o1價(jià)格便宜了93%，其中輸入價(jià)格為1.10美元/百萬(wàn)Tokens，輸出價(jià)格為4.40美元/百萬(wàn)Tokens。

2月5日，谷歌高調(diào)更新了Gemini 2.0全家桶，包括面向通用場(chǎng)景的Gemini 2.0 Flash、性能更強(qiáng)的Gemini 2.0 Pro，以及性價(jià)比最高的Gemini 2.0 Flash-Lite。官方信息顯示，Gemini 2.0 Flash-Lite與1.5 Flash在速度和成本上持平，最大的亮點(diǎn)是“高性價(jià)比”，其輸入價(jià)格為0.075美元/百萬(wàn)Tokens，輸出價(jià)格為0.30美元/百萬(wàn)Tokens。

與DeepSeek-R1的輸入/輸出價(jià)格（分別為0.14美元和2.19美元/百萬(wàn)Tokens）相比，o3-mini依然偏貴；而Gemini 2.0 Flash-Lite雖然成本更低，但在需要更強(qiáng)算力或更復(fù)雜推理的場(chǎng)景中，表現(xiàn)相對(duì)遜色。

面對(duì)這樣“便宜大碗”的模型，開(kāi)發(fā)者們?cè)趺茨懿粍?dòng)心？

Perplexity率先接入了DeepSeek，微軟CEO薩提亞·納德拉也在1月29日的財(cái)報(bào)電話會(huì)議上宣布：DeepSeek-R1可通過(guò)Azure AI Foundry和GitHub獲取。隨后，AWS、英偉達(dá)、AMD、Intel等云服務(wù)及芯片巨頭紛紛快速跟進(jìn)，爭(zhēng)相搭上DeepSeek的“快車”，希望借其更低成本、更高效的推理能力來(lái)增強(qiáng)各自的AI生態(tài)，以及更好地滿足開(kāi)發(fā)者需求。

在錯(cuò)綜復(fù)雜的地緣政治環(huán)境下，中美在AI領(lǐng)域常因政策與監(jiān)管產(chǎn)生分歧。然而，DeepSeek采用開(kāi)源和寬松許可模式發(fā)布其模型，讓更多研究者能夠跨越國(guó)別和制度鴻溝，進(jìn)行深度探索與驗(yàn)證。這種“社區(qū)共建”的機(jī)制，不僅推動(dòng)了技術(shù)的快速迭代與傳播，也在很大程度上弱化了地緣競(jìng)爭(zhēng)中的不信任感，為AI創(chuàng)新建立了一個(gè)相對(duì)開(kāi)放的公共平臺(tái)，給業(yè)界帶來(lái)了強(qiáng)烈的“震撼”。

這是AI的斯普特尼克時(shí)刻？還是一份禮物？

1957 年，蘇聯(lián)成功發(fā)射人類歷史上的第一顆人造衛(wèi)星——斯普特尼克（Sputnik），美國(guó)人頓覺(jué)領(lǐng)先地位被撼動(dòng)，不得不全力投入到一場(chǎng)空前的太空競(jìng)賽中。

今天，美國(guó)主流媒體也將中國(guó)團(tuán)隊(duì)推出的DeepSeek-R1視作一種“AI的斯普特尼克時(shí)刻”，因?yàn)樗瑯佑|動(dòng)了科技界的神經(jīng)，引發(fā)了類似當(dāng)年的危機(jī)感與緊迫感。甚至美國(guó)總統(tǒng)唐納德·特朗普也宣稱這是“對(duì)我們AI行業(yè)的警鐘，我們需要全神貫注于競(jìng)爭(zhēng)”。

在美國(guó)風(fēng)險(xiǎn)投資機(jī)構(gòu)Andreessen Horowitz（a16z）的合伙人Martin Casado看來(lái)，這場(chǎng)AI競(jìng)賽和當(dāng)年的太空競(jìng)賽沒(méi)什么兩樣，美國(guó)必須贏。

他在近期的播客中談到，DeepSeek之所以能在短時(shí)間內(nèi)獲得巨大關(guān)注，一是因?yàn)樗_(kāi)源程度極高，采用了極其寬松的許可證；二是公開(kāi)了推理過(guò)程，讓小模型能夠快速進(jìn)行知識(shí)蒸餾，進(jìn)一步降低訓(xùn)練成本與加快推理速度。與之形成鮮明對(duì)比的是，為了鞏固自己在行業(yè)里的領(lǐng)先地位，冠著“Open”名號(hào)的OpenAI在發(fā)布o(jì)1時(shí)并沒(méi)有公開(kāi)任何推理細(xì)節(jié)。

(Martin Casado在播客里)

Casado是工程師出身，在a16z專注于企業(yè)軟件、網(wǎng)絡(luò)安全、云計(jì)算和人工智能等領(lǐng)域的投資。

他還坦言，美國(guó)近年來(lái)的AI政策是失敗的——高密度、高強(qiáng)度的出口管制，試圖在芯片和軟件層面封鎖中國(guó)的AI發(fā)展，這樣的措施沒(méi)有達(dá)到預(yù)期效果，DeepSeek的崛起就是最好的證明。

“我們需要從一個(gè)更廣闊的視角來(lái)看待這個(gè)問(wèn)題——中國(guó)確實(shí)有頂尖的AI研究團(tuán)隊(duì)。DeepSeek其實(shí)已經(jīng)發(fā)布過(guò)多個(gè)業(yè)界領(lǐng)先（SOTA）的模型，比如V3，可能比R1更具技術(shù)含量。類似于GPT-4，它們也是基于鏈?zhǔn)剿季S（Chain of Thought, CoT）進(jìn)行推理的，而DeepSeek早就在這方面有所研究。”Casado說(shuō)到。

當(dāng)年的斯普特尼克讓美國(guó)重新思考自身科技與教育體系，同時(shí)加速了對(duì)太空探索的投入。如今，面對(duì)DeepSeek的崛起，更值得反思的是，在打著自由市場(chǎng)旗號(hào)的美國(guó)，OpenAI、谷歌、Anthropic 等 AI 巨頭大多優(yōu)先考慮專有模型，而中國(guó)團(tuán)隊(duì)則通過(guò)開(kāi)源方式實(shí)現(xiàn)了突破性進(jìn)展，進(jìn)一步降低最前沿 AI 的門檻和成本，構(gòu)建起蓬勃發(fā)展的AI生態(tài)系統(tǒng)。

對(duì)大公司而言，私有化模型有助于把控知識(shí)產(chǎn)權(quán)、強(qiáng)化自身在市場(chǎng)中的地位。然而，這種高度封閉的發(fā)展方式在高速演進(jìn)的AI領(lǐng)域里，越來(lái)越難以滿足公眾對(duì)技術(shù)開(kāi)放和透明度的期待，也可能成為創(chuàng)新與合作的桎梏。

在政府層面，白宮對(duì)AI領(lǐng)域?qū)嵤┑乃懔ο拗坪痛a封鎖等舉措，不但沒(méi)有遏制中國(guó)的進(jìn)步，反而在某種程度上束縛了美國(guó)自身的領(lǐng)先優(yōu)勢(shì)。

a16z的另一位合伙人Alex Rampell更直截了當(dāng)?shù)刂赋觯鞍莸钦畵?dān)心如果美國(guó)的AI開(kāi)源，中國(guó)會(huì)復(fù)制。但DeepSeek反其道而行之——現(xiàn)在是中國(guó)發(fā)布了開(kāi)源AI，而美國(guó)的公司都想使用它或復(fù)刻它，因?yàn)樗男阅軐?shí)在太強(qiáng)了。”

開(kāi)源曾是美國(guó)高科技領(lǐng)域里最引以為傲的“殺手锏”，早年的互聯(lián)網(wǎng)協(xié)議、操作系統(tǒng)、數(shù)據(jù)庫(kù)等關(guān)鍵技術(shù)，正是在廣泛開(kāi)放的環(huán)境下得以快速迭代，助力美國(guó)牢牢把握信息革命的制高點(diǎn)。然而，近幾年由于對(duì)知識(shí)產(chǎn)權(quán)與商業(yè)收益的高度關(guān)注，再加上對(duì)國(guó)家安全和經(jīng)濟(jì)制裁層面的考量，一些科技巨頭選擇更加封閉的研發(fā)模式，縮減了行業(yè)合作與創(chuàng)新的空間。

Rampell并不認(rèn)為DeepSeek是“新的斯普特尼克時(shí)刻”，而是“給美國(guó)人民的禮物”：它讓“驕傲”的美國(guó)不得不正視全球AI競(jìng)爭(zhēng)的現(xiàn)狀，加速在技術(shù)、人才和資金上的投入。

在這樣的大背景下，越來(lái)越多的科技人呼吁，美國(guó)的AI政策必須做出深層調(diào)整。繼續(xù)靠封鎖和管控來(lái)保持優(yōu)勢(shì)，只會(huì)失去推動(dòng)全行業(yè)整體躍升的機(jī)會(huì)。正如Meta首席人工智能科學(xué)家 Yann LeCun 在LinkedIn上所言：“對(duì)于那些看到DeepSeek表現(xiàn)、認(rèn)為這是中國(guó)在人工智能領(lǐng)域超越美國(guó)的人來(lái)說(shuō)，你們理解錯(cuò)了。正確的解讀是開(kāi)源模型正在超越專有模型。”

隨著AI競(jìng)爭(zhēng)逐漸從單純追求更大規(guī)模、更多參數(shù)和更強(qiáng)算力，轉(zhuǎn)向注重應(yīng)用與生態(tài)的深度整合，誰(shuí)能讓大模型在不同行業(yè)場(chǎng)景中快速落地，并構(gòu)建強(qiáng)大的協(xié)同網(wǎng)絡(luò)，誰(shuí)就能在這場(chǎng)競(jìng)賽中率先勝出。

英偉達(dá)CEO黃仁勛就曾強(qiáng)調(diào)，模型規(guī)模本身并不代表市場(chǎng)價(jià)值，真正能讓技術(shù)落地的，取決于能否與現(xiàn)實(shí)需求無(wú)縫對(duì)接；斯坦福大學(xué)教授吳恩達(dá)（Andrew Ng）也在演講中反復(fù)提到：解決實(shí)際問(wèn)題、為用戶創(chuàng)造價(jià)值，才是所有大模型發(fā)展的根本目標(biāo)。從醫(yī)療、金融到零售，每個(gè)行業(yè)都有不同的業(yè)務(wù)痛點(diǎn)和法規(guī)要求，促使研發(fā)團(tuán)隊(duì)必須進(jìn)行針對(duì)性的模型裁剪與定制。

在這種趨勢(shì)下，像DeepSeek這樣依托開(kāi)放、彈性生態(tài)系統(tǒng)的團(tuán)隊(duì)，不僅能為行業(yè)提供更低門檻的成長(zhǎng)路線，還能不斷吸納開(kāi)發(fā)者與合作伙伴，讓AI技術(shù)在更多應(yīng)用場(chǎng)景釋放潛力，保持可持續(xù)發(fā)展。

OpenAI CEO Sam Altman也開(kāi)始反思他的策略。在o3-mini發(fā)布會(huì)后，這位硅谷天才創(chuàng)業(yè)者與幾位高管在Reddit上回答網(wǎng)友提問(wèn)，在問(wèn)及是否會(huì)公開(kāi)部分大模型權(quán)重時(shí)，Altman坦言：“我個(gè)人認(rèn)為，我們?cè)陂_(kāi)源策略上可能走錯(cuò)了方向，需要探索一種全新的開(kāi)放模式。不過(guò)，并非所有OpenAI成員都認(rèn)同這一觀點(diǎn)，而且目前這也并非我們的最高優(yōu)先級(jí)。”

或許DeepSeek不僅是開(kāi)源大模型的一次重大勝利，更是一份“送給世界的禮物”，將為整個(gè)行業(yè)樹(shù)立了全新的標(biāo)桿。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.