發(fā)布僅僅一個(gè)月左右,DeepSeek-R1成為Hugging Face平臺(tái)上有史以來(lái)最受歡迎的模型,其衍生出的數(shù)千個(gè)變體模型下載量突破了1000萬(wàn)次!2月14日,Hugging Face聯(lián)合創(chuàng)始人Clément Delangue在推特上激動(dòng)宣布。
從Delangue分享的圖表中可以明顯看出,DeepSeek-R1(黃線)的下載量增長(zhǎng)曲線幾乎呈現(xiàn)出“垂直起飛”的態(tài)勢(shì),其他開(kāi)源大模型,如Llama、Stable Diffusion、Mistral等增速相對(duì)緩慢。
這是繼DeepSeek AI智能助手登頂美區(qū)App Store免費(fèi)下載榜之后另一個(gè)振奮人心的消息。
我們來(lái)看看DeepSeek AI智能助手上架一個(gè)月后表現(xiàn)如何?
2月14日,它在生產(chǎn)工具類別下依然高居第三,排行榜的榜首被ChatGPT奪回,Google Gemini排在第四位。
在DeepSeek的評(píng)論區(qū)里,不少用戶給出了高度評(píng)價(jià):
“取消GPT訂閱。我喜歡能夠閱讀它的‘推理’過(guò)程......更不用說(shuō)我在我的MacBook 上運(yùn)行了14b和32b本地模型。比Apple Intelligence好多了......我認(rèn)為如果DeepSeek能夠用更少的錢把事情做好,蘋果應(yīng)該解雇負(fù)責(zé)蘋果智能研究的人。”
“五星好評(píng)!我最近有機(jī)會(huì)使用DeepSeek,我必須說(shuō),它徹底改變了我處理數(shù)據(jù)分析和決策的方式.....真正讓我印象深刻的是它提供的定制和靈活性......感謝DeepSeek創(chuàng)造了如此強(qiáng)大且用戶友好的解決方案!”
不過(guò)整體而言,DeepSeek的評(píng)分僅為4.1分,與兩大競(jìng)爭(zhēng)對(duì)手ChatGPT(4.9 分)和Google Gemini(4.8 分)仍有差距。
考慮到ChatGPT和Gemini經(jīng)過(guò)多輪優(yōu)化,UI/UX設(shè)計(jì)更為成熟,用戶體驗(yàn)也更流暢;而DeepSeek雖然在AI模型壓縮和輕量化方面表現(xiàn)出色,但用戶在實(shí)際使用中仍可能遇到響應(yīng)延遲、服務(wù)器不穩(wěn)定、訪問(wèn)受限等問(wèn)題。此外,作為一款來(lái)自中國(guó)的產(chǎn)品,其在美國(guó)市場(chǎng)的信任度相對(duì)較低。在這樣的背景下,DeepSeek依然能取得當(dāng)前的口碑和下載量,已相當(dāng)可觀。
回顧過(guò)去一個(gè)月,DeepSeek頻頻登上各大媒體的頭版頭條,成為科技公司和風(fēng)投界熱議的焦點(diǎn)。
憑借推出“平價(jià)好用”的大語(yǔ)言模型,這家總部位于杭州的公司更是引發(fā)了市場(chǎng)對(duì)“燒錢”型AI模式的深刻反思,同時(shí)也在一定程度上攪動(dòng)了美股市場(chǎng)。
1月27日,隨著其AI智能助手登頂美區(qū)App Store免費(fèi)下載榜,納斯達(dá)克指數(shù)暴跌超3%,一度觸及19204.95點(diǎn);標(biāo)普500指數(shù)則下跌1.46%,最低降至5962.92點(diǎn)。
隨著FOMO(Fear of Missing Out)情緒的消退,目前兩大指數(shù)均已有所修復(fù),在上周五,納指重新站上20000點(diǎn),標(biāo)普500指數(shù)則回升至6,114.63點(diǎn)。
DeepSeek 為什么“震撼”了美國(guó)?
先上結(jié)論,主要有四個(gè)點(diǎn)對(duì)美國(guó)產(chǎn)生了極大的“震撼”:
1.極低的訓(xùn)練成本:DeepSeek團(tuán)隊(duì)聲稱僅花費(fèi)了600萬(wàn)美元就訓(xùn)練出了 R1,而GPT-4的訓(xùn)練成本預(yù)計(jì)高達(dá)數(shù)億美元。
2.中國(guó)AI研究實(shí)力的證明:美國(guó)一直在限制對(duì)中國(guó)的AI芯片出口(如 Nvidia GPU),但DeepSeek仍能取得突破,說(shuō)明芯片封鎖并未阻止中國(guó)AI的發(fā)展。
3.開(kāi)源且提供極其寬松的許可:DeepSeek-R1采用MIT許可證,比Meta的 Llama 還要開(kāi)放,任何人都可以免費(fèi)使用、修改和二次開(kāi)發(fā),甚至商用化。
4.推理過(guò)程(reasoning traces)的公開(kāi):這點(diǎn)很重要。以往,OpenAI在發(fā)布A1時(shí)并沒(méi)有公開(kāi)推理過(guò)程,而推理過(guò)程的公開(kāi)可以幫助小模型快速進(jìn)行知識(shí)蒸餾(distillation),讓小模型的訓(xùn)練成本更低、速度更快。
其實(shí),DeepSeek在“爆火”之前,英文技術(shù)社區(qū)已經(jīng)對(duì)它進(jìn)行了一段時(shí)間的關(guān)注了。
在HackerNews上,最早的討論可追溯至 2024 年 9 月,當(dāng)時(shí)一名用戶表示 DeepSeek的性能看起來(lái)不錯(cuò),但對(duì)用戶條款、隱私政策等存疑,而其他用戶則回復(fù)道:“這是個(gè)開(kāi)源模型,便宜又好用,不用太擔(dān)心。”
2024年10月發(fā)布的一篇名為“DeepSeek v2.5 – 一個(gè)和GPT-4相當(dāng)?shù)拈_(kāi)源大語(yǔ)言模型,但價(jià)格便宜95%” 的帖子也引發(fā)了熱烈討論,足見(jiàn)許多開(kāi)發(fā)者都在尋找更經(jīng)濟(jì)實(shí)用的大語(yǔ)言模型。但大部分評(píng)論者認(rèn)為,DeepSeek v2.5在功能完整度和性能上并不能完全替代GPT-4,更多是以極具優(yōu)勢(shì)的價(jià)格覆蓋了基本需求,幫助開(kāi)發(fā)者大幅降低日常研發(fā)和調(diào)用成本。
10月到12月之間,我們可以看到依舊有不少討論DeepSeek的帖子。
接下來(lái)的劇情就是,1月20日,DeepSeek正式推出了R-1。這是一個(gè)在數(shù)學(xué)、代碼生成和自然語(yǔ)言推理等任務(wù)上,可與OpenAI的o1模型相媲美,但對(duì)計(jì)算資源消耗卻遠(yuǎn)低于市面主流大模型的全新大語(yǔ)言模型。隨著DeepSeek的AI智能助手沖上美區(qū)蘋果免費(fèi)應(yīng)用排行榜第一,美國(guó)科技公司的股價(jià)受到重創(chuàng)。
在匿名職場(chǎng)社交平臺(tái)Blind上,一位Meta員工爆料,DeepSeek對(duì)Meta GenAI業(yè)務(wù)部門造成了巨大沖擊:
“管理層擔(dān)心如何證明GenAI業(yè)務(wù)部門的巨額成本是合理的。當(dāng)GenAI業(yè)務(wù)部門的每一位領(lǐng)導(dǎo)的收入都超過(guò)完全培訓(xùn)DeepSeek v3的成本時(shí),他們將如何面對(duì)更高的領(lǐng)導(dǎo)層?何況我們有幾十位這樣的領(lǐng)導(dǎo)。Deepseek-R1讓事情變得更加可怕。我不能透露機(jī)密信息,但它很快就會(huì)公開(kāi)。GenAI本應(yīng)是一個(gè)專注于工程的小型組織,但由于一群人想加入影響力爭(zhēng)奪戰(zhàn)并人為地增加組織的招聘人數(shù),每個(gè)人都輸了。”
一名谷歌員工在回復(fù)中也給出了最受支持的觀點(diǎn):
“DeepSeek的做法的確瘋狂。但這對(duì)整個(gè)行業(yè)是好事,我們正在實(shí)時(shí)見(jiàn)證公開(kāi)競(jìng)爭(zhēng)如何有效地推動(dòng)創(chuàng)新。”
盡管不確定Meta GenAI部門是否真如帖子所言那樣焦灼,但可以肯定的是,OpenAI、谷歌、Anthropic等AI巨頭正在切實(shí)感受到來(lái)自DeepSeek的壓力,并紛紛加快更新產(chǎn)品以鞏固自身優(yōu)勢(shì)。
1月31日,OpenAI宣布推出全新推理模型o3-mini,并首次向免費(fèi)用戶開(kāi)放。作為OpenAI推理系列中的最新產(chǎn)品,o3-mini相較o1價(jià)格便宜了93%,其中輸入價(jià)格為1.10美元/百萬(wàn)Tokens,輸出價(jià)格為4.40美元/百萬(wàn)Tokens。
2月5日,谷歌高調(diào)更新了Gemini 2.0全家桶,包括面向通用場(chǎng)景的Gemini 2.0 Flash、性能更強(qiáng)的Gemini 2.0 Pro,以及性價(jià)比最高的Gemini 2.0 Flash-Lite。官方信息顯示,Gemini 2.0 Flash-Lite與1.5 Flash在速度和成本上持平,最大的亮點(diǎn)是“高性價(jià)比”,其輸入價(jià)格為0.075美元/百萬(wàn)Tokens,輸出價(jià)格為0.30美元/百萬(wàn)Tokens。
與DeepSeek-R1的輸入/輸出價(jià)格(分別為0.14美元和2.19美元/百萬(wàn)Tokens)相比,o3-mini依然偏貴;而Gemini 2.0 Flash-Lite雖然成本更低,但在需要更強(qiáng)算力或更復(fù)雜推理的場(chǎng)景中,表現(xiàn)相對(duì)遜色。
面對(duì)這樣“便宜大碗”的模型,開(kāi)發(fā)者們?cè)趺茨懿粍?dòng)心?
Perplexity率先接入了DeepSeek,微軟CEO薩提亞·納德拉也在1月29日的財(cái)報(bào)電話會(huì)議上宣布:DeepSeek-R1可通過(guò)Azure AI Foundry和GitHub獲取。隨后,AWS、英偉達(dá)、AMD、Intel等云服務(wù)及芯片巨頭紛紛快速跟進(jìn),爭(zhēng)相搭上DeepSeek的“快車”,希望借其更低成本、更高效的推理能力來(lái)增強(qiáng)各自的AI生態(tài),以及更好地滿足開(kāi)發(fā)者需求。
在錯(cuò)綜復(fù)雜的地緣政治環(huán)境下,中美在AI領(lǐng)域常因政策與監(jiān)管產(chǎn)生分歧。然而,DeepSeek采用開(kāi)源和寬松許可模式發(fā)布其模型,讓更多研究者能夠跨越國(guó)別和制度鴻溝,進(jìn)行深度探索與驗(yàn)證。這種“社區(qū)共建”的機(jī)制,不僅推動(dòng)了技術(shù)的快速迭代與傳播,也在很大程度上弱化了地緣競(jìng)爭(zhēng)中的不信任感,為AI創(chuàng)新建立了一個(gè)相對(duì)開(kāi)放的公共平臺(tái),給業(yè)界帶來(lái)了強(qiáng)烈的“震撼”。
這是AI的斯普特尼克時(shí)刻?還是一份禮物?
1957 年,蘇聯(lián)成功發(fā)射人類歷史上的第一顆人造衛(wèi)星——斯普特尼克(Sputnik),美國(guó)人頓覺(jué)領(lǐng)先地位被撼動(dòng),不得不全力投入到一場(chǎng)空前的太空競(jìng)賽中。
今天,美國(guó)主流媒體也將中國(guó)團(tuán)隊(duì)推出的DeepSeek-R1視作一種“AI的斯普特尼克時(shí)刻”,因?yàn)樗瑯佑|動(dòng)了科技界的神經(jīng),引發(fā)了類似當(dāng)年的危機(jī)感與緊迫感。甚至美國(guó)總統(tǒng)唐納德·特朗普也宣稱這是“對(duì)我們AI行業(yè)的警鐘,我們需要全神貫注于競(jìng)爭(zhēng)”。
在美國(guó)風(fēng)險(xiǎn)投資機(jī)構(gòu)Andreessen Horowitz(a16z)的合伙人Martin Casado看來(lái),這場(chǎng)AI競(jìng)賽和當(dāng)年的太空競(jìng)賽沒(méi)什么兩樣,美國(guó)必須贏。
他在近期的播客中談到,DeepSeek之所以能在短時(shí)間內(nèi)獲得巨大關(guān)注,一是因?yàn)樗_(kāi)源程度極高,采用了極其寬松的許可證;二是公開(kāi)了推理過(guò)程,讓小模型能夠快速進(jìn)行知識(shí)蒸餾,進(jìn)一步降低訓(xùn)練成本與加快推理速度。與之形成鮮明對(duì)比的是,為了鞏固自己在行業(yè)里的領(lǐng)先地位,冠著“Open”名號(hào)的OpenAI在發(fā)布o(jì)1時(shí)并沒(méi)有公開(kāi)任何推理細(xì)節(jié)。
(Martin Casado在播客里)
Casado是工程師出身,在a16z專注于企業(yè)軟件、網(wǎng)絡(luò)安全、云計(jì)算和人工智能等領(lǐng)域的投資。
他還坦言,美國(guó)近年來(lái)的AI政策是失敗的——高密度、高強(qiáng)度的出口管制,試圖在芯片和軟件層面封鎖中國(guó)的AI發(fā)展,這樣的措施沒(méi)有達(dá)到預(yù)期效果,DeepSeek的崛起就是最好的證明。
“我們需要從一個(gè)更廣闊的視角來(lái)看待這個(gè)問(wèn)題——中國(guó)確實(shí)有頂尖的AI研究團(tuán)隊(duì)。DeepSeek其實(shí)已經(jīng)發(fā)布過(guò)多個(gè)業(yè)界領(lǐng)先(SOTA)的模型,比如V3,可能比R1更具技術(shù)含量。類似于GPT-4,它們也是基于鏈?zhǔn)剿季S(Chain of Thought, CoT)進(jìn)行推理的,而DeepSeek早就在這方面有所研究。”Casado說(shuō)到。
當(dāng)年的斯普特尼克讓美國(guó)重新思考自身科技與教育體系,同時(shí)加速了對(duì)太空探索的投入。如今,面對(duì)DeepSeek的崛起,更值得反思的是,在打著自由市場(chǎng)旗號(hào)的美國(guó),OpenAI、谷歌、Anthropic 等 AI 巨頭大多優(yōu)先考慮專有模型,而中國(guó)團(tuán)隊(duì)則通過(guò)開(kāi)源方式實(shí)現(xiàn)了突破性進(jìn)展,進(jìn)一步降低最前沿 AI 的門檻和成本,構(gòu)建起蓬勃發(fā)展的AI生態(tài)系統(tǒng)。
對(duì)大公司而言,私有化模型有助于把控知識(shí)產(chǎn)權(quán)、強(qiáng)化自身在市場(chǎng)中的地位。然而,這種高度封閉的發(fā)展方式在高速演進(jìn)的AI領(lǐng)域里,越來(lái)越難以滿足公眾對(duì)技術(shù)開(kāi)放和透明度的期待,也可能成為創(chuàng)新與合作的桎梏。
在政府層面,白宮對(duì)AI領(lǐng)域?qū)嵤┑乃懔ο拗坪痛a封鎖等舉措,不但沒(méi)有遏制中國(guó)的進(jìn)步,反而在某種程度上束縛了美國(guó)自身的領(lǐng)先優(yōu)勢(shì)。
a16z的另一位合伙人Alex Rampell更直截了當(dāng)?shù)刂赋觯鞍莸钦畵?dān)心如果美國(guó)的AI開(kāi)源,中國(guó)會(huì)復(fù)制。但DeepSeek反其道而行之——現(xiàn)在是中國(guó)發(fā)布了開(kāi)源AI,而美國(guó)的公司都想使用它或復(fù)刻它,因?yàn)樗男阅軐?shí)在太強(qiáng)了。”
開(kāi)源曾是美國(guó)高科技領(lǐng)域里最引以為傲的“殺手锏”,早年的互聯(lián)網(wǎng)協(xié)議、操作系統(tǒng)、數(shù)據(jù)庫(kù)等關(guān)鍵技術(shù),正是在廣泛開(kāi)放的環(huán)境下得以快速迭代,助力美國(guó)牢牢把握信息革命的制高點(diǎn)。然而,近幾年由于對(duì)知識(shí)產(chǎn)權(quán)與商業(yè)收益的高度關(guān)注,再加上對(duì)國(guó)家安全和經(jīng)濟(jì)制裁層面的考量,一些科技巨頭選擇更加封閉的研發(fā)模式,縮減了行業(yè)合作與創(chuàng)新的空間。
Rampell并不認(rèn)為DeepSeek是“新的斯普特尼克時(shí)刻”,而是“給美國(guó)人民的禮物”:它讓“驕傲”的美國(guó)不得不正視全球AI競(jìng)爭(zhēng)的現(xiàn)狀,加速在技術(shù)、人才和資金上的投入。
在這樣的大背景下,越來(lái)越多的科技人呼吁,美國(guó)的AI政策必須做出深層調(diào)整。繼續(xù)靠封鎖和管控來(lái)保持優(yōu)勢(shì),只會(huì)失去推動(dòng)全行業(yè)整體躍升的機(jī)會(huì)。正如Meta首席人工智能科學(xué)家 Yann LeCun 在LinkedIn上所言:“對(duì)于那些看到DeepSeek表現(xiàn)、認(rèn)為這是中國(guó)在人工智能領(lǐng)域超越美國(guó)的人來(lái)說(shuō),你們理解錯(cuò)了。正確的解讀是開(kāi)源模型正在超越專有模型。”
隨著AI競(jìng)爭(zhēng)逐漸從單純追求更大規(guī)模、更多參數(shù)和更強(qiáng)算力,轉(zhuǎn)向注重應(yīng)用與生態(tài)的深度整合,誰(shuí)能讓大模型在不同行業(yè)場(chǎng)景中快速落地,并構(gòu)建強(qiáng)大的協(xié)同網(wǎng)絡(luò),誰(shuí)就能在這場(chǎng)競(jìng)賽中率先勝出。
英偉達(dá)CEO黃仁勛就曾強(qiáng)調(diào),模型規(guī)模本身并不代表市場(chǎng)價(jià)值,真正能讓技術(shù)落地的,取決于能否與現(xiàn)實(shí)需求無(wú)縫對(duì)接;斯坦福大學(xué)教授吳恩達(dá)(Andrew Ng)也在演講中反復(fù)提到:解決實(shí)際問(wèn)題、為用戶創(chuàng)造價(jià)值,才是所有大模型發(fā)展的根本目標(biāo)。從醫(yī)療、金融到零售,每個(gè)行業(yè)都有不同的業(yè)務(wù)痛點(diǎn)和法規(guī)要求,促使研發(fā)團(tuán)隊(duì)必須進(jìn)行針對(duì)性的模型裁剪與定制。
在這種趨勢(shì)下,像DeepSeek這樣依托開(kāi)放、彈性生態(tài)系統(tǒng)的團(tuán)隊(duì),不僅能為行業(yè)提供更低門檻的成長(zhǎng)路線,還能不斷吸納開(kāi)發(fā)者與合作伙伴,讓AI技術(shù)在更多應(yīng)用場(chǎng)景釋放潛力,保持可持續(xù)發(fā)展。
OpenAI CEO Sam Altman也開(kāi)始反思他的策略。在o3-mini發(fā)布會(huì)后,這位硅谷天才創(chuàng)業(yè)者與幾位高管在Reddit上回答網(wǎng)友提問(wèn),在問(wèn)及是否會(huì)公開(kāi)部分大模型權(quán)重時(shí),Altman坦言:“我個(gè)人認(rèn)為,我們?cè)陂_(kāi)源策略上可能走錯(cuò)了方向,需要探索一種全新的開(kāi)放模式。不過(guò),并非所有OpenAI成員都認(rèn)同這一觀點(diǎn),而且目前這也并非我們的最高優(yōu)先級(jí)。”
或許DeepSeek不僅是開(kāi)源大模型的一次重大勝利,更是一份“送給世界的禮物”,將為整個(gè)行業(yè)樹(shù)立了全新的標(biāo)桿。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.