網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

“東方神秘力量”DeepSeek新年沖擊波，英偉達(dá)也頂不住了？

2025-01-28 01:51:51　來源: 穿透

北京舉報(bào)

分享至

“AI洞洞幺”作者|馮慶艷
“DeepSeek暴擊美股”“ChatGPT回應(yīng)被DeepSeek超越”“ DeepSeek創(chuàng)始人來自廣東湛江”……
2025新年前夕，滿屏都是DeepSeek，而2023新年前后，刷屏的主角是ChatGPT。如今回想起來，似乎有種冥冥之中的定數(shù)。ChatGPT開啟了生成式人工智能時(shí)代，而DeepSeek則成為時(shí)代迷霧中，再次開啟“潘多拉魔盒”的主角。
DeepSeek帶來的暴擊無數(shù)，最新的暴擊直指美科技股。

看看美科技股的最新股價(jià)吧！北京時(shí)間1月27日晚間，英偉達(dá)美股盤前一度大跌超12%，臺(tái)積電跌超10%，阿斯麥跌超8%。它們都是美資本市場(chǎng)的當(dāng)紅炸子雞，可卻在走出多數(shù)暴漲曲線之后的今天，出現(xiàn)暴跌。
類似于ChatGPT橫空出世之時(shí)，其在國內(nèi)外獲取的盛贊，此次刷屏的DeepSeek則獲得海內(nèi)外的花式贊美，以及用戶瘋狂下載。
DeepSeek被海外稱之為“東方神秘力量”“本年度開源大語言模型領(lǐng)域的最大黑馬”。

英偉達(dá)等一眾美科技股暴跌同天，DeepSeek應(yīng)用躍居蘋果美國地區(qū)應(yīng)用商店免費(fèi)APP下載排行榜第一位，單就美區(qū)下載榜，其已超越ChatGPT。同天的蘋果中國區(qū)應(yīng)用商店免費(fèi)榜之上，DeepSeek同樣躍居第一位。
看看引發(fā)硅谷震動(dòng)的DeepSeek，到底有何能量吧！
如今的生成式人工智能領(lǐng)域，正處于卷算力與商業(yè)化悖論之中。這種看不到頭的AI軍備競(jìng)賽，讓人感到絕望與迷茫。似乎只有AI巨頭們才玩得起這個(gè)重投入、高成本、低收益的高風(fēng)險(xiǎn)游戲。

過去的一年，國外比如OpenAI、Meta、Google、xAI等巨頭，它們都在瘋狂囤積高算力AI芯片，以打造萬卡（GPU）集群作為目標(biāo)。國內(nèi)比如字節(jié)跳動(dòng)、騰訊、阿里、百度等巨頭，也紛紛跟進(jìn)。
在AI商業(yè)化迷霧時(shí)期，在中小創(chuàng)業(yè)公司紛紛無望退卻之際，DeepSeek卻橫空出世。
DeepSeek迅速火遍全球背后的邏輯，被Scale AI創(chuàng)始人亞歷山大·王（Alexander Wang）發(fā)文一語點(diǎn)出，“DeepSeek-V3展示給外界苦澀的教訓(xùn)是：就在美國休息時(shí)，中國在工作，并以更便宜、更快、更強(qiáng)的產(chǎn)品迎頭趕上。”

“更便宜、更快、更強(qiáng)”這三個(gè)常規(guī)邏輯相悖逆的詞語，恰恰在DeepSeek身上集齊了。
2023年7月，幻方量化宣布成立大模型公司DeepSeek，至今才一年半左右。
2024年5月，DeepSeek發(fā)布混合專家語言模型DeepSeek-V2，當(dāng)時(shí)該模型引發(fā)國內(nèi)大廠紛紛跟進(jìn)大降價(jià)。但真正讓海外稱之為“東方神秘力量”的是，其同年12月發(fā)布的DeepSeek-V3。
DeepSeek-V3的問世，不僅多項(xiàng)評(píng)測(cè)成績碾壓了Qwen2.5-72B和Llama-3.1-405B等同類開源模型。更令人震驚的是，其與OpenAI的閉源模型GPT-4o相比也毫不遜色。有些性能比如數(shù)學(xué)、代碼能力和中文知識(shí)問答上，甚至超越了后者。要知道，GPT-4o是OpenAI于2024年5月發(fā)布的旗艦大模型，甚至被稱之為世界上最強(qiáng)大的模型。

單單性能可以追平世界頂尖閉源模型，DeepSeek并不足以火遍全球，也不足以引發(fā)海外AI界的恐慌。因?yàn)橐酝壿嬍牵焊咚懔缀鯖Q定了大模型的先進(jìn)與否，而高算力則是高資金投入的產(chǎn)物，再往前推則可窺探到，美國之所以限制我國購買高算力AI芯片的原因。然而，這套邏輯被DeepSeek擊碎了。這才是海外媒體花式盛贊、硅谷同行紛紛震驚的根本原因。
DeepSeek不愧為AI界的性價(jià)比之王。DeepSeek-V3的全部訓(xùn)練成本總計(jì)僅為557.6萬美元，不到GPT-4o訓(xùn)練成本的二十分之一。
近期DeepSeek發(fā)布了DeepSeek-R1大模型，其稱，在數(shù)學(xué)、代碼、自然語言推理等方面，性能可與OpenAI o1正式版相媲美。
1月24日，DeepSeek-R1基準(zhǔn)測(cè)試，在國外大模型排名Arena上升至全類別大模型第三，單以風(fēng)格控制類模型（StyleCtrl）分類排名，其與OpenAI o1并列第一。競(jìng)技場(chǎng)得分上，DeepSeek-R1甚至略超OpenAI o1。

同天，Meta AI首席科學(xué)家Yann LeCun對(duì)此稱，人們驚呼中國AI正在趕超美國，這種解讀有誤。更準(zhǔn)確的結(jié)論是：開源模型正在超越閉源系統(tǒng)。
“DeepSeek的成功得益于開放生態(tài)，其創(chuàng)新基于前人成果的持續(xù)迭代。”Yann LeCun說。

DeepSeek-R1不僅是開源模型，還可免費(fèi)供全球用戶無限調(diào)用。這可以吸引全球技術(shù)人才加入進(jìn)來，對(duì)模型進(jìn)行共創(chuàng)和改進(jìn)。
雖然DeepSeek正式宣布進(jìn)軍生成式人工智能，僅一年半左右，但其涉足AI并用其進(jìn)行應(yīng)用落地，已經(jīng)很長時(shí)間。
幻方量化（杭州幻方科技有限公司）是2015年由梁文峰創(chuàng)立。第二年，公司就推出第一個(gè)AI模型，并且落地應(yīng)用到投資交易上。第三年，公司宣稱實(shí)現(xiàn)投資策略全面AI化。到2021年，公司資產(chǎn)管理規(guī)模突破千億大關(guān)。
2023年7月，DeepSeek（深度求索）成立，兩個(gè)月前有消息稱，國內(nèi)擁有超一萬枚GPU的企業(yè)不超過5家，而DeepSeek在列。
DeepSeek創(chuàng)始人梁文峰，1985年出生于廣東湛江市，2002年，他考入浙江大學(xué)電子信息工程專業(yè)，相繼獲得本科、碩士學(xué)位。

DeepSeek近日刷屏的同時(shí)，梁文鋒將回湛江老家過年的消息，也被強(qiáng)烈關(guān)注。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.