“AI洞洞幺”作者|馮慶艷
“DeepSeek暴擊美股”“ChatGPT回應(yīng)被DeepSeek超越”“ DeepSeek創(chuàng)始人來自廣東湛江”……
2025新年前夕,滿屏都是DeepSeek,而2023新年前后,刷屏的主角是ChatGPT。如今回想起來,似乎有種冥冥之中的定數(shù)。ChatGPT開啟了生成式人工智能時(shí)代,而DeepSeek則成為時(shí)代迷霧中,再次開啟“潘多拉魔盒”的主角。
DeepSeek帶來的暴擊無數(shù),最新的暴擊直指美科技股。
看看美科技股的最新股價(jià)吧!北京時(shí)間1月27日晚間,英偉達(dá)美股盤前一度大跌超12%,臺(tái)積電跌超10%,阿斯麥跌超8%。它們都是美資本市場(chǎng)的當(dāng)紅炸子雞,可卻在走出多數(shù)暴漲曲線之后的今天,出現(xiàn)暴跌。
類似于ChatGPT橫空出世之時(shí),其在國內(nèi)外獲取的盛贊,此次刷屏的DeepSeek則獲得海內(nèi)外的花式贊美,以及用戶瘋狂下載。
DeepSeek被海外稱之為“東方神秘力量”“本年度開源大語言模型領(lǐng)域的最大黑馬”。
英偉達(dá)等一眾美科技股暴跌同天,DeepSeek應(yīng)用躍居蘋果美國地區(qū)應(yīng)用商店免費(fèi)APP下載排行榜第一位,單就美區(qū)下載榜,其已超越ChatGPT。同天的蘋果中國區(qū)應(yīng)用商店免費(fèi)榜之上,DeepSeek同樣躍居第一位。
看看引發(fā)硅谷震動(dòng)的DeepSeek,到底有何能量吧!
如今的生成式人工智能領(lǐng)域,正處于卷算力與商業(yè)化悖論之中。這種看不到頭的AI軍備競(jìng)賽,讓人感到絕望與迷茫。似乎只有AI巨頭們才玩得起這個(gè)重投入、高成本、低收益的高風(fēng)險(xiǎn)游戲。
過去的一年,國外比如OpenAI、Meta、Google、xAI等巨頭,它們都在瘋狂囤積高算力AI芯片,以打造萬卡(GPU)集群作為目標(biāo)。國內(nèi)比如字節(jié)跳動(dòng)、騰訊、阿里、百度等巨頭,也紛紛跟進(jìn)。
在AI商業(yè)化迷霧時(shí)期,在中小創(chuàng)業(yè)公司紛紛無望退卻之際,DeepSeek卻橫空出世。
DeepSeek迅速火遍全球背后的邏輯,被Scale AI創(chuàng)始人亞歷山大·王(Alexander Wang)發(fā)文一語點(diǎn)出,“DeepSeek-V3展示給外界苦澀的教訓(xùn)是:就在美國休息時(shí),中國在工作,并以更便宜、更快、更強(qiáng)的產(chǎn)品迎頭趕上。”
“更便宜、更快、更強(qiáng)”這三個(gè)常規(guī)邏輯相悖逆的詞語,恰恰在DeepSeek身上集齊了。
2023年7月,幻方量化宣布成立大模型公司DeepSeek,至今才一年半左右。
2024年5月,DeepSeek發(fā)布混合專家語言模型DeepSeek-V2,當(dāng)時(shí)該模型引發(fā)國內(nèi)大廠紛紛跟進(jìn)大降價(jià)。但真正讓海外稱之為“東方神秘力量”的是,其同年12月發(fā)布的DeepSeek-V3。
DeepSeek-V3的問世,不僅多項(xiàng)評(píng)測(cè)成績碾壓了Qwen2.5-72B和Llama-3.1-405B等同類開源模型。更令人震驚的是,其與OpenAI的閉源模型GPT-4o相比也毫不遜色。有些性能比如數(shù)學(xué)、代碼能力和中文知識(shí)問答上,甚至超越了后者。要知道,GPT-4o是OpenAI于2024年5月發(fā)布的旗艦大模型,甚至被稱之為世界上最強(qiáng)大的模型。
單單性能可以追平世界頂尖閉源模型,DeepSeek并不足以火遍全球,也不足以引發(fā)海外AI界的恐慌。因?yàn)橐酝壿嬍牵焊咚懔缀鯖Q定了大模型的先進(jìn)與否,而高算力則是高資金投入的產(chǎn)物,再往前推則可窺探到,美國之所以限制我國購買高算力AI芯片的原因。然而,這套邏輯被DeepSeek擊碎了。這才是海外媒體花式盛贊、硅谷同行紛紛震驚的根本原因。
DeepSeek不愧為AI界的性價(jià)比之王。DeepSeek-V3的全部訓(xùn)練成本總計(jì)僅為557.6萬美元,不到GPT-4o訓(xùn)練成本的二十分之一。
近期DeepSeek發(fā)布了DeepSeek-R1大模型,其稱,在數(shù)學(xué)、代碼、自然語言推理等方面,性能可與OpenAI o1正式版相媲美。
1月24日,DeepSeek-R1基準(zhǔn)測(cè)試,在國外大模型排名Arena上升至全類別大模型第三,單以風(fēng)格控制類模型(StyleCtrl)分類排名,其與OpenAI o1并列第一。競(jìng)技場(chǎng)得分上,DeepSeek-R1甚至略超OpenAI o1。
同天,Meta AI首席科學(xué)家Yann LeCun對(duì)此稱,人們驚呼中國AI正在趕超美國,這種解讀有誤。更準(zhǔn)確的結(jié)論是:開源模型正在超越閉源系統(tǒng)。
“DeepSeek的成功得益于開放生態(tài),其創(chuàng)新基于前人成果的持續(xù)迭代。”Yann LeCun說。
DeepSeek-R1不僅是開源模型,還可免費(fèi)供全球用戶無限調(diào)用。這可以吸引全球技術(shù)人才加入進(jìn)來,對(duì)模型進(jìn)行共創(chuàng)和改進(jìn)。
雖然DeepSeek正式宣布進(jìn)軍生成式人工智能,僅一年半左右,但其涉足AI并用其進(jìn)行應(yīng)用落地,已經(jīng)很長時(shí)間。
幻方量化(杭州幻方科技有限公司)是2015年由梁文峰創(chuàng)立。第二年,公司就推出第一個(gè)AI模型,并且落地應(yīng)用到投資交易上。第三年,公司宣稱實(shí)現(xiàn)投資策略全面AI化。到2021年,公司資產(chǎn)管理規(guī)模突破千億大關(guān)。
2023年7月,DeepSeek(深度求索)成立,兩個(gè)月前有消息稱,國內(nèi)擁有超一萬枚GPU的企業(yè)不超過5家,而DeepSeek在列。
DeepSeek創(chuàng)始人梁文峰,1985年出生于廣東湛江市,2002年,他考入浙江大學(xué)電子信息工程專業(yè),相繼獲得本科、碩士學(xué)位。
DeepSeek近日刷屏的同時(shí),梁文鋒將回湛江老家過年的消息,也被強(qiáng)烈關(guān)注。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.