(本文系紫金財經(jīng)原創(chuàng)稿件,轉(zhuǎn)載請注明來源)
2025年伊始,橫空出世的DeepSeek上演了一場全球技術(shù)風(fēng)暴,搶走了幾乎所有AI大模型的風(fēng)頭。
在業(yè)內(nèi),DeepSeek的開源路線備受矚目,甚至讓OpenAI CEO山姆·奧爾特曼自省OpenAI站在了“歷史的錯誤一邊”。而DeepSeek低成本高性能的表現(xiàn),更是打破了行業(yè)遵循“大力出奇跡”的原則,讓大家看到了大模型的更多可能性。
不僅業(yè)內(nèi)將DeepSeek視為顛覆者,DeepSeek更是破圈融入更多領(lǐng)域,不少AI行業(yè)外的用戶也用起了DeepSeek,算命、聊天、工作,甚至還有人拿DeepSeek賺錢......上線僅僅20天,DeepSeek就突破了2000萬日活大關(guān),迅速超越ChatGPT成為全球增速最快的AI應(yīng)用。
這家起源于中國杭州的科技公司,讓人興奮不已。過去“關(guān)于中國人工智能距離美國差距多遠(yuǎn)”的這個問題,有樂觀者認(rèn)為只有幾個月,也有悲觀的聲音認(rèn)為還有十年,兩方的認(rèn)知差距甚遠(yuǎn),但DeepSeek的出現(xiàn),似乎讓人們看到了更清晰的光,原來中國的人工智能一直在亦步亦趨,擇機(jī)超越。
DeepSeek的火熱讓國內(nèi)用戶更加自信,悲觀者們也再次樂觀起來。這是條攪動AI發(fā)展進(jìn)程的鯰魚,攪得全球人工智能賽道的選手們都不得不重新評估自身的技術(shù)水平及位置。DeepSeek技術(shù)水平如何,DeepSeek的成功,會是中國人工智能趕超美國的加速點嗎?
顛覆全球AI行業(yè)格局
將時間回溯至兩年前,2023年初,同樣是春節(jié),來自大洋彼岸的ChatGPT爆火,一場AI大模型浪潮轟轟烈烈地拉開了序幕。
彼時,ChatGPT無疑是這場AI浪潮當(dāng)之無愧的引領(lǐng)者,而被譽(yù)為“ChatGPT之父”的Open AI CEO山姆·奧爾特曼,被《時代》周刊評為2023年度 CEO,也被媒體冠上“硅谷的造王者”之名。
Open AI的成功讓行業(yè)一直跟隨其發(fā)展路徑,遵循“Scaling Law”原則,即認(rèn)為更多的數(shù)據(jù)和更強(qiáng)的算力能夠訓(xùn)練出更優(yōu)秀的模型,堅信“大力出奇跡”。
此后,為了踏上這艘時代的AI大船,不少科技巨頭們紛紛在數(shù)據(jù)和算力上投入巨資,試圖買到通往AI世界的“船票”。而所有的努力并沒有讓他們快速勝出,反而成就了顯卡霸主英偉達(dá)的萬億市值。
但DeepSeek的出現(xiàn),打破了“大力出奇跡”的大模型原則。
根據(jù)公開資料顯示,DeepSeek 的R1模型訓(xùn)練成本僅為560萬美元,遠(yuǎn)遠(yuǎn)低于科技巨頭們此前動輒數(shù)億、數(shù)十億美元的人工智能技術(shù)投入費(fèi)用。
斯坦福大學(xué)計算機(jī)科學(xué)系和電子工程系副教授吳恩達(dá)也公開表示,OpenAI - o1模型每百萬輸出token的成本為60美元,而Deepseek-R1只需2.19 美元,成本差距將近30倍。
成本的大幅下降源于DeepSeek在算法、硬件利用率方面都做了革新。傳統(tǒng)大模型遵循“預(yù)訓(xùn)練-監(jiān)督微調(diào)(SFT)-強(qiáng)化學(xué)習(xí)(RL)”的三段式訓(xùn)練流程,其中SFT階段需標(biāo)注海量數(shù)據(jù),成本占比超40%。DeepSeek-R1跳過了SFT階段,使用“純強(qiáng)化學(xué)習(xí)+冷啟動”模式,直接用RL訓(xùn)練實現(xiàn)推理能力。
簡而言之,SFT是人類生成數(shù)據(jù),機(jī)器學(xué)習(xí);而RL是機(jī)器生成數(shù)據(jù),機(jī)器學(xué)習(xí)。
除了算法上的優(yōu)化,DeepSeek將硬件利用率也推向極致。單GPU算力利用率行業(yè)平均是15%,而DeepSeek可以達(dá)到23%,不管是DeepSeek的FP8混合精度訓(xùn)練,還是動態(tài)序列長度調(diào)整,DualPipe并行架構(gòu)優(yōu)化,都在極大程度上榨干硬件潛能。
因此DeepSeek 采用性能更低、價格更便宜的次高端芯片就可以訓(xùn)練出性能不輸ChatGPT的大模型。
低成本之外,DeepSeek也一反行業(yè)閉源路線,采取開源路線。在DeepSeek 創(chuàng)始人梁文鋒看來,先有一個強(qiáng)大的、廣泛的技術(shù)生態(tài)更重要。開源可以吸引更多大廠和技術(shù)人才涌入,共建共創(chuàng)一個更強(qiáng)大的人工智能大模型生態(tài)。
“低成本+開源路線”的組合拳,大大降低了AI應(yīng)用的門檻,打破了傳統(tǒng)AI巨頭的壟斷地位,讓AI大模型的未來不再屬于“算力霸權(quán)”,更多的中小企業(yè)也可以入局訓(xùn)練自己的AI,從而提供了更多的發(fā)展可能性。
可以說,Deepseek的出現(xiàn)幾乎重塑了全球AI市場的競爭格局,催生了一個更開放、更普惠的AI生態(tài)。
加速中國人工智能趕超
不到一個月時間,大廠們紛紛接入DeepSeek。在國內(nèi)市場,華為云、騰訊云、阿里云等頭部云服務(wù)廠商率先行動。
華為云攜手硅基流動,基于昇騰云服務(wù)推出了 DeepSeek - R1/V3 推理服務(wù);騰訊云則利用其高性能應(yīng)用服務(wù)HAI和TI平臺,支持DeepSeek-R1的快速一鍵部署,整個流程僅需3分鐘即可完成,并為用戶提供了限時免費(fèi)體驗的機(jī)會;阿里云在PAI Model Gallery中也加入了對DeepSeek-V3和R1模型的一鍵部署支持,極大地簡化了從模型訓(xùn)練到推理的全過程,同時采用按需計費(fèi)模式,進(jìn)一步降低了企業(yè)使用AI技術(shù)的成本門檻。
除此之外,百度智能云、京東云、火山引擎等平臺也也相繼跟進(jìn),積極擁抱DeepSeek。
不僅國內(nèi)大廠迅速接入DeepSeek,海外科技大廠亦是如此。
微軟Azure平臺已將DeepSeek-R1整合至其Azure AI Foundry服務(wù)中,為企業(yè)級用戶提供專業(yè)的AI解決方案;亞馬遜則在Amazon Bedrock和SageMaker AI平臺上實現(xiàn)了對DeepSeek-R1模型的部署支持,并借助AWS Trainium技術(shù)為用戶提供更具成本效益的部署方案;英偉達(dá)通過NVIDIA NIM云原生微服務(wù)技術(shù)上線了DeepSeek-R1模型,
海內(nèi)外的科技大廠們在如此短時間內(nèi)集體接入DeepSeek,這是大模型誕生至今的獨(dú)一份,是大廠們反復(fù)權(quán)衡后的選擇。行業(yè)內(nèi)能夠迅速達(dá)成一致,認(rèn)可DeepSeek,充分說明了其價值。
不過,DeepSeek收獲了多少贊譽(yù),同樣也要承受多少質(zhì)疑。以破局之姿出現(xiàn),DeepSeek的影響力超出想象,這讓很多國外的大佬們慌了。
馬斯克第一時間質(zhì)疑:“中國公司一定從美國獲得了更高端芯片”。特朗普公開評論DeepSeek,稱它在“給美國產(chǎn)業(yè)敲響警鐘”,并呼吁“集中精力贏得競爭”。而在美國參議院外交關(guān)系委員會聽證會上,智庫代表公然提議“偷走中國最好的工程師”,試圖引發(fā)人才戰(zhàn)。
這些質(zhì)疑聲,無疑是另一個側(cè)面證明——DeepSeek的出現(xiàn)讓美國狠狠地焦慮了。
過去,關(guān)于中國人工智能和美國的差距,大家眾說紛紜,有樂觀的觀點認(rèn)為差距只有幾個月,也有悲觀者認(rèn)為有10年差距。兩方的想法差距甚遠(yuǎn),但DeepSeek的出現(xiàn),似乎讓人們看到更清晰的光。
一方面,DeepSeek證明了中國人工智能在成本上的顯著優(yōu)勢,依靠成本優(yōu)勢極有可能趕超美國。另一方面,DeepSeek通過開源路線正在構(gòu)建自己的AI生態(tài),更多開發(fā)者的加入,意味著技術(shù)的應(yīng)用和迭代也將大大提速。
DeepSeek的破局,讓中國AI企業(yè)首次站上技術(shù)制高點,這或許是中國人工智能趕超美國的重要加速點。
AGI之路并非坦途,DeepSeek也有難題
盡管AGI被視為技術(shù)革命的終極目標(biāo),但其發(fā)展路徑充滿技術(shù)、倫理與商業(yè)化難題。DeepSeek雖身披光環(huán),但在推動AGI落地的過程中同樣面臨技術(shù)與現(xiàn)實的重重挑戰(zhàn),甚至它也有自己的“陰影”。
首當(dāng)其沖的仍然是技術(shù)方面,模型能力與泛化性的難題。目前DeepSeek在文本生成這一單一任務(wù)中表現(xiàn)突出,但要想真正實現(xiàn)AGI,必須擁有跨領(lǐng)域推理和自主決策能力,這一步絕非易事。DeepSeek需要攻克多模態(tài)數(shù)據(jù)融合、模型泛化性等一系列技術(shù)瓶頸,確保AI系統(tǒng)能在不同場景下均能保持高精度與穩(wěn)定性。
不可否認(rèn),科技巨頭們生態(tài)系統(tǒng)更強(qiáng)大,數(shù)據(jù)積累、算力基礎(chǔ)建設(shè)更多,也有更大的財力支持,在長遠(yuǎn)的AI競爭之下,DeepSeek還是得找到自己的“小米加步槍”式創(chuàng)新路徑,以巧取勝。
其次,隨著DeepSeek擴(kuò)展到更廣泛的企業(yè)級應(yīng)用,也可能帶來新的挑戰(zhàn)。服務(wù)于大型客戶、處理復(fù)雜實時數(shù)據(jù)的需求激增,對計算資源的消耗呈現(xiàn)出幾何級增長態(tài)勢,這無疑會加大成本控制與效率優(yōu)化的難度。如何在保證服務(wù)質(zhì)量的同時,有效控制成本,成為DeepSeek亟需解決的現(xiàn)實問題。
事實上,近期隨著用戶規(guī)模的快速擴(kuò)張,服務(wù)器負(fù)載過重、響應(yīng)延遲等問題已經(jīng)暴露出DeepSeek在應(yīng)對大規(guī)模應(yīng)用時的短板,這要求DeepSeek必須在技術(shù)架構(gòu)與服務(wù)模式上進(jìn)行深度革新。
另外,DeepSeek也面臨著激烈的競爭和開源壓力。OpenAI、谷歌在AGI領(lǐng)域形成技術(shù)壁壘不可忽視,尤其是OpenAI通過多模態(tài)模型Sora和智能體AIAgent已經(jīng)構(gòu)建起應(yīng)用生態(tài),涵蓋智能寫作、圖像生成、智能交互等多個領(lǐng)域,用戶粘性極高。如果DeepSeek聚焦單一領(lǐng)域,很可能在這場激烈的競爭中逐漸喪失優(yōu)勢。
并且開源社區(qū)的壓力會迫使DeepSeek權(quán)衡技術(shù)保密與開放協(xié)作,如何在保持競爭力的同時融入全球AGI生態(tài),也是DeepSeek未來的戰(zhàn)略難題之一。
結(jié)語
DeepSeek的橫空出世,無疑為全球AI領(lǐng)域注入了一股強(qiáng)大的新生力量。它以低成本高性能的創(chuàng)新模式和開源路線,打破了傳統(tǒng) AI 巨頭的壟斷格局,重塑了全球 AI 市場的競爭生態(tài),也為中國人工智能趕超美國帶來了新的希望與可能。
然而,AGI之路并非一蹴而就,DeepSeek在追求技術(shù)巔峰的同時,也面臨著諸多挑戰(zhàn)與難題。從模型能力與泛化性的技術(shù)瓶頸,到成本控制與效率優(yōu)化的現(xiàn)實困境,再到競爭壓力與開源社區(qū)的權(quán)衡考量,每一步都充滿了未知與變數(shù)。
當(dāng)然這些挑戰(zhàn)很多都是行業(yè)需要共同面對的命題,DeepSeek 此前的成功已經(jīng)證明了其創(chuàng)新能力和無限潛力,如何在人工智能賽道上走得更遠(yuǎn),需要DeepSeek的締造者們更為成熟的考慮。
不管怎么說,DeepSeek帶來的不僅是技術(shù)上的追趕,還有新的信心。信心之下,也許正在孕育孵化更多的可能。
【紫金財經(jīng)】由數(shù)位資深媒體人創(chuàng)辦,長期關(guān)注新經(jīng)濟(jì)及TMT行業(yè)!文章發(fā)布于紫金財經(jīng)網(wǎng)、手機(jī)網(wǎng)及相關(guān)小程序,并在微信、微博、專欄以及百家號、頭條號、一點號、搜狐等40多家主流媒體平臺同步更新。
經(jīng)觀 · 第十四屆內(nèi)容創(chuàng)作者榮譽(yù)會員
虎嗅F&M創(chuàng)新節(jié)作者團(tuán)成員
經(jīng)觀 · 第九屆(2023)內(nèi)容創(chuàng)作者榮譽(yù)會員
2021年度百準(zhǔn)指數(shù)最具成長力創(chuàng)作者
2020年最具商業(yè)價值新媒體
2020年度天極網(wǎng)最佳出品人
2019年新浪財經(jīng)頭條年度榮譽(yù)作者
經(jīng)濟(jì)觀察報VTime · 新橙獎
2019天極網(wǎng)年度影響力獎
美通社年度優(yōu)質(zhì)合作媒體獎
法律顧問:北京也迪律師事務(wù)所
知產(chǎn)保護(hù):北京儲正智庫科技有限公司
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.