【潮汐商業評論原創】
蛇年前夕,DeepSeek猶如一顆“原子彈”般震撼了全球人工智能領域。
這款主打“極致性價比”的大語言模型,不僅在性能上比肩OpenAI的頂尖模型o1,其成本更是僅為GPT-4o的十分之一,API調用成本更是低至OpenAI的三十分之一。
這證明了AI企業依靠燒錢卷“投流”“獲客”的路徑不可行,更凸顯了長期主義地原始創新和低成本研發的重要性。
這也打破了技術閉源的OpenAI和英偉達的市場壟斷,更引發了全球科技巨頭的股價波動,英偉達市值一夜之間蒸發4.3萬億元。
目前,DeepSeek累計用戶已經超過了1.25億。它像鯰魚一樣,攪動全球人工智能領域,讓國內AI基建重拾信心,被稱為“國運”級別的存在。
01 新路徑彎道搶跑
AI大模型是一個重資產行業,2024年Scaling Law仍未失效,隨著模型不斷變大,訓練新模型需要更多的數據、更多的算力。
這意味著需要充足的資金支撐。一位大廠高層給出判斷,做大模型,“一年低消也要20億-30億美元”。
DeepSeek的出現,證明了AI企業依靠燒錢卷“投流”“獲客”的路徑是不可行的,以往中國AI大模型“卷”算力、“卷”價格、“卷”獲客、“卷”變現能力,如今人們更認可長期主義的原始創新,企業應當思考架構創新和低成本研發,而不是一味燒錢。
在過去的2024年,月之暗面的Kimi和字節跳動的豆包輪番成為大眾追捧的AI應用。它們背后是重金推廣和瘋狂卷算力。
以抖音為例,2024年字節跳動才開始在大模型上發力,憑借此前的火山云基礎設施和人才團隊積累,以及大規模資金投入和四處挖人。在互聯網四巨頭里,字節跳動在AI領域的投入上高達800億人民幣,遠超騰訊、阿里、百度。
字節跳動旗下火山引擎支持多芯、多云架構,擁有超大規模算力,支持萬卡集群組網、萬億參數MoE大模型;提供超高性能網絡,支持3.2TbpsRDMA網絡,全球網絡POP覆蓋廣,時延優化最高達75%,在算力資源上優勢也很明顯。
DeepSeek的出現推動了AI技術更加普及和高效,其崛起將推動小型化模型即邊緣AI的推廣,使云端和邊緣處理的混合AI模型被認為是AI未來的發展方向。
02 與友商們都“交個朋友”
DeepSeek解決了國產AI領域的困局,應用的落地,激活了整個行業。國產芯片、軟硬件公司、云廠商紛紛接入DeepSeek“交個朋友”。
大模型企業們對于算力的需求不斷攀升,對于云服務的需求提升明顯。騰訊云、阿里云、華為云、百度智能云、火山引擎等數十家云計算服務龍頭,拆掉了圍墻,都推出限時優惠、包年包月等選項。
在芯片領域,華為昇騰、沐曦科技、摩爾線程、壁仞科技等10多家國產AI芯片企業,都表示適配了DeepSeek原版或“蒸餾”后的小尺寸版本。
同時,國產手機品牌和新能源汽車品牌也紛紛接入DeepSeek。
另外,DeepSeek也刺激了阿里云通義團隊發布旗艦模型“Qwen2.5-Max”,成為第二家可以比肩美國OpenAI公司o1系列的國產大語言模型,讓行業內外為之振奮。
DeepSeek的效應還在持續,將吸引以華為為代表(還包括寒武紀、海光、摩爾線程等)的國產算力廠商會投入更大資源支持國產大模型的適配,政府資源的支持力度也會加大,這有利于國內人工智能的產業鏈更好發展。
同時也會加劇競爭,頭部優勢廠商變強,一批原先瞄準通用大模型為目標的創業公司和互聯網公司將因為資源無法支撐而退出角逐,轉而做特定方向的人工智能應用落地,這有助于我們國內人工智能產業資源的更合理分布。
DeepSeek驗證的長思維鏈模式,有助于整個產業鏈降低在數據推理路徑標注的投入,未來大模型在需要復雜推理的應用落地過程會進一步加快。
從DeepSeek的推出到應用端鋪開布局,再到投資者重新理解中國科技企業的技術潛力、對科技股價值重估,這種轉換讓人炫目。DeepSeek“國運”系身一點都不夸張。
03 國產大模型有了新奔頭
DeepSeek的爆火出圈,也讓美國和歐洲看到,中國在大模型產業已經形成一批頗具實力和影響力的公司,其中有字節跳動、阿里、騰訊等大廠身影,也有月之暗面、智譜、MiniMax等初創企業。
客觀來講,國內無論是DeepSeek V3/R1、訊飛星火X1,還是字節的豆包、阿里的通義千問等國產大模型,目前和OpenAI的o3相比在現實物理規律的理解和運用、超復雜科學問題的求解、多模態視頻流輸入理解等高難度任務上還是有差距。
通用人工智能也不僅局限于此,在多模態大模型、具身智能、世界模型、環境模擬器等多個方面,中國的人工智能都有可挖掘的巨大空間,尤其是在高制程人工智能芯片的量產和演進能力方面。
當然,中國人工智能還是會面臨一些挑戰。
DeepSeek基于以英偉達算力取得的如此大的成就,勢必會引發海外針對芯片供應的封鎖手段不斷升級,給國產大模型的發展帶來更多限制。
尤其是美國大概率會對我國的英偉達算力獲取和國產算力海外投片采取更嚴苛的限制措施,H800、A100、H20等卡將會被全面禁止,給DeepSeek帶來的限制將日益增多。
所以實現國產算力的自主可控將更為關鍵。幸運的是,國產所有大模型中已經有一家公司憑借國產算力做出了成績。
訊飛星火大模型的訓練和推理都在國產算力上進行的,并且僅用了1萬張910B國產算力卡??拼笥嶏w不僅用比友商少數倍的算力取得了大模型研發上的一些成果,而且還做了大量國產算力平臺上的無人區的適配和效率優化,可以說是真正把國產算力做到了極致效率,這比在英偉達上的實現更需要技術實力和勇氣,也更具有戰略意義。
如果訊飛星火能取得成功,將會像DeepSeek一樣,給予了我國同行們比以往更有信心和勇氣做底層的技術創新。
從這個角度上看,DeepSeek也只是為2025年中國人工智能拉開了大幕,真正的爆發正在迎面趕來。
潮汐編輯部的Jesse最近兩周已經習慣了在成稿后來一場“人機對話”,以期獲得些意外的觀點。這次當她把問題輸入,只見對話框旋轉半天后,DeepSeek彈出了一行字:“服務器繁忙,請稍后再試?!?/p>
DeepSeek以“白菜價”技術打破壟斷,用開源生態凝聚產業鏈,最終引爆了國內AI從技術到商業的全面升級。可這一切都來的太快了,烈火烹油,總要給Deepseek和整個AI行業一點時間適應。
正如DeepSeek創始人梁文鋒在采訪中所說,“以后硬核創新會越來越多。當這個社會讓硬核創新的人功成名就,群體性想法就會改變。我們只是還需要一堆事實和一個過程。”
你看,商業就是這樣。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.