網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

DeepSeek小心，帝國(guó)反擊戰(zhàn)到來了

2025-02-26 19:44:39　來源: 直面派

北京舉報(bào)

分享至

DeepSeek R1引發(fā)的一場(chǎng)推理模型大作戰(zhàn)還在繼續(xù)，且參戰(zhàn)名單正隨著時(shí)間推移逐步拉長(zhǎng)。

僅僅昨天一天時(shí)間之內(nèi)，這場(chǎng)戰(zhàn)局就又吸引來了4家明星大模型公司：先是阿里發(fā)布推理模型QwQ-Max-Preview預(yù)覽版，接著Anthropic宣布推出全球首個(gè)“混合推理”模型Claude 3.7 Sonnet，之后字節(jié)也被曝出豆包正在小范圍測(cè)試自研的深度思考型推理模型。

作為被各路對(duì)標(biāo)的DeepSeek，也有了新動(dòng)作。昨晚，路透社爆料稱，DeepSeek正在加速推出R2模型，該模型原計(jì)劃在5月初發(fā)布，但現(xiàn)在官方希望能盡早發(fā)布。

香港科技大學(xué)校董會(huì)主席、美國(guó)國(guó)家工程院外籍院士沈向洋在近期分享中指出，“對(duì)于大模型，之前的研究焦點(diǎn)是GPT模式，現(xiàn)在的焦點(diǎn)是Reasoner模式，這是一種新的學(xué)習(xí)范式?！?/p>

DeepSeek R1，無疑成了這場(chǎng)范式變革的重點(diǎn)參考對(duì)象。在此之前，騰訊也上線了自研的深度思考模型“混元T1”，百度文小言上線深度搜索功能，馬斯克的xAI也發(fā)布了帶有深度思考能力的Grok 3新模型。

就連OpenAI，都在DeepSeek壓力下，進(jìn)一步開放了自家推理模型o1和o3-mini的思維鏈。

DeepSeek R1這塊投向推理側(cè)的大模型技術(shù)迭代新石子，其漣漪效應(yīng)正逐漸擴(kuò)散至全行業(yè)。這一幕頗像2023年行業(yè)對(duì)ChatGPT的追趕。彼時(shí)，科技大廠如百度、阿里，爭(zhēng)先發(fā)布自家大模型；王慧文攜5000萬美元振臂一呼，正式開啟了一場(chǎng)席卷全行業(yè)的大模型創(chuàng)業(yè)熱潮，楊植麟、王小川、李開復(fù)等先后創(chuàng)辦起月之暗面、百川智能、零一萬物等明星大模型公司，爭(zhēng)分奪秒搶奪市場(chǎng)融資并對(duì)外發(fā)布產(chǎn)品。

不過，在ChatGPT時(shí)刻到來后就落后一步的字節(jié)，如今在追趕DeepSeek時(shí)刻上又有了慢人一步的跡象。在國(guó)內(nèi)其他科技大廠已經(jīng)相繼完成深度思考能力的亮相后，字節(jié)的自研推理大模型才剛剛進(jìn)入灰度測(cè)試階段。

DeepSeek R2新模型可能提早發(fā)布的消息，無疑又給字節(jié)上了上競(jìng)爭(zhēng)強(qiáng)度。但好消息是，那些搶在字節(jié)前面發(fā)布推理模型的同行們，還沒來得及松一口氣就同樣又遭遇心頭一緊。

如同馬斯克著急推出半成品Grok 3一樣，阿里新推理模型QwQ-Max-Preview，也只是一個(gè)預(yù)覽版，而非正式版模型。

在LiveCodeBench編程測(cè)試中，QwQ-Max-Preview也只是小幅超越OpenAI o1中檔推理模型，以及DeepSeek R1 Preview預(yù)覽版（注意，不是DeepSeek R1正式版）。阿里官方介紹，QwQ-Max正式版將在后續(xù)推出。

如同DeepSeek R1是在V3基礎(chǔ)模型上訓(xùn)練出來的一樣，QwQ-Max同樣基于阿里的旗艦版模型Qwen2.5-Max而來，后者是于1月29日發(fā)布的一款MoE稠密模型，在公開的基準(zhǔn)測(cè)試中，官方稱其性能超越DeepSeek V3。

不同于阿里QwQ-Max-Preview，同一天發(fā)布的Anthropic新模型Claude 3.7 Sonnet，則是個(gè)徹徹底底的完整體，官方直接放出了多項(xiàng)評(píng)測(cè)指標(biāo)對(duì)比。

在傳統(tǒng)基準(zhǔn)測(cè)試項(xiàng)目中，Claude 3.7 Sonnet在指令遵循、通用推理、多模態(tài)能力以及智能體編碼方面的表現(xiàn)，都趕超了OpenAI o1和DeepSeek R1。

無論是馬斯克，還是阿里，在模型尚未完備之際就如此著急推出，秀技術(shù)肌肉之外，搶在DeepSeek前面，趁著對(duì)方多模態(tài)尚不完善之際，打出產(chǎn)品的差異化競(jìng)爭(zhēng)優(yōu)勢(shì)，或許才是更重要的因素。

1月20日發(fā)布的DeepSeek R1，盡管支持深度思考的推理模式，但其并非一款多模態(tài)推理大模型，不支持圖片生成，也不支持語音模式。如在圖片識(shí)別上，DeepSeek R1所做到的識(shí)圖，更多是通過OCR掃描技術(shù)，簡(jiǎn)單將圖片上的文字一一復(fù)制下來，無法理解文字之間的邏輯對(duì)應(yīng)關(guān)系。

接入DeepSeek R1的騰訊，就利用DeepSeek R1的這一短板，在近期的元寶內(nèi)上線了圖生文功能，借助其自研模型的多模態(tài)能力加持，讓DeepSeek也可以理解圖片內(nèi)容。

馬斯克同樣預(yù)告了Grok 3的語音模式，提前測(cè)試過這一功能的希馮·齊利斯（Shivon Zilis）——Neuralink高管，同時(shí)也是和馬斯克育有一對(duì)雙胞胎的孩子?jì)?，大贊和Grok 3進(jìn)行的語音對(duì)話，稱“是我一生中最出乎意料、最值得的時(shí)光之一?！?/p>

堅(jiān)持推出自家推理模型的背后，更是各家大模型廠商對(duì)用戶的一場(chǎng)全新爭(zhēng)奪戰(zhàn)。

DeepSeek的異軍突起，再次激發(fā)大廠對(duì)AI to C的重視。

在阿里發(fā)布推理模型QwQ-Max-Preview的公告中，一并透露的還有將發(fā)布Qwen Chat APP的消息，并稱其可能獨(dú)立于通義APP。阿里解釋稱，該專用APP將優(yōu)先考慮實(shí)時(shí)響應(yīng)能力與流行生產(chǎn)力工具的集成，使全球受眾能夠使用先進(jìn)的人工智能。

一旦成真，阿里也將成為全球大模型玩家中，首個(gè)內(nèi)部同時(shí)上線兩款A(yù)I助手應(yīng)用的科技大廠。通義APP未能在用戶規(guī)模上打開局面的客觀現(xiàn)實(shí)，或許是促成阿里這一決策的重要背景。

在阿里打算重起爐灶之外，如騰訊、百度則選擇了接入DeepSeek來爭(zhēng)奪C端用戶。但這一舉措的潛在風(fēng)險(xiǎn)，依然不小。

目前，各家還都能依賴DeepSeek外溢的流量，吸引到用戶。一旦DeepSeek解決服務(wù)卡頓問題，這些用戶難免不會(huì)再次流失。

且這樣的危險(xiǎn)信號(hào)已經(jīng)發(fā)出。據(jù)鳳凰網(wǎng)科技，目前DeepSeek官方通過技術(shù)優(yōu)化，已經(jīng)讓用戶在體驗(yàn)側(cè)少了觸發(fā)服務(wù)繁忙的頻次。

歸根到底，通過自研大模型，在技術(shù)上帶來體驗(yàn)突破，才是徹底留住用戶的最有效手段。這一策略，不僅適用于C端，同時(shí)更適用于對(duì)B端開發(fā)者群體的爭(zhēng)奪。

盡管如騰訊般，開始選擇徹底擁抱DeepSeek，并將開源的DeepSeek接入自家一系列產(chǎn)品，但面對(duì)這場(chǎng)涉及AIGC安卓夢(mèng)想的爭(zhēng)奪，沒有大廠想要放棄。

過去兩年中，大模型給傳統(tǒng)應(yīng)用帶來的體驗(yàn)升級(jí)，讓越來越多人開始認(rèn)同一種觀點(diǎn)，即所有應(yīng)用都值得用大模型重做一遍。

基于上述共識(shí)，在自研大模型之余，科技大廠都相繼發(fā)布了自家的大模型服務(wù)平臺(tái)，既做淘金者，又爭(zhēng)當(dāng)賣鏟子的人，都向著成為AIGC時(shí)代的安卓夢(mèng)想發(fā)起沖鋒。

截至目前，包括騰訊、阿里、百度、字節(jié)在內(nèi)，一眾科技大廠都表達(dá)了仍會(huì)堅(jiān)持大模型自研到底的決心。

為了繼續(xù)向AIGC時(shí)代的安卓夢(mèng)想邁進(jìn)，各家大廠為了聚攏開發(fā)者生態(tài)，都加快了在開源上的進(jìn)度：阿里在QwQ-Max-Preview亮相后，同步宣布未來將以Apache2.0許可協(xié)議開源自家推理模型；國(guó)內(nèi)一直堅(jiān)持閉源的百度，也開始重新?lián)肀ч_源路線。騰訊、字節(jié)也都在推動(dòng)旗下垂類模型陸續(xù)開源。

另一邊的DeepSeek，同樣也沒閑著。在新一代模型尚未發(fā)布的間隙，面對(duì)競(jìng)爭(zhēng)對(duì)手紛紛開源搶奪注意力的策略，DeepSeek選擇了加碼，相繼開源了FlashMLA代碼庫、DeepEP通信庫，以及FP8計(jì)算庫DeepGEMM把自己低成本高性能的訓(xùn)練秘密公之于眾，讓有實(shí)力的開發(fā)者可以在H800等英偉達(dá)低效芯片基礎(chǔ)上，也能提高模型的運(yùn)行效率。

同時(shí)，關(guān)閉20天的官方API充值服務(wù)也于2月25日恢復(fù)正常。據(jù)字母榜（ID：wujicaijing）獲悉，當(dāng)天DeepSeek官方還發(fā)布了一則特別提示，稱“當(dāng)前白天時(shí)段服務(wù)器資源依舊緊張，凌晨 0:30 到上午 8:30 相對(duì)空閑，若業(yè)務(wù)允許，建議開發(fā)者調(diào)整至該時(shí)段以獲得更為流暢的API調(diào)用體驗(yàn)?！?/p>

被路透社同天曝光的R2新模型提速發(fā)布消息，則成了DeepSeek應(yīng)對(duì)這輪推理模型競(jìng)賽而拋出的新武器。

眼下，唯一沒有對(duì)外大范圍提供推理模型服務(wù)的科技大廠，只剩下了字節(jié)。

對(duì)大模型技術(shù)演進(jìn)路線的判斷失誤，或許是字節(jié)沒能及時(shí)跟進(jìn)推出新模型的原因之一。

據(jù)晚點(diǎn)LatePost報(bào)道，在近期的All Hands會(huì)上，字節(jié)CEO梁汝波反思道，DeepSeek R1創(chuàng)新點(diǎn)之一的長(zhǎng)鏈思考模式不是業(yè)界首創(chuàng)，去年9月OpenAI o1發(fā)布長(zhǎng)鏈思考模型、成為行業(yè)熱點(diǎn)后，字節(jié)就意識(shí)到了技術(shù)的重大變化，但 “沒有覺得要馬上復(fù)現(xiàn)出來......現(xiàn)在回頭看，如果一開始重大問題就爭(zhēng)先，我們有機(jī)會(huì)更早實(shí)現(xiàn)。”

這不是字節(jié)在大模型領(lǐng)域第一次錯(cuò)判形勢(shì)。

ChatGPT爆火后，在去年初的All Hands會(huì)上，梁汝波就曾反思，“公司層面的半年度技術(shù)回顧，直到2023年才開始考慮GPT，而業(yè)內(nèi)做得比較好的大模型創(chuàng)業(yè)公司，都是在2018年至2021年創(chuàng)立的。”

當(dāng)時(shí)，字節(jié)在大模型研發(fā)方面除了進(jìn)度緩慢之外，內(nèi)部還一度將AI重心移向了細(xì)分垂直賽道的AI for Science。這直接導(dǎo)致字節(jié)在大模型推出時(shí)間上落后了百度、阿里一大截。

2022年11月ChatGPT發(fā)布之后，百度、阿里等國(guó)內(nèi)大廠相繼在2023年三四月份推出自研大模型文心和通義，但直到去年8月份，字節(jié)才對(duì)外亮相了云雀大模型（豆包大模型前身）。

在服務(wù)B端開發(fā)者群體上，字節(jié)也因此慢了一步。從2023年4月起，百度、阿里、騰訊相繼通過旗下云服務(wù)對(duì)外提供大模型接入服務(wù)。直到一年后的2024年5月，字節(jié)自主研發(fā)的豆包大模型才開始通過火山引擎正式對(duì)外提供服務(wù)。

好在，借助2024年大模型技術(shù)迭代趨緩的利好因素，字節(jié)在過去一年大力補(bǔ)課，不僅使得豆包一度成為國(guó)內(nèi)月活用戶最多的AI應(yīng)用，而且從大模型性能到多模態(tài)布局，也都相繼追趕上了國(guó)內(nèi)頭部廠商。

進(jìn)入2025年，DeepSeek R1引發(fā)的推理模型熱潮，則又一次將追趕壓力推到了字節(jié)面前。

稍顯不同的是，這次迎來壓力拷問的不只是字節(jié)一家。尤其隨著DeepSeek R2模型提早到來的動(dòng)作，一眾科技大廠，都難逃再被DeepSeek對(duì)比的緊張氣氛。

歡迎在評(píng)論區(qū)留言~
如需開白請(qǐng)加小編微信：dongfangmark

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.