99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

DeepSeek小心,帝國(guó)反擊戰(zhàn)到來了

0
分享至


DeepSeek R1引發(fā)的一場(chǎng)推理模型大作戰(zhàn)還在繼續(xù),且參戰(zhàn)名單正隨著時(shí)間推移逐步拉長(zhǎng)。

僅僅昨天一天時(shí)間之內(nèi),這場(chǎng)戰(zhàn)局就又吸引來了4家明星大模型公司:先是阿里發(fā)布推理模型QwQ-Max-Preview預(yù)覽版,接著Anthropic宣布推出全球首個(gè)“混合推理”模型Claude 3.7 Sonnet,后字節(jié)也被曝出豆包正在小范圍測(cè)試自研的深度思考型推理模型。

作為被各路對(duì)標(biāo)的DeepSeek,也有了新動(dòng)作。昨晚,路透社爆料稱,DeepSeek正在加速推出R2模型,該模型原計(jì)劃在5月初發(fā)布,但現(xiàn)在官方希望能盡早發(fā)布。

香港科技大學(xué)校董會(huì)主席、美國(guó)國(guó)家工程院外籍院士沈向洋在近期分享中指出,“對(duì)于大模型,之前的研究焦點(diǎn)是GPT模式,現(xiàn)在的焦點(diǎn)是Reasoner模式,這是一種新的學(xué)習(xí)范式?!?/p>

DeepSeek R1,無疑成了這場(chǎng)范式變革的重點(diǎn)參考對(duì)象。在此之前,騰訊也上線了自研的深度思考模型“混元T1”,百度文小言上線深度搜索功能,馬斯克的xAI也發(fā)布了帶有深度思考能力的Grok 3新模型。

就連OpenAI,都在DeepSeek壓力下,進(jìn)一步開放了自家推理模型o1和o3-mini的思維鏈。

DeepSeek R1這塊投向推理側(cè)的大模型技術(shù)迭代新石子,其漣漪效應(yīng)正逐漸擴(kuò)散至全行業(yè)。這一幕頗像2023年行業(yè)對(duì)ChatGPT的追趕。彼時(shí),科技大廠如百度、阿里,爭(zhēng)先發(fā)布自家大模型;王慧文攜5000萬美元振臂一呼,正式開啟了一場(chǎng)席卷全行業(yè)的大模型創(chuàng)業(yè)熱潮,楊植麟、王小川、李開復(fù)等先后創(chuàng)辦起月之暗面、百川智能、零一萬物等明星大模型公司,爭(zhēng)分奪秒搶奪市場(chǎng)融資并對(duì)外發(fā)布產(chǎn)品。

不過,在ChatGPT時(shí)刻到來后就落后一步的字節(jié),如今在追趕DeepSeek時(shí)刻上又有了慢人一步的跡象。在國(guó)內(nèi)其他科技大廠已經(jīng)相繼完成深度思考能力的亮相后,字節(jié)的自研推理大模型才剛剛進(jìn)入灰度測(cè)試階段。

DeepSeek R2新模型可能提早發(fā)布的消息,無疑又給字節(jié)上了上競(jìng)爭(zhēng)強(qiáng)度。但好消息是,那些搶在字節(jié)前面發(fā)布推理模型的同行們,還沒來得及松一口氣就同樣又遭遇心頭一緊。


如同馬斯克著急推出半成品Grok 3一樣,阿里新推理模型QwQ-Max-Preview,也只是一個(gè)預(yù)覽版,而非正式版模型。

在LiveCodeBench編程測(cè)試中,QwQ-Max-Preview也只是小幅超越OpenAI o1中檔推理模型,以及DeepSeek R1 Preview預(yù)覽版(注意,不是DeepSeek R1正式版)。阿里官方介紹,QwQ-Max正式版將在后續(xù)推出。


如同DeepSeek R1是在V3基礎(chǔ)模型上訓(xùn)練出來的一樣,QwQ-Max同樣基于阿里的旗艦版模型Qwen2.5-Max而來,后者是于1月29日發(fā)布的一款MoE稠密模型,在公開的基準(zhǔn)測(cè)試中,官方稱其性能超越DeepSeek V3。

不同于阿里QwQ-Max-Preview,同一天發(fā)布的Anthropic新模型Claude 3.7 Sonnet,則是個(gè)徹徹底底的完整體,官方直接放出了多項(xiàng)評(píng)測(cè)指標(biāo)對(duì)比。

在傳統(tǒng)基準(zhǔn)測(cè)試項(xiàng)目中,Claude 3.7 Sonnet在指令遵循、通用推理、多模態(tài)能力以及智能體編碼方面的表現(xiàn),都趕超了OpenAI o1和DeepSeek R1。


無論是馬斯克,還是阿里,在模型尚未完備之際就如此著急推出,秀技術(shù)肌肉之外,搶在DeepSeek前面,趁著對(duì)方多模態(tài)尚不完善之際,打出產(chǎn)品的差異化競(jìng)爭(zhēng)優(yōu)勢(shì),或許才是更重要的因素。

1月20日發(fā)布的DeepSeek R1,盡管支持深度思考的推理模式,但其并非一款多模態(tài)推理大模型,不支持圖片生成,也不支持語音模式。如在圖片識(shí)別上,DeepSeek R1所做到的識(shí)圖,更多是通過OCR掃描技術(shù),簡(jiǎn)單將圖片上的文字一一復(fù)制下來,無法理解文字之間的邏輯對(duì)應(yīng)關(guān)系。

接入DeepSeek R1的騰訊,就利用DeepSeek R1的這一短板,在近期的元寶內(nèi)上線了圖生文功能,借助其自研模型的多模態(tài)能力加持,讓DeepSeek也可以理解圖片內(nèi)容。

馬斯克同樣預(yù)告了Grok 3的語音模式,提前測(cè)試過這一功能的希馮·齊利斯(Shivon Zilis)——Neuralink高管,同時(shí)也是和馬斯克育有一對(duì)雙胞胎的孩子?jì)?,大贊和Grok 3進(jìn)行的語音對(duì)話,稱“是我一生中最出乎意料、最值得的時(shí)光之一?!?/p>


堅(jiān)持推出自家推理模型的背后,更是各家大模型廠商對(duì)用戶的一場(chǎng)全新爭(zhēng)奪戰(zhàn)。

DeepSeek的異軍突起,再次激發(fā)大廠對(duì)AI to C的重視。

在阿里發(fā)布推理模型QwQ-Max-Preview的公告中,一并透露的還有將發(fā)布Qwen Chat APP的消息,并稱其可能獨(dú)立于通義APP。阿里解釋稱,該專用APP將優(yōu)先考慮實(shí)時(shí)響應(yīng)能力與流行生產(chǎn)力工具的集成,使全球受眾能夠使用先進(jìn)的人工智能。

一旦成真,阿里也將成為全球大模型玩家中,首個(gè)內(nèi)部同時(shí)上線兩款A(yù)I助手應(yīng)用的科技大廠。通義APP未能在用戶規(guī)模上打開局面的客觀現(xiàn)實(shí),或許是促成阿里這一決策的重要背景。

在阿里打算重起爐灶之外,如騰訊、百度則選擇了接入DeepSeek來爭(zhēng)奪C端用戶。但這一舉措的潛在風(fēng)險(xiǎn),依然不小。

目前,各家還都能依賴DeepSeek外溢的流量,吸引到用戶。一旦DeepSeek解決服務(wù)卡頓問題,這些用戶難免不會(huì)再次流失。

且這樣的危險(xiǎn)信號(hào)已經(jīng)發(fā)出。據(jù)鳳凰網(wǎng)科技,目前DeepSeek官方通過技術(shù)優(yōu)化,已經(jīng)讓用戶在體驗(yàn)側(cè)少了觸發(fā)服務(wù)繁忙的頻次。

歸根到底,通過自研大模型,在技術(shù)上帶來體驗(yàn)突破,才是徹底留住用戶的最有效手段。這一策略,不僅適用于C端,同時(shí)更適用于對(duì)B端開發(fā)者群體的爭(zhēng)奪。

盡管如騰訊般,開始選擇徹底擁抱DeepSeek,并將開源的DeepSeek接入自家一系列產(chǎn)品,但面對(duì)這場(chǎng)涉及AIGC安卓夢(mèng)想的爭(zhēng)奪,沒有大廠想要放棄。

過去兩年中,大模型給傳統(tǒng)應(yīng)用帶來的體驗(yàn)升級(jí),讓越來越多人開始認(rèn)同一種觀點(diǎn),即所有應(yīng)用都值得用大模型重做一遍。

基于上述共識(shí),在自研大模型之余,科技大廠都相繼發(fā)布了自家的大模型服務(wù)平臺(tái),既做淘金者,又爭(zhēng)當(dāng)賣鏟子的人,都向著成為AIGC時(shí)代的安卓夢(mèng)想發(fā)起沖鋒。

截至目前,包括騰訊、阿里、百度、字節(jié)在內(nèi),一眾科技大廠都表達(dá)了仍會(huì)堅(jiān)持大模型自研到底的決心。

為了繼續(xù)向AIGC時(shí)代的安卓夢(mèng)想邁進(jìn),各家大廠為了聚攏開發(fā)者生態(tài),都加快了在開源上的進(jìn)度:阿里在QwQ-Max-Preview亮相后,同步宣布未來將以Apache2.0許可協(xié)議開源自家推理模型;國(guó)內(nèi)一直堅(jiān)持閉源的百度,也開始重新?lián)肀ч_源路線。騰訊、字節(jié)也都在推動(dòng)旗下垂類模型陸續(xù)開源。

另一邊的DeepSeek,同樣也沒閑著。在新一代模型尚未發(fā)布的間隙,面對(duì)競(jìng)爭(zhēng)對(duì)手紛紛開源搶奪注意力的策略,DeepSeek選擇了加碼,相繼開源了FlashMLA代碼庫、DeepEP通信庫,以及FP8計(jì)算庫DeepGEMM把自己低成本高性能的訓(xùn)練秘密公之于眾,讓有實(shí)力的開發(fā)者可以在H800等英偉達(dá)低效芯片基礎(chǔ)上,也能提高模型的運(yùn)行效率。


同時(shí),關(guān)閉20天的官方API充值服務(wù)也于2月25日恢復(fù)正常。據(jù)字母榜(ID:wujicaijing)獲悉,當(dāng)天DeepSeek官方還發(fā)布了一則特別提示,稱“當(dāng)前白天時(shí)段服務(wù)器資源依舊緊張,凌晨 0:30 到上午 8:30 相對(duì)空閑,若業(yè)務(wù)允許,建議開發(fā)者調(diào)整至該時(shí)段以獲得更為流暢的API調(diào)用體驗(yàn)?!?/p>

被路透社同天曝光的R2新模型提速發(fā)布消息,則成了DeepSeek應(yīng)對(duì)這輪推理模型競(jìng)賽而拋出的新武器。


眼下,唯一沒有對(duì)外大范圍提供推理模型服務(wù)的科技大廠,只剩下了字節(jié)。

對(duì)大模型技術(shù)演進(jìn)路線的判斷失誤,或許是字節(jié)沒能及時(shí)跟進(jìn)推出新模型的原因之一。

據(jù)晚點(diǎn)LatePost報(bào)道, 在近期的All Hands會(huì)上,字節(jié)CEO梁汝波反思道,DeepSeek R1創(chuàng)新點(diǎn)之一的長(zhǎng)鏈思考模式不是業(yè)界首創(chuàng),去年9月OpenAI o1發(fā)布長(zhǎng)鏈思考模型、成為行業(yè)熱點(diǎn)后,字節(jié)就意識(shí)到了技術(shù)的重大變化,但 “沒有覺得要馬上復(fù)現(xiàn)出來......現(xiàn)在回頭看,如果一開始重大問題就爭(zhēng)先,我們有機(jī)會(huì)更早實(shí)現(xiàn)。”

這不是字節(jié)在大模型領(lǐng)域第一次錯(cuò)判形勢(shì)。

ChatGPT爆火后,在去年初的All Hands會(huì)上,梁汝波就曾反思,“公司層面的半年度技術(shù)回顧,直到2023年才開始考慮GPT,而業(yè)內(nèi)做得比較好的大模型創(chuàng)業(yè)公司,都是在2018年至2021年創(chuàng)立的。”

當(dāng)時(shí),字節(jié)在大模型研發(fā)方面除了進(jìn)度緩慢之外,內(nèi)部還一度將AI重心移向了細(xì)分垂直賽道的AI for Science。這直接導(dǎo)致字節(jié)在大模型推出時(shí)間上落后了百度、阿里一大截。


2022年11月ChatGPT發(fā)布之后,百度、阿里等國(guó)內(nèi)大廠相繼在2023年三四月份推出自研大模型文心和通義,但直到去年8月份,字節(jié)才對(duì)外亮相了云雀大模型(豆包大模型前身)。

在服務(wù)B端開發(fā)者群體上,字節(jié)也因此慢了一步。從2023年4月起,百度、阿里、騰訊相繼通過旗下云服務(wù)對(duì)外提供大模型接入服務(wù)。直到一年后的2024年5月,字節(jié)自主研發(fā)的豆包大模型才開始通過火山引擎正式對(duì)外提供服務(wù)。

好在,借助2024年大模型技術(shù)迭代趨緩的利好因素,字節(jié)在過去一年大力補(bǔ)課,不僅使得豆包一度成為國(guó)內(nèi)月活用戶最多的AI應(yīng)用,而且從大模型性能到多模態(tài)布局,也都相繼追趕上了國(guó)內(nèi)頭部廠商。

進(jìn)入2025年,DeepSeek R1引發(fā)的推理模型熱潮,則又一次將追趕壓力推到了字節(jié)面前。

稍顯不同的是,這次迎來壓力拷問的不只是字節(jié)一家。尤其隨著DeepSeek R2模型提早到來的動(dòng)作,一眾科技大廠,都難逃再被DeepSeek對(duì)比的緊張氣氛。

歡迎在評(píng)論區(qū)留言~
如需開白請(qǐng)加小編微信:dongfangmark


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
129元!小米剛上架的新品,真的香?。?>
    </a>
        <h3>
      <a href=129元!小米剛上架的新品,真的香??! 科技堡壘
2025-04-28 11:48:27
都是信仰耶穌,基督教和天主教有何區(qū)別?一文給你解釋清楚

都是信仰耶穌,基督教和天主教有何區(qū)別?一文給你解釋清楚

爆史君帶你讀歷史
2025-04-26 21:27:53
四川一貪官?gòu)臅?huì)場(chǎng)被帶走畫面曝光,懺悔此為“奇恥大辱”

四川一貪官?gòu)臅?huì)場(chǎng)被帶走畫面曝光,懺悔此為“奇恥大辱”

大象新聞
2025-04-28 15:14:55
220斤詹皇死亡翻滾!第1次沒壓到華子腳踝立刻壓第2次,想干啥?

220斤詹皇死亡翻滾!第1次沒壓到華子腳踝立刻壓第2次,想干啥?

嘴炮體壇
2025-04-28 11:07:57
英媒:中國(guó)現(xiàn)役的兩艘航母加起來,都不如英國(guó)一艘航母強(qiáng)大!

英媒:中國(guó)現(xiàn)役的兩艘航母加起來,都不如英國(guó)一艘航母強(qiáng)大!

張斌說
2025-04-28 17:09:54
當(dāng)年舉報(bào)畢福劍的那位告密者張清:眾叛親離,過得好慘

當(dāng)年舉報(bào)畢福劍的那位告密者張清:眾叛親離,過得好慘

新興網(wǎng)評(píng)
2024-12-11 21:02:46
那種冷到極致的冷知識(shí),看完網(wǎng)友分享,感覺我又要長(zhǎng)腦子了!

那種冷到極致的冷知識(shí),看完網(wǎng)友分享,感覺我又要長(zhǎng)腦子了!

墻頭草
2025-04-28 08:52:07
清明回老家,祖墳竟被鄰居蓋成廁所,我隱忍不發(fā),隔天鄰居一家傻眼

清明回老家,祖墳竟被鄰居蓋成廁所,我隱忍不發(fā),隔天鄰居一家傻眼

紅豆講堂
2025-04-26 10:06:11
2-2!0-0!意甲爭(zhēng)四2強(qiáng)一夜不勝:尤文6天2戰(zhàn)黑馬,拿6分=進(jìn)歐冠

2-2!0-0!意甲爭(zhēng)四2強(qiáng)一夜不勝:尤文6天2戰(zhàn)黑馬,拿6分=進(jìn)歐冠

體育知多少
2025-04-29 06:47:00
沉默48小時(shí),特朗普突然改口,中方若不肯妥協(xié),美國(guó)將繼續(xù)征重稅

沉默48小時(shí),特朗普突然改口,中方若不肯妥協(xié),美國(guó)將繼續(xù)征重稅

吳欣純Deborah
2025-04-28 16:34:18
靈魂的燭火:論人間至美的相遇

靈魂的燭火:論人間至美的相遇

青蘋果sht
2025-04-22 05:51:45
美軍火商給F-35戰(zhàn)斗機(jī)“升級(jí)”有什么考慮

美軍火商給F-35戰(zhàn)斗機(jī)“升級(jí)”有什么考慮

國(guó)際在線
2025-04-28 17:17:11
男生18cm有啥壞處?妹子現(xiàn)場(chǎng)演示長(zhǎng)短對(duì)比太生動(dòng),看完動(dòng)圖秒懂哈哈

男生18cm有啥壞處?妹子現(xiàn)場(chǎng)演示長(zhǎng)短對(duì)比太生動(dòng),看完動(dòng)圖秒懂哈哈

經(jīng)典段子
2025-04-14 23:34:48
養(yǎng)老金調(diào)整好消息,上?;貞?yīng)來了!部分60歲、65歲可以多漲錢?

養(yǎng)老金調(diào)整好消息,上?;貞?yīng)來了!部分60歲、65歲可以多漲錢?

阿纂看事
2025-04-28 13:05:01
世界首例!8K電視120Hz《西之絕境》運(yùn)行展示!

世界首例!8K電視120Hz《西之絕境》運(yùn)行展示!

游民星空
2025-04-28 17:18:49
女生穿瑜伽褲,到底是什么心理?原因太真實(shí)了!

女生穿瑜伽褲,到底是什么心理?原因太真實(shí)了!

健身S叔
2025-03-22 18:09:52
想要男孩情緒穩(wěn)定,頻繁跟他說這8句話,他會(huì)變得越來越強(qiáng)大

想要男孩情緒穩(wěn)定,頻繁跟他說這8句話,他會(huì)變得越來越強(qiáng)大

諾媽家有男寶娃
2025-04-24 15:31:39
奧喬亞:只有C羅梅西和我能6次參加世界杯,但他們想?yún)⒓泳湍軈⒓?>
    </a>
        <h3>
      <a href=直播吧
2025-04-28 22:56:03
利茲聯(lián)4-0布里斯托爾城,拉馬扎尼雙響,田中碧、尼奧托破門

利茲聯(lián)4-0布里斯托爾城,拉馬扎尼雙響,田中碧、尼奧托破門

懂球帝
2025-04-29 05:06:22
付政浩:遼寧遭遇更絕望潰敗 絕對(duì)是隊(duì)史最無力最絕望的場(chǎng)次之一

付政浩:遼寧遭遇更絕望潰敗 絕對(duì)是隊(duì)史最無力最絕望的場(chǎng)次之一

直播吧
2025-04-28 23:17:10
2025-04-29 07:55:00
直面派 incentive-icons
直面派
講述值得講述的真實(shí)故事
144文章數(shù) 217關(guān)注度
往期回顧 全部

科技要聞

清晨重磅!阿里發(fā)布并開源Qwen3

頭條要聞

媒體:賴清德強(qiáng)推"脫中入北" "北"正在掏空臺(tái)灣產(chǎn)業(yè)

頭條要聞

媒體:賴清德強(qiáng)推"脫中入北" "北"正在掏空臺(tái)灣產(chǎn)業(yè)

體育要聞

“我們欠球迷一個(gè)冠軍慶典,現(xiàn)在可以狂歡了”

娛樂要聞

黃渤青島做東請(qǐng)客 桌上全人情世故

財(cái)經(jīng)要聞

裁員70%、降薪20% AI四小龍到底怎么了?

汽車要聞

東風(fēng)日產(chǎn),重新起跑

態(tài)度原創(chuàng)

本地
健康
數(shù)碼
公開課
軍事航空

本地新聞

與重慶超合拍|取景框?qū)?zhǔn)來福士,開機(jī)你的電影感之旅

唇皰疹和口腔潰瘍是"同伙"嗎?

數(shù)碼要聞

努比亞Z70S Ultra攝影師版與努比亞平板 Pro發(fā)布

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

澤連斯基承認(rèn)烏情報(bào)部門刺殺俄軍高官

無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 洪江市| 南昌市| 南华县| 甘谷县| 汶上县| 侯马市| 平阳县| 商丘市| 崇左市| 冕宁县| 勐海县| 渑池县| 武冈市| 舞阳县| 原平市| 丰镇市| 张北县| 星座| 石景山区| 伊金霍洛旗| 安国市| 鹿泉市| 仁化县| 无棣县| 明溪县| 锦州市| 沽源县| 西平县| 峡江县| 开鲁县| 石嘴山市| 德令哈市| 邯郸县| 突泉县| 平江县| 台南市| 盐边县| 连城县| 阳原县| 青阳县| 玛沁县|