首個被DeepSeek逼得在大模型上左右互搏的科技大廠,終于出現了。
近期,騰訊AI助手騰訊元寶,宣布接入DeepSeek-R1,允許用戶在選擇模型時,自由切換騰訊混元大模型和DeepSeek-R1。在一眾自研大模型廠商中,騰訊也由此成為首家將DeepSeek接入自家主力產品的公司。
在此之前,一眾科技大廠更多選擇的是,僅在自家云服務平臺上接入DeepSeek模型,供外部開發者調用,刻意避開了在C端跟自家AI助手產品打擂臺的情況。
有AI大廠員工向字母榜(ID:wujicaijing)分析,對于自研大模型的科技大廠而言,是否選擇接入DeepSeek,本身便是個兩難選擇。“尤其在自家AI助手上直接接入,這意味著間接承認當前DeepSeek-R1的表現要好于自家。”
對于上述推測,字母榜從騰訊內部知情人士處了解到,選擇在騰訊元寶中接入DeepSeek,內部更多是出于能力互補的考量,且未來在大模型自研上,騰訊仍會堅持到底。
但不容忽視的客觀現實是,在過去兩年的大模型發展進程中,不論是自研大模型的上線時間,還是AI助手的發布節奏,騰訊都成了科技大廠中最不著急的一家。這也被外界視為騰訊在接入DeepSeek上,敢于第一個吃螃蟹的原因之一。
相比騰訊在AI上不溫不火的表現,同樣在大模型領域落后其他科技大廠一步的字節,則在過去一年中奮起直追。在DeepSeek爆火之前,字節旗下AI助手豆包,已成為中國月活用戶數最多的AI對話應用。
但面對DeepSeek的異軍突起,去年的豆包有多火爆,進入2025年的豆包或許就有多難受。近期的一場內部會上,百度智能云事業群總裁沈抖就點評道,面對DeepSeek的來勢洶洶,首當其沖的AI產品,便是字節的豆包,認為后者的訓練成本和投流成本都很高。
盡管沈抖的言論很快便得到火山引擎總裁譚待的隔空回應,后者稱豆包1.5 Pro的預訓練、推理成本均低于DeepSeek V3,且在當前的價格下仍有可觀的毛利。但不能否認的是,作為兩款都在年初亮相的新模型,豆包的這些產品亮點,完全被淹沒在了DeepSeek所帶來的“神秘東方力量”之中。
數據給出了直觀有力的說明。根據近期QuestMobile給出的數據,DeepSeek日活躍用戶(DAU)在1月28日首次超越豆包(約1695萬),隨后在2月1日突破3000萬大關,成為國內DAU最高的AI 對話產品。做到這一切,DeepSeek只用了20天。
OpenAI CEO奧特曼認為,DeepSeek所展示出來的思維鏈、免費且大規模可用等特性,助推了人們爭相體驗的熱情。
這也得到了字節CEO梁汝波的認同。據晚點LatePost爆料,在本周四舉辦的新一期All Hands全員會上,梁汝波提到DeepSeek-R1創新點之一的長鏈思考模式并非業界首創,在去年9月OpenAI發布長鏈思考模型o1后,字節也意識到了技術的重大變化,但沒有及時跟進,選擇將技術快速復現出來,“現在回頭看,如果一開始重大問題就爭先,我們有機會更早實現。”
在承認DeepSeek技術能力強勁之外,字節并未透露出可能在豆包中接入DeepSeek的跡象。
對于2025年的重點目標,梁汝波一方面要求團隊加強規模效應,繼續做大豆包用戶群,另一方面則明確將繼續追求AI技術研發和創新。
被譽為全球最強產品經理的蘋果創始人喬布斯,曾說過一句話——“好產品自己會說話”。借助技術創新給用戶帶來全新AI體驗的DeepSeek,無疑是這句話的最新注腳。
在接下來的大模型競賽中,留給字節和其他AI廠商的最大壓力,便是它們能否做出一款比DeepSeek更好的產品呢?
A
慢,在某種程度上成了騰訊AI在當下敢于率先接入DeepSeek的“優點”。
2022年11月ChatGPT發布之后,百度、阿里等國內大廠相繼在2023年三四月份推出自研大模型,并配套上線自家的AI助手產品。
但騰訊比晚了一步的字節還慢了些。在字節對外亮相云雀大模型(豆包大模型前身)后的一個月,即2023年9月份,騰訊才正式上線了自研的混元大模型,官方AI助手騰訊元寶,更是直到去年5月才上線。
速度緩慢的代價之一便是,在一眾科技大廠的AI助手產品中,騰訊元寶在月活用戶側排名墊底。
QuestMobile數據顯示,截至2024年12月,AI原生APP月度活躍用戶排行榜中,豆包、Kimi、文小言分別以7523萬、2101萬、1224萬位列前三,阿里通義月活291萬,騰訊元寶月活則只有211萬。
但在DeepSeek掀起的風暴面前,騰訊也有點坐不住了。更重要的是,DeepSeek正在帶動AI需求使用量的激增,C端AI應用有望在2025年爆發,已成為AI行業新共識之一。
從斯坦福大學計算機科學系客座教授、谷歌大腦聯合創始人吳恩達,到百川智能創始人王小川、零一萬物創始人李開復,他們均給出了AI應用將在2025年爆發的預測。
過去兩年,為了普及AI應用,一眾大模型廠商沒少努力。2024年5月,DeepSeek借助大模型價格戰一躍成名。當時,DeepSeek發布了DeepSeek V2開源模型,并在行業內率先降價,將推理成本降到每百萬token僅1塊錢,約等于GPT-4 Turbo的七十分之一。
隨后,字節、騰訊、百度、阿里等科技大廠紛紛降價跟進。中國大模型價格戰由此揭幕。
但降價后的大模型調用成本,對中小AI應用開發者而言,仍顯得高不可攀。當時,有業內人士開始預測,等到推理成本再下降100倍后,AI應用便大概率會迎來爆發期。
更重要的是,成本之外,當時普通用戶缺乏對大模型產品的信任度,后者在內容生成幻覺方面的屢屢翻車,讓其可靠性大打折扣。
及至DeepSeek R1模型的出現,這些擔憂都開始得到初步改變,模型調用成本盡管沒有下降到100倍,但DeepSeek已經做到了比OpenAI o1的運行成本,便宜近30倍,且生成內容還保持了高可靠性。
在AI應用這列即將疾馳而來的火車上,騰訊原本有望搭著蘋果超速。
去年11月,就有傳聞稱蘋果正與騰訊討論合作,將后者AI引入國產iPhone等硬件中。但消息飄了三個多月后,近期,據The Information,蘋果在國內的首批AI合作伙伴,選定了阿里和百度,暫未有騰訊身影出現。
在錯失蘋果AI的合作機會之后,率先接入DeepSeek的舉動,成了騰訊當下為自身爭取C端用戶的Plan B。
B
相比騰訊,同樣比百度和阿里慢了一步的字節,經過過去一年的瘋狂補課,在張一鳴繼續踐行“大力出奇跡”方法論的基礎上,使得字節AI開始有了后來居上的對外表現。
張一鳴追趕同行的第一步,選擇從定下全面自研的策略開始。據騰訊科技報道,2023年中,字節跳動在自研和收購上徘徊,并一度下場尋覓大模型標的,但在跟Minimax達成SPA(股份認購協議)的最后一刻,選擇了放棄,重心轉向內部自研。
自研策略定下之后,字節開始在內部組建多個小型AI產品團隊,每個團隊由10到15人組成,以開發新應用程序并相互競爭,來爭取字節的資源支持力度。
與此同時,為了推廣自家豆包應用,字節旗下巨量引擎成了首家限制其他同類產品投放的平臺。從去年4月2日開始,抖音巨量廣告正式要求,非字節系AI產品不能使用抖音、頭條的流量池做營銷推廣。
在抖音的全系流量灌溉之下,加入投流之戰的豆包,一度是DeepSeek爆火前用戶量增速最快的AI產品,并最終拿下國內月活用戶數第一的寶座。
與字節重投流策略不同,在大模型發布上搶占先機的阿里,一開始將重心放在了AI to B上。光子星球報道稱,阿里內部人士曾透露,通義應用最初與大模型一同被打包進To B服務中,其作用是“秀肌肉”,即通過上架模型的各項功能,來吸引B端用戶關注,以展示場景落地的潛力。
但到了去年12月底,眼看著AI應用爆發在即,阿里也不得不調整策略,開始將通義應用從阿里云分拆,并入阿里智能信息事業群。這被視為阿里加碼“AI to C”的重要信號。
但隨著字節、阿里紛紛重注自家AI助手,硬幣的反面弊端也開始凸顯——它們在接入第三方大模型上變得更加糾結和有壓力。
更重要的是,一旦選擇在自家核心AI應用上接入DeepSeek,還可能導致團隊爭搶內部資源分配權,從而引發意外的混亂。
一旦用戶更愿意調用DeepSeek,公司內部的資源便勢必會向其傾斜。參與大模型投資的恒業資本創始合伙人江一解釋稱,尤其在B端客戶上,每調用一次DeepSeek,便意味著公司云服務的資源變現。“公司內部的商業化團隊,與大模型訓練團隊,不可避免會迎來一場新的資源分配權爭奪戰。”
更重要的是,即便冒著自家資源混亂的風險,接入DeepSeek,究竟能否給自家產品帶來預期中的流量, 還是未知數。
不同于此前云服務廠商接入DeepSeek的舉措,前者是為了最終吸引開發者使用自家的算力資源,本質上是在賣鏟子的路上繼續跟進。
但在AI助手中接入DeepSeek,直面的則是C端用戶。在當前的免費策略之下,普通用戶對大模型產品尚未產生忠誠度,用戶心智被體驗優劣所左右。一旦出現比DeepSeek體驗更好的模型,或者DeepSeek解決了自身的服務卡頓難題,用戶難免會用腳投票。
C
為了迎接DeepSeek所帶來的沖擊,部分大模型頭部玩家正在改變自身的競爭策略。
國外的OpenAI,國內的百度,近期都開始改變其在大模型上的傳統競爭方式。OpenAI官宣了GPT-5的消息,百度也傳出了文心5.0即將面試的計劃,兩家都希望通過新模型的發布,增強外界對自身在技術體驗上的信任度。
同時,包括OpenAI和百度在內,兩家都一改過去的收費、閉源策略:OpenAI即將發布的GPT-5,屆時將向所有用戶免費開放;文心一言將于4月1日起,全面免費,且未來幾個月內推出的文心大模型4.5系列,也將走向開源。
DeepSeek帶來的壓力,并沒有改變大模型頭部玩家對算力需求的追逐,科技大廠依然在信仰縮放定律(Scaling Laws)的路上前進。
這也部分解釋了英偉達股價從暴跌再到大漲的起伏變化。
北京時間1月27日晚,受DeepSeek低成本訓練策略的影響,英偉達美股股價一夜暴跌超10%,市值蒸發超3000億美元,總市值跌破3萬億美元。近20天后,截至美東時間2月14日收盤,英偉達股價回撤基本修復,總市值再次重回34000億美元。
但對大模型廠商的價值重估,仍在繼續。在DeepSeek引發的蝴蝶效應到來之前,融資環境就有了變難的趨勢,江一也深有感受,在他看來,進入2025年,行業對大模型的投資會變得更為謹慎,“類似李開復做出放棄預訓練的決定,在六小虎中幾乎都不同程度存在,就看它們資金能撐到什么時候來對外宣布自己的戰略調整了。”
無論是大模型六小虎,還是科技大廠,想要在大模型領域重獲用戶青睞,唯一的捷徑便是學習DeepSeek,通過技術創新證明自己。
這方面從谷歌到豆包,都先后成了反面教材。晚于DeepSeek-R1近兩天發布的豆包1.5 Pro大模型,盡管在預訓練和推理成本上還要低于DeepSeek-V3,但卻因為模型體驗不如前者,而未能在輿論場上激起太多水花。
同樣趕在DeepSeek-R1之后發布的谷歌Gemini 2.0系列大模型,盡管其Gemini 2.0 Flash-Lite版本的調用價格,比DeepSeek-V3更低,但僅靠價格優勢,也依然難以俘獲用戶的芳心。
更糟糕的是,DeepSeek在20天內狂攬3000萬月活的事實,讓外界開始重新審視大模型廠商所謂的“先發優勢”。
在過去兩年內,大模型行業一度認為誰能夠跑得更快一些,獲取更多的應用,拿到更多的數據反饋,誰就能持續地保持一定程度的模型領先。
但上述數據飛輪效應被DeepSeek證偽了。近期在接受騰訊新聞采訪中,金沙江創投主管合伙人朱嘯虎便說道,“以前我覺得這波AI最大壁壘在數據飛輪上,但現在看來數據飛輪價值不大。因為大部分用戶數據都是重復的,是低信息含量的,沒有意義的。”這成了朱嘯虎在過去兩年中得到的最大一個教訓。
一切競爭的原點,又回到了底層的技術創新和突破上。據字母榜了解,目前包括騰訊、阿里、字節、百度等在內的科技大廠,均表示將堅持大模型自研路線,并推動基礎大模型的持續迭代升級。
但留給這些科技大廠的更大挑戰在于,自家的新一代模型,在體驗上究竟能超出DeepSeek的表現有多少?
參考資料:
《字節全員會:重提“務實的浪漫”,要做能發明新技術的科技公司》晚點LatePost
《阿里蔡崇信迪拜最新講話:最初我為什么選擇了“瘋狂”的馬云》藍鯨TMT
《百度云全員會上,沈抖聊了業績、模型混戰、以及DeepSeek》36氪
《蘋果選阿里,為什么不是騰訊字節或DeepSeek?》財經雜志
《朱嘯虎現實主義故事1周年連載:“DeepSeek快讓我相信AGI了”》張小珺
《通義趕“末班車”》光子星球
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.