網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

大模型只剩DS、阿里、字節(jié)，李開(kāi)復(fù)說(shuō)了句大實(shí)話(huà)

2025-03-23 16:38:21　來(lái)源: 三易生活

湖北舉報(bào)

分享至

國(guó)內(nèi)的基座大模型大概率將會(huì)只剩下DeepSeek、阿里巴巴、字節(jié)跳動(dòng)三家，這是創(chuàng)新工場(chǎng)董事長(zhǎng)李開(kāi)復(fù)近日在接受彭博社采訪(fǎng)時(shí)做出的判斷。

在人工智能走紅后，李開(kāi)復(fù)與周鴻祎、李彥宏等人一道，成為了國(guó)內(nèi)互聯(lián)網(wǎng)行業(yè)中經(jīng)常對(duì)其評(píng)頭論足的大佬。那么這一次他關(guān)于未來(lái)國(guó)內(nèi)大模型市場(chǎng)將從群雄逐鹿的“百模大戰(zhàn)”發(fā)展至只剩下DeepSeek、阿里巴巴、字節(jié)跳動(dòng)的三足鼎立，到底是無(wú)稽之談、還是不可避免呢？

事實(shí)上，李開(kāi)復(fù)對(duì)于這番論斷極有可能是很有信心的，如若不然，他領(lǐng)導(dǎo)的零一萬(wàn)物也不會(huì)成為全面擁抱DeepSeek旗下大模型的第一個(gè)“AI六小虎”。早在今年年初，也就是DeeppSeek-R1尚未出圈時(shí)，李開(kāi)復(fù)就已宣布零一萬(wàn)物未來(lái)不會(huì)再做萬(wàn)億參數(shù)模型的預(yù)訓(xùn)練，而是將專(zhuān)注在務(wù)實(shí)的、小而快的、能夠以商業(yè)性?xún)r(jià)比來(lái)評(píng)估的模型。

其實(shí)不僅僅是零一萬(wàn)物，在大名鼎鼎的“AI六小虎”里，除了得到一眾資方支持的智譜，已經(jīng)有四家在大模型的迭代這件事上都按下了暫停鍵。至于在“AI六小虎”之外的其他中小規(guī)模AI廠(chǎng)商，現(xiàn)在在大模型這件事也幾乎都已經(jīng)沒(méi)有了聲響。從某種意義上來(lái)說(shuō)，在2023年如火如荼的“百模大戰(zhàn)”反而是個(gè)特殊現(xiàn)象。

此前在2023年春季，國(guó)內(nèi)AI賽道的“百模大戰(zhàn)”之所以會(huì)迅速成型，蓋因苦于缺乏標(biāo)的的投資機(jī)構(gòu)終于有了一個(gè)看起來(lái)無(wú)比光明的賽道可以押注，蜂擁而至的資本正是“百模大戰(zhàn)”的導(dǎo)火索。彼時(shí)，狂飆突進(jìn)十余年的互聯(lián)網(wǎng)行業(yè)投資踩下急剎車(chē)，大消費(fèi)賽道業(yè)已經(jīng)偃旗息鼓，以至于國(guó)內(nèi)投資圈流傳出了這樣一句話(huà)，“現(xiàn)在沒(méi)啥好項(xiàng)目，凡是能跑出來(lái)的東西早被投完了。”

這時(shí)候ChatGPT的出現(xiàn)就給市場(chǎng)注入了強(qiáng)心劑，投資機(jī)構(gòu)則期盼AI能夠成為下一個(gè)互聯(lián)網(wǎng)。當(dāng)ChatGPT的開(kāi)發(fā)商O(píng)penAI在做大語(yǔ)言模型（LLM）的情況下，擅長(zhǎng)Copy To China的部分國(guó)內(nèi)企業(yè)自然有樣學(xué)樣，搞起了那時(shí)候時(shí)髦的大模型。

只可惜AI大模型與互聯(lián)網(wǎng)雖然同屬于廣義上的科技，但兩者的底層邏輯完全不同，互聯(lián)網(wǎng)是輕資產(chǎn)的代表，而大模型卻是技術(shù)與資本雙密集。大模型的訓(xùn)練不僅是個(gè)技術(shù)活，需要有懂芯片、推理、模型、算法的人才，還有資源密集型的特征，要耗費(fèi)海量的電力、冷卻水，以及算力。

以Meta的LLama3為例，其8B和70B模型的訓(xùn)練就累積耗費(fèi)了770萬(wàn)個(gè)GPU訓(xùn)練時(shí)長(zhǎng)（GPU Hours），用的是英偉達(dá)的H100-80GB顯卡，按照AWS上12美元/機(jī)時(shí)的價(jià)格來(lái)算，這一訓(xùn)練的花費(fèi)高達(dá)9240萬(wàn)美元。也難怪從2024年開(kāi)始，一級(jí)市場(chǎng)的投資者開(kāi)始對(duì)大模型望而卻步，就正是因?yàn)橛?xùn)練大模型其實(shí)是巨頭才能玩得轉(zhuǎn)的游戲。

更加致命的是，這些巨頭還不太講武德，在2024年初夏搞起了價(jià)格戰(zhàn)，使得資源有限的中小廠(chǎng)商只能作壁上觀。到了2025年年初，DeepSeek憑借高效低成本的優(yōu)勢(shì)一舉成為AI行業(yè)的新標(biāo)桿，而更讓一眾AI廠(chǎng)商若坐針氈的是，DeepSeek的大模型還是開(kāi)源的。

開(kāi)源的DeepSeek就引發(fā)了基座大模型的價(jià)值重估，進(jìn)而終結(jié)了“百模大戰(zhàn)”。有相當(dāng)多的AI模型廠(chǎng)商都無(wú)法回答這樣一個(gè)問(wèn)題，那就是“為什么要舍棄低成本且開(kāi)源的DeepSeek，選擇你的模型？”

歸根結(jié)底，降成本、重落地路線(xiàn)的DeepSeek扛起了開(kāi)源模型的大旗，并實(shí)現(xiàn)了與OpenAI并跑，這也是以往開(kāi)源陣營(yíng)的阿里Qwen、Meta LLama都未曾做到的事情。既然無(wú)法在短期內(nèi)實(shí)現(xiàn)商業(yè)化，也沒(méi)辦法在DeepSeek的壓力下保持競(jìng)爭(zhēng)力，處于二三線(xiàn)的國(guó)內(nèi)AI廠(chǎng)商當(dāng)然就前途無(wú)“亮”了。

那么問(wèn)題就來(lái)了，為什么李開(kāi)復(fù)會(huì)認(rèn)為在一眾一線(xiàn)AI大廠(chǎng)里，最后可能只剩下DeepSeek、阿里巴巴、字節(jié)跳動(dòng)呢？

畢竟DeepSeek目前勢(shì)頭最強(qiáng)，選它是很正常。而阿里巴巴的通義千問(wèn)Qwen模型盡管屬于普通用戶(hù)可能不太了解，但在AI開(kāi)發(fā)者社區(qū)卻享有盛譽(yù)，大量開(kāi)發(fā)者甚至將其稱(chēng)之為“源神”，他們最新的旗艦?zāi)Ｐ蚎wen2.5-Max也已經(jīng)在Hugging Face上“屠榜”。

所以李開(kāi)復(fù)支持DeepSeek和阿里，其實(shí)是支持開(kāi)源、信息平權(quán)路線(xiàn)。畢竟當(dāng)訓(xùn)練超大規(guī)模的AI模型成為了只有巨頭才能玩轉(zhuǎn)的燒錢(qián)游戲時(shí)，如果都不開(kāi)源，他的零一萬(wàn)物可能就得出局了。

至于說(shuō)在DeepSeek和阿里之外，李開(kāi)復(fù)選擇了字節(jié)跳動(dòng)而非騰訊、百度，其實(shí)也有原因。不久前，百度文小言、騰訊元寶先后接入DeepSeek的決策，就已經(jīng)表明了他們對(duì)于自研模型的疑慮。至于堅(jiān)持閉源路線(xiàn)的字節(jié)跳動(dòng)會(huì)被李開(kāi)復(fù)選中，并不是因?yàn)槎拱竽Ｐ捅旧淼谋憩F(xiàn)鶴立雞群，而是由于字節(jié)跳動(dòng)旗下有抖音。

騰訊元寶在3月3日力壓DeepSeek，成為App Store國(guó)區(qū)免費(fèi)下載榜的冠軍之后，旋即就被豆包反超。而字節(jié)跳動(dòng)更是僅憑一招就扭轉(zhuǎn)了局勢(shì)，即在3月5日宣布抖音App接入豆包的AI能力，打通了流量平臺(tái)和AI產(chǎn)品。也就是說(shuō)字節(jié)跳動(dòng)方面不費(fèi)吹灰之力，就讓豆包獲得了海量的用戶(hù)。

日均使用時(shí)長(zhǎng)都突破150分鐘的抖音，無(wú)疑是字節(jié)跳動(dòng)在AI大模型領(lǐng)域立于不敗之地的最大倚仗，并且為了豆包，他們甚至在抖音上拒絕了其他AI產(chǎn)品的投放。所以除非抖音失去了國(guó)內(nèi)用戶(hù)的青睞，否則豆包大模型幾乎沒(méi)有失敗的道理。

一家技術(shù)領(lǐng)先（DeepSeek）、一家技術(shù)與資本兼?zhèn)洌ò⒗铮⒁患矣兄≈槐M的流量（字節(jié)跳動(dòng)），李開(kāi)復(fù)這次的選擇可謂是火眼金睛了。

【本文圖片來(lái)自網(wǎng)絡(luò)】

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.