國(guó)內(nèi)的基座大模型大概率將會(huì)只剩下DeepSeek、阿里巴巴、字節(jié)跳動(dòng)三家,這是創(chuàng)新工場(chǎng)董事長(zhǎng)李開(kāi)復(fù)近日在接受彭博社采訪(fǎng)時(shí)做出的判斷。
在人工智能走紅后,李開(kāi)復(fù)與周鴻祎、李彥宏等人一道,成為了國(guó)內(nèi)互聯(lián)網(wǎng)行業(yè)中經(jīng)常對(duì)其評(píng)頭論足的大佬。那么這一次他關(guān)于未來(lái)國(guó)內(nèi)大模型市場(chǎng)將從群雄逐鹿的“百模大戰(zhàn)”發(fā)展至只剩下DeepSeek、阿里巴巴、字節(jié)跳動(dòng)的三足鼎立,到底是無(wú)稽之談、還是不可避免呢?
事實(shí)上,李開(kāi)復(fù)對(duì)于這番論斷極有可能是很有信心的,如若不然,他領(lǐng)導(dǎo)的零一萬(wàn)物也不會(huì)成為全面擁抱DeepSeek旗下大模型的第一個(gè)“AI六小虎”。早在今年年初,也就是DeeppSeek-R1尚未出圈時(shí),李開(kāi)復(fù)就已宣布零一萬(wàn)物未來(lái)不會(huì)再做萬(wàn)億參數(shù)模型的預(yù)訓(xùn)練,而是將專(zhuān)注在務(wù)實(shí)的、小而快的、能夠以商業(yè)性?xún)r(jià)比來(lái)評(píng)估的模型。
其實(shí)不僅僅是零一萬(wàn)物,在大名鼎鼎的“AI六小虎”里,除了得到一眾資方支持的智譜,已經(jīng)有四家在大模型的迭代這件事上都按下了暫停鍵。至于在“AI六小虎”之外的其他中小規(guī)模AI廠(chǎng)商,現(xiàn)在在大模型這件事也幾乎都已經(jīng)沒(méi)有了聲響。從某種意義上來(lái)說(shuō),在2023年如火如荼的“百模大戰(zhàn)”反而是個(gè)特殊現(xiàn)象。
此前在2023年春季,國(guó)內(nèi)AI賽道的“百模大戰(zhàn)”之所以會(huì)迅速成型,蓋因苦于缺乏標(biāo)的的投資機(jī)構(gòu)終于有了一個(gè)看起來(lái)無(wú)比光明的賽道可以押注,蜂擁而至的資本正是“百模大戰(zhàn)”的導(dǎo)火索。彼時(shí),狂飆突進(jìn)十余年的互聯(lián)網(wǎng)行業(yè)投資踩下急剎車(chē),大消費(fèi)賽道業(yè)已經(jīng)偃旗息鼓,以至于國(guó)內(nèi)投資圈流傳出了這樣一句話(huà),“現(xiàn)在沒(méi)啥好項(xiàng)目,凡是能跑出來(lái)的東西早被投完了。”
這時(shí)候ChatGPT的出現(xiàn)就給市場(chǎng)注入了強(qiáng)心劑,投資機(jī)構(gòu)則期盼AI能夠成為下一個(gè)互聯(lián)網(wǎng)。當(dāng)ChatGPT的開(kāi)發(fā)商O(píng)penAI在做大語(yǔ)言模型(LLM)的情況下,擅長(zhǎng)Copy To China的部分國(guó)內(nèi)企業(yè)自然有樣學(xué)樣,搞起了那時(shí)候時(shí)髦的大模型。
只可惜AI大模型與互聯(lián)網(wǎng)雖然同屬于廣義上的科技,但兩者的底層邏輯完全不同,互聯(lián)網(wǎng)是輕資產(chǎn)的代表,而大模型卻是技術(shù)與資本雙密集。大模型的訓(xùn)練不僅是個(gè)技術(shù)活,需要有懂芯片、推理、模型、算法的人才,還有資源密集型的特征,要耗費(fèi)海量的電力、冷卻水,以及算力。
以Meta的LLama3為例,其8B和70B模型的訓(xùn)練就累積耗費(fèi)了770萬(wàn)個(gè)GPU訓(xùn)練時(shí)長(zhǎng)(GPU Hours),用的是英偉達(dá)的H100-80GB顯卡,按照AWS上12美元/機(jī)時(shí)的價(jià)格來(lái)算,這一訓(xùn)練的花費(fèi)高達(dá)9240萬(wàn)美元。也難怪從2024年開(kāi)始,一級(jí)市場(chǎng)的投資者開(kāi)始對(duì)大模型望而卻步,就正是因?yàn)橛?xùn)練大模型其實(shí)是巨頭才能玩得轉(zhuǎn)的游戲。
更加致命的是,這些巨頭還不太講武德,在2024年初夏搞起了價(jià)格戰(zhàn),使得資源有限的中小廠(chǎng)商只能作壁上觀。到了2025年年初,DeepSeek憑借高效低成本的優(yōu)勢(shì)一舉成為AI行業(yè)的新標(biāo)桿,而更讓一眾AI廠(chǎng)商若坐針氈的是,DeepSeek的大模型還是開(kāi)源的。
開(kāi)源的DeepSeek就引發(fā)了基座大模型的價(jià)值重估,進(jìn)而終結(jié)了“百模大戰(zhàn)”。有相當(dāng)多的AI模型廠(chǎng)商都無(wú)法回答這樣一個(gè)問(wèn)題,那就是“為什么要舍棄低成本且開(kāi)源的DeepSeek,選擇你的模型?”
歸根結(jié)底,降成本、重落地路線(xiàn)的DeepSeek扛起了開(kāi)源模型的大旗,并實(shí)現(xiàn)了與OpenAI并跑,這也是以往開(kāi)源陣營(yíng)的阿里Qwen、Meta LLama都未曾做到的事情。既然無(wú)法在短期內(nèi)實(shí)現(xiàn)商業(yè)化,也沒(méi)辦法在DeepSeek的壓力下保持競(jìng)爭(zhēng)力,處于二三線(xiàn)的國(guó)內(nèi)AI廠(chǎng)商當(dāng)然就前途無(wú)“亮”了。
那么問(wèn)題就來(lái)了,為什么李開(kāi)復(fù)會(huì)認(rèn)為在一眾一線(xiàn)AI大廠(chǎng)里,最后可能只剩下DeepSeek、阿里巴巴、字節(jié)跳動(dòng)呢?
畢竟DeepSeek目前勢(shì)頭最強(qiáng),選它是很正常。而阿里巴巴的通義千問(wèn)Qwen模型盡管屬于普通用戶(hù)可能不太了解,但在AI開(kāi)發(fā)者社區(qū)卻享有盛譽(yù),大量開(kāi)發(fā)者甚至將其稱(chēng)之為“源神”,他們最新的旗艦?zāi)P蚎wen2.5-Max也已經(jīng)在Hugging Face上“屠榜”。
所以李開(kāi)復(fù)支持DeepSeek和阿里,其實(shí)是支持開(kāi)源、信息平權(quán)路線(xiàn)。畢竟當(dāng)訓(xùn)練超大規(guī)模的AI模型成為了只有巨頭才能玩轉(zhuǎn)的燒錢(qián)游戲時(shí),如果都不開(kāi)源,他的零一萬(wàn)物可能就得出局了。
至于說(shuō)在DeepSeek和阿里之外,李開(kāi)復(fù)選擇了字節(jié)跳動(dòng)而非騰訊、百度,其實(shí)也有原因。不久前,百度文小言、騰訊元寶先后接入DeepSeek的決策,就已經(jīng)表明了他們對(duì)于自研模型的疑慮。至于堅(jiān)持閉源路線(xiàn)的字節(jié)跳動(dòng)會(huì)被李開(kāi)復(fù)選中,并不是因?yàn)槎拱竽P捅旧淼谋憩F(xiàn)鶴立雞群,而是由于字節(jié)跳動(dòng)旗下有抖音。
騰訊元寶在3月3日力壓DeepSeek,成為App Store國(guó)區(qū)免費(fèi)下載榜的冠軍之后,旋即就被豆包反超。而字節(jié)跳動(dòng)更是僅憑一招就扭轉(zhuǎn)了局勢(shì),即在3月5日宣布抖音App接入豆包的AI能力,打通了流量平臺(tái)和AI產(chǎn)品。也就是說(shuō)字節(jié)跳動(dòng)方面不費(fèi)吹灰之力,就讓豆包獲得了海量的用戶(hù)。
日均使用時(shí)長(zhǎng)都突破150分鐘的抖音,無(wú)疑是字節(jié)跳動(dòng)在AI大模型領(lǐng)域立于不敗之地的最大倚仗,并且為了豆包,他們甚至在抖音上拒絕了其他AI產(chǎn)品的投放。所以除非抖音失去了國(guó)內(nèi)用戶(hù)的青睞,否則豆包大模型幾乎沒(méi)有失敗的道理。
一家技術(shù)領(lǐng)先(DeepSeek)、一家技術(shù)與資本兼?zhèn)洌ò⒗铮⒁患矣兄≈槐M的流量(字節(jié)跳動(dòng)),李開(kāi)復(fù)這次的選擇可謂是火眼金睛了。
【本文圖片來(lái)自網(wǎng)絡(luò)】
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.