長(zhǎng)按即可參與
作者:門捷列夫?qū)W徒
來源:雪球
自DS出現(xiàn)以后,我看網(wǎng)上沒有很好的一篇文章去總結(jié)目前中美ai敘事的差異以及背后的算力需求。簡(jiǎn)單來說:
Ch-i-na Ai敘事:DS開源帶來的LLM平權(quán)以及由此延伸的各種ds蒸餾小模型端側(cè)(包括一體機(jī))、邊緣側(cè)的ai應(yīng)用落地,大有全面開花之勢(shì)。
Ch-i-na算力:H20和國(guó)產(chǎn)As-ic就行,甚至端側(cè)還有更簡(jiǎn)單的方案。當(dāng)然杰文森悖論還是適用的,大廠加大數(shù)據(jù)中心投入。
北美Ai敘事:繼續(xù)大力出奇跡通往AGI,各種多模態(tài)高階模型推出,萬億參數(shù)大模型繼續(xù)走起。
北美算力:高端NV卡仍然供不應(yīng)求,GP-Us are me-l-t-i-ng。。。
現(xiàn)在的gap在于:顯然北美這條路出成果沒這么快,而國(guó)內(nèi)ai敘事(還有考慮到我們的文化和商業(yè)環(huán)境)出成果很快,畢竟國(guó)人比較務(wù)實(shí),成本要算得過來,朱xh不是說了嘛,ai會(huì)議紀(jì)要就能一個(gè)月賺幾千萬,這種ai應(yīng)用需要毛線NV Ru-b-in。
所以在這種微妙的北美空檔期,對(duì)NV的質(zhì)疑就比較多了,再疊加DS和Qw-en這種百億參數(shù)LLM模型達(dá)到了和gpt4一樣的效果。。。不得不贊嘆國(guó)人Ai in-f-ra能力。
另外DS的Ai in-f-ra能力可能是一個(gè)變數(shù)
另外還有一些關(guān)鍵問題:那就是隨著DS的出現(xiàn)和國(guó)產(chǎn)芯片的崛起,我們究竟還需不需要高端NV芯片(比如GB300),是不是以后H20和國(guó)產(chǎn)芯片就夠用了?DS究竟改變了算力什么又沒有改變什么。以及像zj、ali這種只能大規(guī)模部署H20的將來和北美csp大規(guī)模部署GB300和A100的究竟有什么差距?
先說結(jié)論:1、如果ai應(yīng)用只是LLM ch-a-t-b-ot(比如De-e-p-s-e-ek)這種形式。或,2、幾乎所有的端側(cè)ai推理(自動(dòng)駕駛除外)。那么無論是H20或910c其實(shí)真的夠用了,甚至一些異構(gòu)芯片比如fp-ga+ri-sc-v都能跑一些簡(jiǎn)單的例如ai端側(cè)(包含一體機(jī))的推理。這也是為什么前段時(shí)間有聲音說中國(guó)的ai敘事和北美不一樣,或我們?cè)跊]有高端芯片的前提下依然實(shí)現(xiàn)了ai大規(guī)模應(yīng)用。這也是投資人在詬病NV股價(jià)預(yù)期的一個(gè)關(guān)鍵背景。
那么什么情況下H20和910c不太行呢?
1、像GPT-4o這種文生圖以及大部分多模態(tài)應(yīng)用。尤其是4o這種需要高并發(fā)并實(shí)時(shí)生成的應(yīng)用,用H20卡不說(需要3-5秒而H100只需要1秒),且需要高顯存+大寬帶,這時(shí)候就得用GB300這種芯片來跑。
所以各位小伙伴期待的國(guó)內(nèi)版文生圖可能就要等等了,哪怕推出了估計(jì)也會(huì)卡得要死。主要是還是卡不行。
其實(shí)你看tx的微信就是聊天,所以llm對(duì)于他們暫時(shí)就夠用。而zj因?yàn)槭且曨l起家,肯定對(duì)于高端卡的需求是更大的。前面沒說的是Ai視頻生成更需要500+tf-l-o-ps和48G顯存,更需要NV的高端卡。
這也是為什么我們直到現(xiàn)在都沒看到國(guó)內(nèi)的csp推出多模態(tài)的Ai應(yīng)用。
有一個(gè)變數(shù)是DS的Ai in-f-ra的能力,如果V4是多模態(tài)而又不耗卡(很難想象是否能做到),這也是對(duì)NV的致命一擊。
2、千億乃至萬億參數(shù)大模型的訓(xùn)練(比如GPT5)。這個(gè)很好理解了,for AGI需要繼續(xù)加大算力投入,NV高階芯片主要是互聯(lián)厲害,非常有利于訓(xùn)練百萬卡集群的大模型。
3、Ai for Sc-i-e-n-ce。比如Ai醫(yī)療生物科技里面我非常看好的Al-p-h-a-F-o-ld3,可以預(yù)測(cè)大分子相互作用的Ai算法對(duì)于創(chuàng)新藥研發(fā)和合成生物學(xué)的選品可能是革命性的影響(順便吐槽一下晶泰這種小分子還屬于上一代ai敘事幾乎沒法用于實(shí)戰(zhàn))。另外一些手術(shù)機(jī)器人或者多模態(tài)的Ai診斷因?yàn)槠涞脱訒r(shí)的需求(畢竟做手術(shù)嘛,1秒都寶貴)。
4、高階Ag-e-nt應(yīng)用。主打一個(gè)高并發(fā)(例如Ai游戲可能1秒鐘內(nèi)有數(shù)百萬個(gè)Ai NPC交互)、超長(zhǎng)上下文記憶(例如Ai醫(yī)療診斷,法律判決、超復(fù)雜辦公場(chǎng)景解決輸出,ai可能一下子需要記住數(shù)萬個(gè)to-k-en)、多模態(tài)(比如有視頻介入的ag-e-nt)。反之就是一些簡(jiǎn)單的ag-e-nt,比如朱xh舉例的會(huì)議紀(jì)要ag-e-nt、簡(jiǎn)單的做題ag-e-nt等等,用國(guó)產(chǎn)芯片足矣。
所以總結(jié)一下:當(dāng)出現(xiàn)高并發(fā)、多模態(tài)、超低延時(shí)需求的場(chǎng)景的時(shí)候,NV的高端卡是很吃香的,尤其是多模態(tài),單次交互可能就需要500 TF-l-o-ps(H20也就750 TF-L-o-ps,可能一次就用光了。。。)
可以看到1、2、3、4也就1剛剛有些苗頭,234出成果都沒那么快。如果只是基于ch-a-t-b-ot這種llm模型那無疑是DS(還有我們特色的Ai)就完勝了:成本比你低、落地比你快、賺錢比你有路子,比如tx的元寶一接入DS就有2000萬DAU日活,這就使得無論是投資人甚至是北美csp自己都在懷疑自己的路線是否值得(太正常了,都是人嘛),所以最近北美算力鬼故事很多,而國(guó)產(chǎn)算力一開始就是瞄著落地去的,所以ca-p-ex反而更扎實(shí)。
但一旦上面的1234有了突破,我相信情況馬上就會(huì)反轉(zhuǎn),這也是為什么像國(guó)內(nèi)csp大廠一直不敢大規(guī)模部署國(guó)產(chǎn)算力而要搶NV卡的原因(這跟三大運(yùn)營(yíng)商不一樣,運(yùn)營(yíng)商幾乎都配國(guó)產(chǎn)),我們假設(shè)GPT-4o文生圖是一個(gè)巨大的賺錢利器,很難想象國(guó)內(nèi)不去fo-l-l-ow還停留在ch-a-t-b-ot模式,而這必然會(huì)帶來高階NV卡的供不應(yīng)求而動(dòng)搖國(guó)內(nèi)各種端側(cè)的ds敘事。此外再次強(qiáng)調(diào)DS V4可能的Ai in-f-ra能力看看能否繼續(xù)撼動(dòng)NV卡的邏輯,這確實(shí)是一個(gè)很大的變數(shù)。
雪球三分法是雪球基于“長(zhǎng)期投資+資產(chǎn)配置”推出的基金配置理念,通過資產(chǎn)分散、市場(chǎng)分散、時(shí)機(jī)分散這三大分散進(jìn)行基金長(zhǎng)期投資,從而實(shí)現(xiàn)投資收益來源多元化和風(fēng)險(xiǎn)分散化。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.