DeepSeek大火之后,為模型訓練和推理市場帶來計算量上的大幅增長。根據(jù)黃仁勛的測算,模型推理需要的算力消耗比我們當下以為的還要多100倍。
面對DeepSeek機遇,算力中心企業(yè)卻喜憂參半。
喜的是算力需求總量激增,DeepSeek催生了Token經(jīng)濟,算力可以像使用水電一樣按量計費,用戶根據(jù)消耗的AI算力資源(以Token為單位)付費,讓智算中心不局限于租售裸金屬的傳統(tǒng)商業(yè)模式,帶來了新的商業(yè)機會。
憂的是基于DeepSeek等模型的AI服務,采用“薄利多銷”的模式,讓智算中心化身成“token工廠”,硬件與后訓練、推理等場景需要從AI infra層面進一步調(diào)優(yōu),解決在線AI服務成本高、異構算力統(tǒng)一納管難度大等問題。
因此,各地智算中心集群能否承接住DeepSeek催生的大量后訓練、推理等需求,將決定token經(jīng)濟中誰主沉浮。
3月26日,“異構智算,縱橫未來”——異構智算產(chǎn)業(yè)生態(tài)聯(lián)盟走進燧弘華創(chuàng)慶陽綠色智算中心,共同見證了DeepSeek大模型落地的新突破,以及異構算力在超大規(guī)模智算場景中從技術攻堅到產(chǎn)業(yè)化應用的歷史性跨越。
硬件方面,此次慶陽項目中交付的聯(lián)想問天 WA5480 G3服務器,采用了2顆第四代英特爾?至強?可擴展處理器,內(nèi)置加速性能更進一步,可以優(yōu)化DeepSeek落地的推理表現(xiàn)。
技術方面,燧弘華創(chuàng)慶陽綠色智算中心部署了多元異構算力調(diào)度平臺,依托聯(lián)想萬全異構智算平臺在推理加速、訓練優(yōu)化、斷點續(xù)訓、內(nèi)核級虛擬化等大模型推理優(yōu)化場景的明顯優(yōu)勢,為各行業(yè)應用DeepSeek構建了高效能、可持續(xù)的算力底座。
借此契機,我們深入了解一下,token經(jīng)濟,為何風起隴東。
AI算力作為數(shù)字經(jīng)濟的核心生產(chǎn)要素,其發(fā)展態(tài)勢與基礎設施建設緊密交織。DeepSeek點燃AI算力需求之后,作為東數(shù)西算八大國家級樞紐之一的“中國算谷”慶陽,受到了前所未有的關注。
對于慶陽數(shù)據(jù)中心企業(yè)來說,抓住DeepSeek機會,當務之急是要把“服務器農(nóng)場”變成“token工廠”,也就是從租賃裸金屬資源的傳統(tǒng)模式,拓展按token使用量計費的新AI服務模式。
之所以出現(xiàn)這種變化,一是客戶變了,DeepSeek使得企業(yè)AI滲透率從頭部廠商向中小企業(yè)擴散,而中小企業(yè)需要的算力規(guī)模和硬件數(shù)量相對少,像水電費一樣用多少算力資源付多少錢,這種動態(tài)、輕量化的AI服務,需要對異構算力資源進行統(tǒng)一、高效、精益的納管。
二是AI任務變了,DeepSeek讓計算任務從預訓練,轉向了后訓練和推理,而DeepSeek的全新模型架構,硬件必須針對性地優(yōu)化、調(diào)優(yōu),不然算力服務商提供Maas服務的成本會很高,無法真的靠賣token賺到錢,AI算力也很難普惠。
與此同時,智算供應鏈也風云變幻。海外硬件供應鏈也愈發(fā)不穩(wěn)定,面臨越來越嚴苛的限制,將DeepSeek部署在國產(chǎn)智算底座是大勢所趨。但國產(chǎn)硬件的架構多、彼此生態(tài)不互通、異構算力合池訓練存在資源墻。
因此,慶陽的算力中心企業(yè)想要轉型“token工廠”,開拓DeepSeek服務的新商業(yè)模式,助力行業(yè)智能化,必須解決異構智算與AI大模型深度融合的技術挑戰(zhàn)。
解決全國AI算力需求,東數(shù)西算工程正重構算力版圖。其中,“中國算谷”慶陽備受矚目,一是算力夠用,二是算力好用。
自2023年起,慶陽持續(xù)打造算力集群基礎設施,目前慶陽市的總算力規(guī)模,已達5.1萬PFLOPS,從東數(shù)西算樞紐末位躍升至全國第一方陣,為數(shù)字經(jīng)濟發(fā)展筑牢“智算”底座。其中,燧弘華創(chuàng)打造的慶陽綠色智算中心,已成功構建超2萬P的高性能算力供給規(guī)模。
讓千行百業(yè)覺得算力好用,敢于把DeepSeek接入自身場景,燧弘華創(chuàng)慶陽綠色智算中心協(xié)同聯(lián)想萬全異構智算平臺,突破算力瓶頸,構建了好用的異構智算底座。
首先是算力充沛,讓千行萬業(yè)都用得上。比如此次慶陽項目中聯(lián)想問天 WA5480 G3服務器,搭載的第四代英特爾?至強?可擴展處理器,擁有強大的計算能力,內(nèi)置了眾多加速器,是智算中心建設的首選。
其次是優(yōu)化技術強,算效高、單位token的算力成本低,才能在保證模型效果的同時,實現(xiàn)算力普惠,讓中小企業(yè)或實體行業(yè)用得好,也用得起。
燧弘華創(chuàng)慶陽綠色智算中心作為聯(lián)想AI基礎設施新技術的試點之一,就充分展現(xiàn)了聯(lián)想的技術創(chuàng)新與研發(fā)的快速響應能力,當?shù)氐谝粫r間實現(xiàn)了兩個突破:
一是突破算力瓶頸,通過訪存優(yōu)化、顯存優(yōu)化、PCIe 5.0全互聯(lián)架構創(chuàng)新以及精選SGLang框架中性能最優(yōu)算子等諸多領先創(chuàng)新方式,進一步提升單機服務器運行大模型的性能,3000并發(fā)下總吞吐量超8000 tokens/s,持續(xù)提升DeepSeek滿血版用戶體驗,刷新行業(yè)標準。
二是突破異構算力“資源墻”。聯(lián)想萬全異構智算平臺可以統(tǒng)一納管異構算力,實現(xiàn)對異構計算集群的高效管理調(diào)度和可用性保障,讓伙伴能夠為客戶提供融合、穩(wěn)定的通用、智能和科學算力。
產(chǎn)業(yè)鏈協(xié)作方面,慶陽依托異構智算產(chǎn)業(yè)生態(tài)聯(lián)盟,得到了國產(chǎn)智算產(chǎn)業(yè)全鏈條的緊密支持,聯(lián)想萬全生態(tài)從IaaS平臺、AI訓練與推理到行業(yè)場景解決方案的全覆蓋,為燧弘華創(chuàng)慶陽智算中心保駕護航,從而為慶陽打造東數(shù)西算模范節(jié)點注入了強勁動力。
正是在異構智算產(chǎn)業(yè)生態(tài)的合力托舉下,慶陽得以搶占先機,憑借“夠用+好用”的算力,抓住DeepSeek落地需求,加速算力消納,真正把AI技術轉變成了當?shù)氐膖oken經(jīng)濟紅利。
“夠用+好用”的智算集群,成就了慶陽作為國家級數(shù)算樞紐之一,從末位到第一梯隊的發(fā)展奇跡,也為當?shù)財?shù)據(jù)中心企業(yè)探索以token使用量為主的全新商業(yè)模式,提供有力支撐。
而燧弘華創(chuàng)與聯(lián)想的結緣,就是“慶陽奇跡”的一個重要里程碑事件。雙方此前在慶陽所做的大量準備工作,是慶陽智算規(guī)模快速壯大的基礎,也是隴東數(shù)字經(jīng)濟借勢Deepseek起飛的前提。
聯(lián)想作為燧弘華創(chuàng)的重要資源與伙伴,為慶陽構建面向AI時代的基礎設施,帶來了四種助力:
1.先進。技術與產(chǎn)品先進,比如聯(lián)想萬全異構智算平臺在推理加速、訓練優(yōu)化、斷點續(xù)訓、內(nèi)核級虛擬化等大模型推理優(yōu)化場景具有明顯優(yōu)勢,DeepSeek后訓練場景中,調(diào)優(yōu)技術使得訓練MFU高達60%以上;推理場景中,聯(lián)想AI服務器可以全速運轉滿血版DeepSeek R1大模型,極限吞吐量可超8000 tokens/s。這些先進技術,支撐燧弘華創(chuàng)慶陽綠色智算中心,成為東數(shù)西算樞紐中第一個全智算中心,及時抓住Deepseek的AI普惠浪潮和算力需求。
2.全面。聯(lián)想正全力推進“一橫五縱”戰(zhàn)略布局,全面推出覆蓋萬全異構智算平臺,以及涵蓋服務器、存儲、數(shù)據(jù)網(wǎng)絡、軟件及超融合、支持運維服務等在內(nèi)的全方位基礎設施解決方案,可以滿足燧弘華創(chuàng)建設先進綠色算力中心的一體化需求,從而加速慶陽在一年多時間內(nèi)就躋身全國“東數(shù)西算”樞紐的第一梯隊。
3.開放。萬全異構智算平臺對通用計算集群、科學計算集群和AI算力集群進行統(tǒng)一管理,并對多種CPU、GPU、DPU等處理器進行異構管理調(diào)度,更符合國內(nèi)落地deepseek的實際算力需求,更具前瞻性。正如英特爾高性能計算行業(yè)負責人所說,將超算與智算的能力相結合,以超智融合技術來滿足在人工智能高速發(fā)展背景下的各行業(yè)多元算力需求。這也是聯(lián)想及其伙伴的共同努力方向。
4.服務。在合作過程中,聯(lián)想24小時響應燧弘華創(chuàng)的需求,燧弘華創(chuàng)的拼搏精神+聯(lián)想的周到服務,共同推動了慶陽智算產(chǎn)業(yè)的躍升奇跡。
在萬全平臺上,構筑算力通衢;以萬全生態(tài),護航DeepSeek落地千行百業(yè)。這是為什么token經(jīng)濟能在春節(jié)后風起隴東,帶火了“中國算谷”慶陽。
慶陽的努力與初見成果,驗證了“token經(jīng)濟”在東數(shù)西算戰(zhàn)略下的可行性,未來可復制至其他樞紐節(jié)點。不久的將來,我們會看到在異構智算底座上,token經(jīng)濟,風起智能中國。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.