99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

DeepSeek攪局,算力生意玩法大變樣

0
分享至

2025年的第一個季度,就這樣嗖地一下過完了~



作為算力圈的“老黃牛”,過去的一年,老丘生意可謂風生水起。

可是轉過年來,老丘敏銳的感覺到:有點不對勁,生意明顯少多了。



這個不對勁的源頭,其實就是DeepSeek

過去兩年,國內各種大模型百花齊放,訓練需求激增,大巨頭、小獨角、傳統(tǒng)IT大廠,甚至行業(yè)大甲方們,都想自己訓練個模型出出風頭。

所以,老丘的“賣鏟子”生意也很火。



可是,自從DeepSeek新春炸場以來,風云突變,人們發(fā)現(xiàn)這市場上根本不需要那么多大模型,有兩三個好用的就夠了。

于是乎,很多大規(guī)模訓練的需求,一夜之間退潮了,取而代之的大量的后訓練和推理需求。



老丘很不幸成為這波退潮的“受害者”,他之前手里的那些智算中心,當初建設的初衷都是打譜做預訓練用的。

現(xiàn)在客戶上來就要推理,尤其還要看跑DeepSeek的效果,純搞訓練不香了。



每次被客戶拷問,老丘都無言以對,眼看Q1就要結束了,也沒找到破局之道。

直到3月底,他去參加了一場會…

這場不同尋常的會,讓老丘的格局瞬間打開了。











這是一場怎樣的會議呢?

首先,舉辦的地點不尋常——

會議的舉辦地設在甘肅慶陽,瞬間就吊起了老丘的胃口。

下了車,老丘看到那一排排的數(shù)據中心機房和墻上那些熟悉的LOGO,就興奮起來了。



慶陽今非昔比,這里可是國家“東數(shù)西算”工程的八大樞紐節(jié)點之一。

作為“中國算谷”,慶陽的智算中心是如何應對DeepSeek帶來的新需求?老丘覺的這肯定很值得借鑒。



第二、參觀的項目不尋常——

抵達的第一站,老丘要去參觀的是燧弘華創(chuàng)在慶陽樞紐的綠色智算中心。

要知道,燧弘華創(chuàng)是首家入駐慶陽的數(shù)據中心企業(yè),目前已經投產2萬P高端算力,而且全部售罄。



老丘心里一邊羨慕著同行,一邊近距離觀摩拍照。



參觀過程中,老丘了解到,在智算中心的落地過程中,燧弘華創(chuàng)在技術研發(fā)層面深耕細作。

并與聯(lián)想協(xié)同創(chuàng)新,基于萬全異構智算平臺,輸出融合、穩(wěn)定和高效的算力。



最終,大家的目光都被數(shù)據中心前廳的一組展示設備吸引,老丘也走過去圍觀。

原來這里展示的聯(lián)想為燧弘華創(chuàng)定制的,搭載了燧原國產算力卡的異構智算服務器。



第三,會議的干貨不尋常——

參觀結束,接下來進入干貨滿滿的會議階段。

以前開會,老丘就是捧個場,一落座就犯困。可這次,老丘是全程豎著耳朵從頭聽到尾,而且頻頻拍照。



聯(lián)想專家的分享,講到了老丘真正關注的兩大問題。

①如何優(yōu)化智算集群,滿足類似DeepSeek這樣“潑天”的推理需求。

②如何優(yōu)化智算一體機,滿足DeepSeek等大模型本地化部署的需求。

這兩方面,聯(lián)想都給出了深度實踐后的最佳答案。

▌第一通過「聯(lián)想萬全異構智算平臺」提升千卡、萬卡集群的可管理性和可伸縮性。

從而更加靈活地調度算力資源,滿足模型后訓練、推理等業(yè)務對算力的新需求:突發(fā)性強、零散度高、彈性要求高。



同時,萬全異構智算平臺支持豐富的GPU、AI加速卡生態(tài),通過“異構”,可引入不同精度的算力,滿足當下和未來推理場景對低精度算力的要求。

而且,萬全異構智算平臺還支持智算、高性能計算異構,從而讓不同精度的算力都能最大化使用。



在現(xiàn)場,聯(lián)想專家還實操演示了燧弘華創(chuàng)基于萬全異構智算平臺定制的管理平臺,142節(jié)點,1136張卡,納管、監(jiān)控、調度,一氣呵成。

老丘看罷直呼內行,預訓練時代大家為了秀肌肉,總喜歡整什么萬卡、十萬卡,現(xiàn)在到了推理時代,把千卡優(yōu)化好,效率最大化才是王道。



▌第二,用「混合精度量化」策略,提升推理速度。

其核心的原理就是:不是所有權重和激活都用同樣的精度,而是根據重要性使用不同的精度(FP16/BF16/FP8/INT8/INT4等)。

聯(lián)想可以根據不同模型的特點、智算中心算力卡的精度支持情況,為運營者制定一套推理效率最大化的量化策略。



簡單講就是在關鍵地方(離群點)保留高精度,在其他地方用低精度,配合圖結構優(yōu)化和自動編譯工具,提升推理速度、減少算力消耗。

聯(lián)想給出了實測結果,經過混合精度量化的DeepSeek 32B蒸餾模型,相比原模型吞吐提升近100%,端到端延遲降低50%,且模型性能近乎無損。



▌第三通過「通信計算重疊」和「訪存優(yōu)化」,來提升算力利用率(MFU)

通信計算重疊,就是在計算單元(CPU/GPU)執(zhí)行當前任務的同時,后臺異步傳輸下一階段需要的數(shù)據(模型參數(shù)、中間結果等),讓通信和計算時間部分或完全重疊。

從而充分利用硬件并行能力,隱藏通信延遲,提升系統(tǒng)整體吞吐。



訪存優(yōu)化,尤其針對長序列場景,通過分塊計算和算子融合,就近緩存數(shù)據,并采用按需重計算,顯著減少顯存開銷,降低通信延遲。

好比把大任務拆成小塊干,把常用的東西放手邊,不重要的結果就不存,等需要時再算,這樣能省很多空間,還能干活更快更流暢。



▌第四通過「內核態(tài)虛擬化」,精細化調度算力,并嚴格隔離故障。

聯(lián)想萬全異構智算平臺,還提供了一項獨門絕技:內核態(tài)虛擬化

可實現(xiàn)顯存1MB粒度、算力1%精度隔離,虛擬化性能損失低于3%,并具備嚴格的故障隔離性。



這波操作,讓異構智算平臺可以更細粒度地調度算力,滿足后DeepSeek時代大模型后訓練和推理對算力小快靈的需求。

比如在會議現(xiàn)場,老丘就親眼目睹了聯(lián)想專家用單GPU運行100個模型任務,效率跑滿,靈活性超強。



▌第五,通過極致優(yōu)化,提升DeepSeek一體機吞吐,滿足本地化部署需求。

在一體機層面,聯(lián)想也下足了功夫。

聯(lián)想專家現(xiàn)場演示,單機8卡運行滿血版DeepSeek R1,3000并發(fā)下,極限吞吐高達8000+ TPS。



更讓老丘佩服的一點在于,聯(lián)想的一體機測試,不僅限于展示并發(fā)和極限吞吐,還提供了與真實業(yè)務場景相匹配的模擬測試。

除了最通用的聊天會話場景,還包括了代碼生成、文檔翻譯、文檔解析、知識庫應用等等,每種場景都給出了明確的指標。



就這樣,不管是智算集群優(yōu)化用于大規(guī)模運營,還是一體機優(yōu)化用于本地化部署,聯(lián)想都拿出了最優(yōu)解。

一天的會議下來,老丘徹底想明白接下來怎么玩了。

跟著聯(lián)想走,跟著萬全異構智算的方案走,把自己手里的算力重新優(yōu)化,適配推理和后訓練新需求……

2025,我又可以啦!



特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
斯諾克世錦賽:趙心童一階段5-3領先雷佩凡,二階段今天17點開始

斯諾克世錦賽:趙心童一階段5-3領先雷佩凡,二階段今天17點開始

直播吧
2025-04-26 00:37:05
董大姐為什么那么痛恨海歸,答案讓人哭笑不得

董大姐為什么那么痛恨海歸,答案讓人哭笑不得

師說新知
2025-04-25 13:14:24
世體:皇馬奪冠后球迷可能進行慶祝活動,馬德里警察將繼續(xù)駐守

世體:皇馬奪冠后球迷可能進行慶祝活動,馬德里警察將繼續(xù)駐守

懂球帝
2025-04-25 11:10:12
19點58分!2大強將加盟遼寧,即將抵達沈陽,猛將馳援沖冠添砝碼

19點58分!2大強將加盟遼寧,即將抵達沈陽,猛將馳援沖冠添砝碼

璞玉話體壇
2025-04-25 20:29:14
斯諾克賽程:決出首席8強,中國軍團3人出戰(zhàn),趙心童PK雷佩凡!

斯諾克賽程:決出首席8強,中國軍團3人出戰(zhàn),趙心童PK雷佩凡!

劉姚堯的文字城堡
2025-04-25 08:00:10
安徽一交通事故責任認定引質疑:民警和司法鑒定人被處罰,已中止訴訟

安徽一交通事故責任認定引質疑:民警和司法鑒定人被處罰,已中止訴訟

澎湃新聞
2025-04-25 14:10:28
閑魚變“黃魚”,表面賣女生自用自行車,實則做著見不得人的交易

閑魚變“黃魚”,表面賣女生自用自行車,實則做著見不得人的交易

西齋青簡
2024-05-07 11:55:02
華為這個賣559元的1TB新品,把全網友都看傻了

華為這個賣559元的1TB新品,把全網友都看傻了

鋒潮評測
2025-04-24 18:37:04
人家水蜜桃,某網紅穿讓人欲罷不能,網友:誰頂?shù)米。?>
    </a>
        <h3>
      <a href=說真話的小陳
2025-04-13 15:05:12
李佩霞三年后出獄,網友推測:很有可能會走網紅路線,做帶貨直播

李佩霞三年后出獄,網友推測:很有可能會走網紅路線,做帶貨直播

丫頭舫
2025-04-24 11:59:17
塵埃落定!43歲少帥空降皇馬!1500萬違約+2億預算,沖歐冠三連

塵埃落定!43歲少帥空降皇馬!1500萬違約+2億預算,沖歐冠三連

阿泰希特
2025-04-25 11:40:54
佩洛西為何如此恨中國?33年前在北京被拘留數(shù)日,罪名涉嫌流氓罪

佩洛西為何如此恨中國?33年前在北京被拘留數(shù)日,罪名涉嫌流氓罪

素年文史
2025-04-25 19:45:03
“五一花100塊買票回家”引全網群嘲:貧窮,是父母最失敗的教育

“五一花100塊買票回家”引全網群嘲:貧窮,是父母最失敗的教育

熙熙說教
2025-04-25 20:40:56
41分+29分,一打遼寧就來勁!廣廈亮出殺手锏,遼寧半決賽到頭了

41分+29分,一打遼寧就來勁!廣廈亮出殺手锏,遼寧半決賽到頭了

楊仔述
2025-04-25 17:10:59
汪峰試探問:你跟幾個男人回過家?章子怡一句話,讓他瞬間紅了臉

汪峰試探問:你跟幾個男人回過家?章子怡一句話,讓他瞬間紅了臉

火之文
2025-02-04 13:22:59
我空降到家鄉(xiāng)擔任副省長,參加校友聚會,卻被班花的處長丈夫嘲笑

我空降到家鄉(xiāng)擔任副省長,參加校友聚會,卻被班花的處長丈夫嘲笑

紅豆講堂
2025-04-16 10:47:03
油價跌破天!4月25日:調價后92,95號汽油價格,蛋價報復性下跌

油價跌破天!4月25日:調價后92,95號汽油價格,蛋價報復性下跌

豬友巴巴
2025-04-25 15:30:03
遼寧一學校發(fā)生命案,網傳致4死2傷,原因披露,官方對一細節(jié)沉默

遼寧一學校發(fā)生命案,網傳致4死2傷,原因披露,官方對一細節(jié)沉默

博士觀察
2025-04-25 23:27:12
特朗普政府稱將恢復被終止的外國學生合法身份

特朗普政府稱將恢復被終止的外國學生合法身份

財聯(lián)社
2025-04-26 00:36:05
這才是清朝妃子被臨幸的全過程,別再被電視劇騙了,真相更殘酷

這才是清朝妃子被臨幸的全過程,別再被電視劇騙了,真相更殘酷

贏梯
2025-04-16 19:13:14
2025-04-26 03:16:49
AI全球總部
AI全球總部
全球最新、最酷AI解決方案
996文章數(shù) 717關注度
往期回顧 全部

科技要聞

文心模型再降價80%,李彥宏:我打下了價格

頭條要聞

美官員:很多美企庫存最多只夠60天 生產完全在中國

頭條要聞

美官員:很多美企庫存最多只夠60天 生產完全在中國

體育要聞

?跑得最快的院長來啦!蘇炳添擔任暨大體育學院院長

娛樂要聞

王菲被諷刺為愚婦 張柏芝最終還是贏了

財經要聞

政治局會議傳遞積極信號 機構熱議6大看點

汽車要聞

"下一代純電寶馬"提前體驗 用代碼編譯駕駛樂趣

態(tài)度原創(chuàng)

家居
手機
旅游
本地
公開課

家居要聞

清徐現(xiàn)代 有溫度有態(tài)度

手機要聞

小米16再曝:全系直屏 標準版無緣潛望

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

本地新聞

云游湖北 | 漢川文旅新體驗:千年陶藝邂逅湖光

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 迭部县| 伊川县| 久治县| 定陶县| 班玛县| 贵州省| 扶风县| 颍上县| 万安县| 永福县| 扬中市| 巩义市| 临安市| 东至县| 宁阳县| 巨野县| 宁国市| 涞源县| 西乌珠穆沁旗| 昌平区| 铁力市| 靖江市| 松桃| 丰镇市| 乌兰察布市| 建阳市| 太和县| 中卫市| 沾益县| 天峨县| 额尔古纳市| 象山县| 洛隆县| 平果县| 安福县| 武定县| 天门市| 阿拉善盟| 大新县| 乐东| 冷水江市|