99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

DeepSeek開源第三天,只用300行代碼就超越了英偉達自己。

0
分享至

不能再肝了,但我又覺得DeepSeek值得。。。

這兩天,DeepSeek的高強度開源波,一山更比一山高。

先是給GPU安超頻加速外掛的 ,又是叫英偉達知道“原來GPU沒有商業護城河”的 。

我也都第一時間給大家帶來了報道。

在追求效率、把硬件資源干下來的路上,DeepSeek快成AI性能效率上的Godfather了。。。

這回,他們開源的是一個叫做DeepGEMM的玩意兒,專門給當時爆cei全網的DeepSeek-V3做的。

Github星星沒半小時,就幾百個了。點的越多,意味著開源友友們越喜愛和越關注這個代碼倉庫,水分那是相當的少。一般幾千的星星就已經算是爆款了,半小時就幾百,這個含金量你懂的。

開源鏈接在此:https://github.com/deepseek-ai/DeepGEMM?tab=readme-ov-file


這東西,倒也沒那么難懂。

舉個例子,假如我結婚了。場面特別特別大,記得是假如。。。

幾百萬人組成的迎親隊伍、點鞭炮得點幾億種、接親隊伍也叫個幾百萬人來,甚至我再搞點大的出來,比如弄個幾萬盞燈光秀。

所有的一切的一切都需要計算好時間點,相互之間得互相搭配。而DeepGEMM這東西,能把以上所有東西塞進一個矩陣里。

所有迎親隊伍的實時行走軌跡、啥時候點鞭炮的精細時間規劃、接親隊伍得到哪里等、等多久,幾萬盞燈光秀和幾千萬首音樂秀,幾分幾秒,該怎么配合,效果最好,等等。

全都能放進矩陣里計算,這都快成在天上俯瞰人間的God了。。。

用技術語言說,就是:

DeepGEMM 是一個為 DeepSeek-V3 專門設計的,用于 FP8 的,通用矩陣乘法(GEMM)庫。還支持普通的和專家混合(Mix-of-Experts,MoE)分組 GEMM。

安裝時,你都無需編譯,只通過一個輕量級的即時編譯(JIT)模塊,在運行時就可以編譯所有內核了。牛逼,一點多余東西都不舍得讓你多干活。

而且,只用了300行代碼,實在是牛逼。。。

目前,DeepGEMM跟前兩天一樣,還是只支持H卡。它為了讓FP8這種速度快但精度偏低的計算方式變得更準確,利用了CUDA核心做了兩次累加。

簡單說就是先用FP8完成快速計算,然后再用CUDA核心對結果進行更精細的再加工,這樣既能保持速度快,還能把精度提上去。

DeepGEMM也借鑒了英偉達CUTLASS和CuTe的一些概念。

CUTLASS 是基于英偉達明星當家CUDA架構。簡單說,它是一個寫給 NVIDIA顯卡的工具包,專門用來加速“矩陣計算”的。

英偉達的CUTLASS實在是過于高效,以至于被用來構建內核時,幾乎能幫顯卡把矩陣計算的性能榨到極限,跑到顯卡的理論峰值。


但是如果你手里的硬件沒那么強大,就像很多現在的AI公司們還停在上一代的卡上時,CUTLASS這種大而全的加速套件,就有點用不上了。

CUTLASS雖然時哥通用、功能強大的矩陣加速庫,但是DeepGEMM這種激進的優化方式更專注、更輕量。

深刻的展現了DeepSeek那種“摳”到極致的理念。

把性能也摳到了極限。

性能只要卡的不死,DeepSeek就能拿效率調優這條至簡大路沖出來,無形中連美國算力封鎖都給捅破了。。。

它完全沒有一點對英偉達項目的模版or代數的過分的依賴度,全憑自主。

而且不止是輕量化,性能也是直接起飛。

按他們的話說,

團隊說,能夠匹配甚至超越英偉達、ADM等等專家專門調優的庫。。。

比英偉達自己的CUTLASS 3.6,速度還提升了2.7倍。

他們在H800上,測試了 DeepSeek-V3 和 R1 推理中可能用到的所有矩陣情況,性能水平,我都整理在這了。

先是密集模型檔,估計老黃那個項目的人,也很難想明白,幾百行代碼怎么調優調成這樣的。。。

之前不是都說,硬件是有護城河的嘛。。。現在看起來,DeepSeek比英偉達都懂GPU。


然后就是現在被稱為AI未來方向之一的專家混合模型MoE了。它在處理復雜任務上獨樹一幟。整體的性能,實在是太硬核了。數據如下:


但DeepSeek的人也確實說了。

DeepGEMM雖然非常牛逼,但是在某些情況上的表現確實不太好,歡迎所有人一起改進。

具體的部署上,依舊和之前每次DeepSeek開源時的動作一樣,把飯喂到你嘴邊,順便走的時候,再給你擦擦嘴。

因為無需編譯,部署速度會更快、更順暢。這讓我想起來了當年的貼吧大神們,只留下寶典教程里最核心的部分,揮揮衣袖,就跑了。。。


隨著下一代基座模型,比如DeepSeek V4、GPT-4.5等等的參數和復雜度繼續增長時,深入到底層進行優化的DeepGEMM這種庫,真的會越來越重要。

AI圈子內曾經充斥著,閉源才是通向AGI的論調。

這平等地傷害了,每一個踏進AI大門的普通人們。

閉源的AI世界,就像是黑暗森林。

每個人都是拿著槍追著篝火的獵人。

但DeepSeek這一舉。

讓我突然想起來《教父》里那句名言。

永遠不要動怒。

絕不要威脅。

要講道理。

開源就是DeepSeek這群家伙們的道理。

共勉。

以上,既然看到這里了,如果覺得不錯,隨手點個贊、在看、轉發三連吧,如果想第一時間收到推送,也可以給我個星標?~謝謝你看我的文章,我們,下次再見。

>/ 作者:卡茲克、芝蘭山

>/ 投稿或爆料,請聯系郵箱:wzglyay@gmail.com

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
不準關閉大壩,巴鐵通電王毅外長,中方遞出18個字,印度直接泄洪

不準關閉大壩,巴鐵通電王毅外長,中方遞出18個字,印度直接泄洪

平祥生活日志
2025-04-28 12:15:54
東亞區獨苗!3-2,日職聯勁旅掀翻亞冠2冠王,晉級精英賽半決賽

東亞區獨苗!3-2,日職聯勁旅掀翻亞冠2冠王,晉級精英賽半決賽

側身凌空斬
2025-04-28 05:05:37
突然大跳水!暴跌80%

突然大跳水!暴跌80%

中吳網
2025-04-27 13:24:36
養老金調整好消息,上海最新回應!企退工齡20年,漲幅能有5%嗎?

養老金調整好消息,上海最新回應!企退工齡20年,漲幅能有5%嗎?

小晨同學啊
2025-04-28 14:31:07
震驚!160游客被旅行大巴遺棄,內幕令人難以置信!

震驚!160游客被旅行大巴遺棄,內幕令人難以置信!

魔都姐姐雜談
2025-04-28 11:36:07
羅茜·漢丁頓-惠特莉:美貌與智慧,人生贏家的人生秘訣!

羅茜·漢丁頓-惠特莉:美貌與智慧,人生贏家的人生秘訣!

小椰的奶奶
2025-04-28 13:34:27
盲目要二胎的后果有多嚴重?網友:嚴不嚴重我不管就是想要這一款

盲目要二胎的后果有多嚴重?網友:嚴不嚴重我不管就是想要這一款

特約前排觀眾
2025-04-14 00:20:03
麻省理工博士驚人發現:圖安逸、少忙碌、別太努力,孩子更容易成功

麻省理工博士驚人發現:圖安逸、少忙碌、別太努力,孩子更容易成功

閱讀第一
2025-04-28 08:34:52
36人被查,12人被處分……

36人被查,12人被處分……

大象新聞
2025-04-28 15:14:11
胡耀邦為何永遠都是共產黨人的良心?時間越久,對他的認識越深刻

胡耀邦為何永遠都是共產黨人的良心?時間越久,對他的認識越深刻

老謝談史
2025-04-28 11:34:22
重大誤判!大黑馬2-2變1-3:全場噓聲四起,布倫森32+11拯救球隊

重大誤判!大黑馬2-2變1-3:全場噓聲四起,布倫森32+11拯救球隊

體壇小李
2025-04-28 05:43:45
哪些牛叉體質讓你羨慕不已?網友:我談過的前女友們都說我死了

哪些牛叉體質讓你羨慕不已?網友:我談過的前女友們都說我死了

解讀熱點事件
2025-04-27 00:10:05
影子調查丨危房之下,百余住戶搬離夢嘉商貿樓

影子調查丨危房之下,百余住戶搬離夢嘉商貿樓

澎湃新聞
2025-04-28 12:04:29
A股:重磅!財政部、央行、證監會發聲!經濟日報“穩”不是保守!

A股:重磅!財政部、央行、證監會發聲!經濟日報“穩”不是保守!

虎哥閑聊
2025-04-28 08:55:47
美國100%想向中國開戰,而且比任何時候都想。

美國100%想向中國開戰,而且比任何時候都想。

瀘沽湖
2025-04-28 10:09:24
被妻子舉報的中日友好醫院醫生:簡歷已撤下,曾入選骨干人才

被妻子舉報的中日友好醫院醫生:簡歷已撤下,曾入選骨干人才

南方都市報
2025-04-28 10:00:43
拆遷要全面停了?2025年已明確了:樓齡20年的房子全部都這樣處理

拆遷要全面停了?2025年已明確了:樓齡20年的房子全部都這樣處理

巢客HOME
2025-04-19 20:03:22
專業科普:如何客觀評價謝霆鋒的音樂水準?港樂頂流?嚴重高估?

專業科普:如何客觀評價謝霆鋒的音樂水準?港樂頂流?嚴重高估?

科學發掘
2025-04-28 14:04:47
呂宋島發生對峙,4艘052D和054A艦不顧阻撓,抵近美菲反艦軍演

呂宋島發生對峙,4艘052D和054A艦不顧阻撓,抵近美菲反艦軍演

頭條爆料007
2025-04-27 22:39:22
外交部:歡迎更多外國朋友踴躍來華“探店”“拔草”

外交部:歡迎更多外國朋友踴躍來華“探店”“拔草”

環球網資訊
2025-04-28 16:04:31
2025-04-28 18:08:49
數字生命卡茲克 incentive-icons
數字生命卡茲克
反復橫跳于不同的AI領域,努力分享一些很酷的AI干貨
290文章數 392關注度
往期回顧 全部

科技要聞

大廠圍獵AI人才:部分實習生日薪可達2000

頭條要聞

中日友好醫院醫生被指婚內出軌多名女同事 當事人發聲

體育要聞

“我們欠球迷一個冠軍慶典,現在可以狂歡了”

娛樂要聞

黃渤青島做東請客 桌上全人情世故

財經要聞

事關穩就業、穩經濟!四部門聯合發聲

汽車要聞

日產中國,重新起跑

態度原創

本地
時尚
手機
親子
公開課

本地新聞

亮劍緝車—蕉城法院首場法拍車聯合直播

珍珠專場|| 終于補到貨了!你們催了很久的斷貨王來了

手機要聞

非洲手機之王 傳音2025年Q1凈利潤大降70%

親子要聞

這些不起眼的小事,其實都是在消耗孩子

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 奈曼旗| 晋中市| 当阳市| 三河市| 通许县| 阜宁县| 黑山县| 定南县| 越西县| 太谷县| 花莲市| 行唐县| 读书| 宁河县| 万安县| 筠连县| 马关县| 渭南市| 镇安县| 毕节市| 凤庆县| 清新县| 韶山市| 襄城县| 十堰市| 霞浦县| 玉环县| 辽宁省| 漾濞| 福泉市| 常德市| 博客| 黄梅县| 德惠市| 双柏县| 太仓市| 高雄县| 开远市| 冀州市| 昌邑市| 辽阳市|