99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

DeepSeek開源第二天,發了一個比OpenAI十二天直播還硬的硬貨。

0
分享至

剛肝完Claude 3.7 Sonnet,睡了兩小時,馬不停蹄的又起來看DeepSeek開源項目。

結果時間線上先刷到的是阿里的推理模型QwQ-Max的預覽版。。。


不是哥們,早上5點發,這也太抽象了。。。

但是畢竟阿里,是跟DeepSeek其名的“源神”,還是值得關注一下,反正他們跟我說,正式版很快了,而且也是全部開源。

有興趣的可以先去線上版本https://chat.qwen.ai玩。

左上角選2.5-max,點上深度思考,里面模型用的就是QwQ-Max preview。


回到DeepSeek這邊。

昨天第一天他們發的FlashMLA直接在H800上把性能榨干。短短一天過去,Github Star 就已經8.2k了。


而今天,他們帶來的項目,放得招比第一天還大,承上啟下算是用到極致了。

開源的是一個叫DeepEP的東西,它把電腦里的GPU性能再次拉滿。


開源地址在此:https://github.com/deepseek-ai/DeepEP

1小時左右,Github上已經斬獲1000多顆星了。


AI圈子里老說軟件先行,硬件開路。但DeepSeek要的就是硬件效率,最低的硬件資源干出同水平更強的AI任務性能。

甚至,我感覺,DeepSeek比英偉達更懂怎么榨干GPU。。。

DeepSeek這回開源的技術,實在過于硬核,理解門檻太高,硬核的甚至我都有點看不懂了,但是還是硬著頭皮學習了一波,也提前找了朋友蹲點,第一時間給我拆解了一下。

所以秉持著一個自媒體的原則,給大家簡單科普下。可能會有點錯誤,如果出現,歡迎各位大佬蒞臨評論區進行指導。

我先用一個非常通俗易懂的例子描述一下這玩意。

現在很火的2個AI領域的研究方向,一個是“混合專家模型”(MoE),另一個就是“專家并行”(EP)。這回開源的DeepEP ,就是它倆量身定制的通信庫。

在一個MoE模型里面,你可以簡單的理解為里面有256個專家,給你干不同的事,有些擅長語言,有些擅長數學,有些擅長常識。這種模型叫做"混合專家模型"。

但是呢,過往的MoE模型里面,你可以想象成是這256個專家,都在一個房間里面,靠嘴通信,吵來吵去,要是所有人一起大喊大叫,這有多混亂,效率有多低下,你肯定能想象的出來。

而這個DeepEP呢,相當于設計了一個中間的溝通系統,把一群靠嘴巴溝通的地球人,變成了一群直接思想透明的三體人,靠電磁波交流,速度奇快無比。

所有專家的信息都可以即刻被其他所有三體人專家接收,沒有延遲。(信息在不同GPU專家間以接近光速的方式傳遞,延遲低至186微秒)

而且整個文明可以同時感知一個三體人的所有思想。(支持"all-to-all"通信,一個專家的信息可以同時發送給所有其他專家)

因為三體人的思想是透明化的,讓信息無損傳遞,沒有誤解。(數據在傳輸過程中保持完整性,支持FP8通信)

這就是大概的東西,雖然可能還是需要理解一下,但是我已經盡可能用我的知識來類比了一下。

所以說啊,這就是真正的,三體科技。。。

回到DeepEP的技術和參數這塊,我也列了3個點。

1. 開掛般的內核優化

與DeepSeek-V3 論文一脈相承,DeepEP 提供了一組針對非對稱域帶寬轉發的優化內核,把高吞吐量和低延遲又帶到了一個新水平。不光讓大模型訓練更快了,推理效率也大幅增加了。

他們根據 DeepSeek-V3/R1 的預訓練設置,在 H800 上測試了普通內核性能。

這性能表現,牛逼。


2. 低延遲

對于另一種對延遲敏感的推理解碼,DeepEP 包含一組純 RDMA 的低延遲內核,以最大限度減少延遲。

看到這里,感覺DeepSeek又貼心又硬核,把DeepSeek-V3/R1的核心優化技術之一開源就是這么簡簡單單。


3. 新的通信-計算重疊方法

最后的最后,DeepSeek又給了個驚喜:一種基于鉤子(hook based)的通信-計算重疊方法,牛逼的是,這種方法不占用任何 SM 資源。

就比如你在翻書的同時,就能一目十行了,而不是翻到哪頁看哪頁。

DeepEP 就是這樣,讓 GPU 在傳數據的同時還能計算,一點不浪費時間。

這讓我想起DeepSeek-V3當時論文一發出來,性能效率比把全網都爆了的那種即視感。


恍惚間,我又想起之前,整宿盯的OpenAI十二連彈產品發布會,產品未至,營銷先行。

看完了以后,我基本就是一句話描述他們:

XX OpenAI,XX 奧特曼。

這回,DeepSeek的手筆,讓我感覺才是真的牛逼。

就是給你個代碼庫,簡簡單單,一點套路沒有。

直接把飯喂到你嘴邊。

整體來看,這回的開源也是開箱即用,下載、部署和安裝都一步到位。


這是開源黨的狂歡日,而這樣的狂歡日還有三天。。。

就像DeepSeek在開源頁上所說的那樣。

他們正在 AGI 探索中挑戰自己的極限。

僅僅作為開發者。

以完全透明的方式分享微小但真誠的進展。

DeepSeek。

把進化工具,平等地交到每個人手上。

讓所有普通人都能夠。

跨AI的海,越AI的山。

這一刻,看到DeepSeek做的大事。

才讓我由衷地覺得,AI真好。

以上,既然看到這里了,如果覺得不錯,隨手點個贊、在看、轉發三連吧,如果想第一時間收到推送,也可以給我個星標?~謝謝你看我的文章,我們,下次再見。

>/ 作者:卡茲克、芝蘭山

>/ 投稿或爆料,請聯系郵箱:wzglyay@gmail.com

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
紀委是怎么“拿人”的?一張圖告訴你,流程比你想的更嚴!

紀委是怎么“拿人”的?一張圖告訴你,流程比你想的更嚴!

愛意隨風起呀
2025-04-14 02:46:05
王藝迪小組出局,賽后發言有點可怕:頭腦清晰,還有自己的打算

王藝迪小組出局,賽后發言有點可怕:頭腦清晰,還有自己的打算

郝小小看體育
2025-04-16 13:07:42
謝媽媽好友透露!在兒子謝浩男沒回來之前,大妹是全家主心骨!

謝媽媽好友透露!在兒子謝浩男沒回來之前,大妹是全家主心骨!

游古史
2025-04-16 15:48:34
離譜!英國網球美女要求裁判:對手太臭 讓她去噴除臭劑 輸球+道歉

離譜!英國網球美女要求裁判:對手太臭 讓她去噴除臭劑 輸球+道歉

畫夕
2025-04-16 08:57:57
布彭扎最后一條社媒是4月3日,慶祝自己單場2射1傳

布彭扎最后一條社媒是4月3日,慶祝自己單場2射1傳

直播吧
2025-04-16 18:44:10
男子花費88萬,包酒店頂層為87歲老母慶生,事后母子雙雙跳樓

男子花費88萬,包酒店頂層為87歲老母慶生,事后母子雙雙跳樓

罪案洞察者
2025-04-11 16:23:36
更多細節:“訂婚強奸案”男方拒不認罪,其母因公布女方隱私遭訓誡

更多細節:“訂婚強奸案”男方拒不認罪,其母因公布女方隱私遭訓誡

新京報
2025-04-16 18:00:33
收評:滬指探底回升錄得7連漲 多只銀行股創歷史新高

收評:滬指探底回升錄得7連漲 多只銀行股創歷史新高

財聯社
2025-04-16 15:03:05
美軍6航母壓境,解放軍硬核劃禁區!中美真要開戰?

美軍6航母壓境,解放軍硬核劃禁區!中美真要開戰?

起喜電影
2025-04-12 09:52:51
堂兄弟倆遭 “一周8萬元高薪”誘惑乘機抵昆明后失聯,曾發回有人背槍照片,警方調查稱已出境

堂兄弟倆遭 “一周8萬元高薪”誘惑乘機抵昆明后失聯,曾發回有人背槍照片,警方調查稱已出境

大風新聞
2025-04-15 11:46:09
美國對華關稅最高升至245%,關稅已經沒有意義

美國對華關稅最高升至245%,關稅已經沒有意義

17譚
2025-04-16 14:57:57
廣東8地市試點醫療機構啟動免陪照護服務

廣東8地市試點醫療機構啟動免陪照護服務

中工網
2025-04-14 16:34:02
看熱鬧不嫌事大?船記:祖巴茨對陣勇士全場0犯規,這簡直是奇跡

看熱鬧不嫌事大?船記:祖巴茨對陣勇士全場0犯規,這簡直是奇跡

雞丁侃球
2025-04-16 15:50:02
太有趣了!遼寧新疆同航班赴烏魯木齊,韓德君隨隊,哈雷爾被包夾

太有趣了!遼寧新疆同航班赴烏魯木齊,韓德君隨隊,哈雷爾被包夾

籃球資訊達人
2025-04-16 12:27:54
特朗普政府突發信號!美國可能利用“關稅”買入比特幣 警告全球爭奪戰已打響

特朗普政府突發信號!美國可能利用“關稅”買入比特幣 警告全球爭奪戰已打響

FX168鏈界觀察
2025-04-15 10:30:11
景德鎮撞死一家三口司機當庭鞠躬道歉,辯稱天太晚看不見

景德鎮撞死一家三口司機當庭鞠躬道歉,辯稱天太晚看不見

中國新聞周刊
2025-04-15 16:43:38
“根本上不了車”!今早突發,廣州地鐵道歉→

“根本上不了車”!今早突發,廣州地鐵道歉→

FM96.2廣州新聞電臺
2025-04-16 12:36:29
于根偉爭議不斷!從“洗牌”到全華班、烏龍,津門虎玩砸田忌賽馬

于根偉爭議不斷!從“洗牌”到全華班、烏龍,津門虎玩砸田忌賽馬

奧拜爾
2025-04-16 19:59:51
斯坦福學生搞出的論文神器太逆天!秒搜熱門論文,3分鐘搞定論文總結、翻譯,效率飆升100倍!

斯坦福學生搞出的論文神器太逆天!秒搜熱門論文,3分鐘搞定論文總結、翻譯,效率飆升100倍!

機器學習與Python社區
2025-04-15 18:19:19
外媒:歐足聯批準了皇馬VS阿森納次回合關閉伯納烏頂棚的要求

外媒:歐足聯批準了皇馬VS阿森納次回合關閉伯納烏頂棚的要求

直播吧
2025-04-16 00:29:15
2025-04-16 20:20:49
數字生命卡茲克 incentive-icons
數字生命卡茲克
反復橫跳于不同的AI領域,努力分享一些很酷的AI干貨
283文章數 387關注度
往期回顧 全部

科技要聞

華為問界M8售價公布:36.98萬元起

頭條要聞

拜登批特朗普"不到百天破壞力驚人" 多名前政要也發聲

頭條要聞

拜登批特朗普"不到百天破壞力驚人" 多名前政要也發聲

體育要聞

諾坎普奇跡的兩位當事人,差點靈魂互換

娛樂要聞

娛樂圈的“現實”在岳云鵬身上應驗了

財經要聞

增長5.4% 一季度GDP增速為何超預期?

汽車要聞

又帥又快超實用 極氪007GT獵裝車才是完美的車?

態度原創

房產
健康
旅游
教育
軍事航空

房產要聞

中海|南海·叁號院,以海岸美學重塑海口灣生活向往

在中國,到底哪些人在吃“偉哥”?

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

教育要聞

高校要求!教師每節課設計不少于1個這樣的教學片段

軍事要聞

涉嫌泄密 美防長高級顧問被調查

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 囊谦县| 阆中市| 莱州市| 印江| 当涂县| 商都县| 滨州市| 温州市| 乐都县| 怀安县| 莱州市| 禄劝| 秭归县| 浙江省| 横山县| 嘉兴市| 宿州市| 油尖旺区| 龙泉市| 台中县| 吉林市| 密山市| 徐汇区| 金寨县| 安宁市| 成武县| 体育| 扎鲁特旗| 公安县| 建湖县| 丹阳市| 德惠市| 育儿| 永福县| 韩城市| 故城县| 新绛县| 泸定县| 酒泉市| 普陀区| 枣强县|