99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

DeepSeek開源第二天，發了一個比OpenAI十二天直播還硬的硬貨。

2025-02-25 11:49:53　來源: 數字生命卡茲克

天津舉報

0

分享至

剛肝完Claude 3.7 Sonnet，睡了兩小時，馬不停蹄的又起來看DeepSeek開源項目。

結果時間線上先刷到的是阿里的推理模型QwQ-Max的預覽版。。。

不是哥們，早上5點發，這也太抽象了。。。

但是畢竟阿里，是跟DeepSeek其名的“源神”，還是值得關注一下，反正他們跟我說，正式版很快了，而且也是全部開源。

有興趣的可以先去線上版本https://chat.qwen.ai玩。

左上角選2.5-max，點上深度思考，里面模型用的就是QwQ-Max preview。

回到DeepSeek這邊。

昨天第一天他們發的FlashMLA直接在H800上把性能榨干。短短一天過去，Github Star 就已經8.2k了。

而今天，他們帶來的項目，放得招比第一天還大，承上啟下算是用到極致了。

開源的是一個叫DeepEP的東西，它把電腦里的GPU性能再次拉滿。

開源地址在此：https://github.com/deepseek-ai/DeepEP

1小時左右，Github上已經斬獲1000多顆星了。

AI圈子里老說軟件先行，硬件開路。但DeepSeek要的就是硬件效率，最低的硬件資源干出同水平更強的AI任務性能。

甚至，我感覺，DeepSeek比英偉達更懂怎么榨干GPU。。。

DeepSeek這回開源的技術，實在過于硬核，理解門檻太高，硬核的甚至我都有點看不懂了，但是還是硬著頭皮學習了一波，也提前找了朋友蹲點，第一時間給我拆解了一下。

所以秉持著一個自媒體的原則，給大家簡單科普下。可能會有點錯誤，如果出現，歡迎各位大佬蒞臨評論區進行指導。

我先用一個非常通俗易懂的例子描述一下這玩意。

現在很火的2個AI領域的研究方向，一個是“混合專家模型”（MoE），另一個就是“專家并行”（EP）。這回開源的DeepEP ，就是它倆量身定制的通信庫。

在一個MoE模型里面，你可以簡單的理解為里面有256個專家，給你干不同的事，有些擅長語言，有些擅長數學，有些擅長常識。這種模型叫做"混合專家模型"。

但是呢，過往的MoE模型里面，你可以想象成是這256個專家，都在一個房間里面，靠嘴通信，吵來吵去，要是所有人一起大喊大叫，這有多混亂，效率有多低下，你肯定能想象的出來。

而這個DeepEP呢，相當于設計了一個中間的溝通系統，把一群靠嘴巴溝通的地球人，變成了一群直接思想透明的三體人，靠電磁波交流，速度奇快無比。

所有專家的信息都可以即刻被其他所有三體人專家接收，沒有延遲。（信息在不同GPU專家間以接近光速的方式傳遞，延遲低至186微秒）

而且整個文明可以同時感知一個三體人的所有思想。（支持"all-to-all"通信，一個專家的信息可以同時發送給所有其他專家）

因為三體人的思想是透明化的，讓信息無損傳遞，沒有誤解。（數據在傳輸過程中保持完整性，支持FP8通信）

這就是大概的東西，雖然可能還是需要理解一下，但是我已經盡可能用我的知識來類比了一下。

所以說啊，這就是真正的，三體科技。。。

回到DeepEP的技術和參數這塊，我也列了3個點。

1. 開掛般的內核優化

與DeepSeek-V3 論文一脈相承，DeepEP 提供了一組針對非對稱域帶寬轉發的優化內核，把高吞吐量和低延遲又帶到了一個新水平。不光讓大模型訓練更快了，推理效率也大幅增加了。

他們根據 DeepSeek-V3/R1 的預訓練設置，在 H800 上測試了普通內核性能。

這性能表現，牛逼。

2. 低延遲

對于另一種對延遲敏感的推理解碼，DeepEP 包含一組純 RDMA 的低延遲內核，以最大限度減少延遲。

看到這里，感覺DeepSeek又貼心又硬核，把DeepSeek-V3/R1的核心優化技術之一開源就是這么簡簡單單。

3. 新的通信-計算重疊方法

最后的最后，DeepSeek又給了個驚喜：一種基于鉤子（hook based）的通信-計算重疊方法，牛逼的是，這種方法不占用任何 SM 資源。

就比如你在翻書的同時，就能一目十行了，而不是翻到哪頁看哪頁。

DeepEP 就是這樣，讓 GPU 在傳數據的同時還能計算，一點不浪費時間。

這讓我想起DeepSeek-V3當時論文一發出來，性能效率比把全網都爆了的那種即視感。

恍惚間，我又想起之前，整宿盯的OpenAI十二連彈產品發布會，產品未至，營銷先行。

看完了以后，我基本就是一句話描述他們：

XX OpenAI，XX 奧特曼。

這回，DeepSeek的手筆，讓我感覺才是真的牛逼。

就是給你個代碼庫，簡簡單單，一點套路沒有。

直接把飯喂到你嘴邊。

整體來看，這回的開源也是開箱即用，下載、部署和安裝都一步到位。

這是開源黨的狂歡日，而這樣的狂歡日還有三天。。。

就像DeepSeek在開源頁上所說的那樣。

他們正在 AGI 探索中挑戰自己的極限。

僅僅作為開發者。

以完全透明的方式分享微小但真誠的進展。

DeepSeek。

把進化工具，平等地交到每個人手上。

讓所有普通人都能夠。

跨AI的海，越AI的山。

這一刻，看到DeepSeek做的大事。

才讓我由衷地覺得，AI真好。

以上，既然看到這里了，如果覺得不錯，隨手點個贊、在看、轉發三連吧，如果想第一時間收到推送，也可以給我個星標?～謝謝你看我的文章，我們，下次再見。

>/ 作者：卡茲克、芝蘭山

>/ 投稿或爆料，請聯系郵箱：wzglyay@gmail.com

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

發布不到2個月的GPT-4.5突遭 “拋棄”，GPT-4.1強勢接棒，成本較GPT-4o大降 26%

每日經濟新聞 2025-04-15 18:08:10
1 跟貼 1
OpenAI被曝打造社交網絡或將反哺AI模型訓練

財聯社 2025-04-16 03:20:07
8 跟貼 8

DeepSeek之后，端側AI崛起

鈦媒體APP 2025-04-16 17:09:00
0 跟貼 0

12名工程師，估值190億，AI黑馬的夢幻故事

智東西 2025-01-14 20:23:26
0 跟貼 0
圖靈獎得主Sutton、谷歌RL大佬Silver新作：超人智能靠經驗

機器之心Pro 2025-04-16 18:00:47
0 跟貼 0

大模型承重墻，去掉了就開始擺爛！蘋果給出了「超級權重」

機器之心Pro 2024-11-19 15:50:17
0 跟貼 0

微軟AI模型MatterGen能根據需求生成新材料

量子位 2025-01-21 18:07:40
0 跟貼 0
OpenAI放大招：免費開放ChatGPT搜索，無需注冊

每日經濟新聞 2025-02-06 10:49:09
0 跟貼 0

DeepSeek開口說話了反應超神無限打斷只要兩行代碼15分鐘

量子位 2025-03-07 14:20:34
0 跟貼 0
實測訊飛曉醫VS DeepSeek-R1，誰是更懂你的家庭健康助手？

量子位 2025-03-08 19:20:56
0 跟貼 0
以芯片、工具鏈和生態為引擎MediaTek掀起智能體AI普及第一波浪潮

機器之心Pro 2025-04-16 18:10:07
0 跟貼 0
一句話讓DeepSeek控制你的電腦！微軟開源神器OmniParser V2

量子位 2025-02-18 20:48:36
0 跟貼 0
JHU提出最強ToM方法，AutoToM橫掃五大基準

機器之心Pro 2025-04-16 18:29:42
1 跟貼 1
DeepSeek引爆AI革命，誰能笑到最后？

量子位 2025-03-11 17:16:22
0 跟貼 0
DeepSeek應用如何落地？解鎖“性能x多模態xRAG”技術組合密碼！

量子位 2025-03-07 22:29:18
0 跟貼 0
DeepSeek開口說話了：只要15分鐘就能讓DeepSeek開口說話

量子位 2025-03-10 18:03:15
0 跟貼 0
大模型如何讓智能硬件有腦有腳、聽話能干？

36氪 2025-01-26 10:30:50
0 跟貼 0
“AI洗頭”的風吹到多地！顧客：“對癥下癢”能力有限已有重慶人試過了

上游新聞 2025-04-16 12:37:22
0 跟貼 0
DeepSeek應用如何落地？解鎖性能釋放x多模態融合xRAG增強

量子位 2025-03-07 22:58:40
0 跟貼 0
媽媽為兒子的學習操碎了心，兒子也為媽媽事業操心費力

重慶聚焦站 2025-04-15 12:12:52
2045 跟貼 2045
美國人評選，史上最受歡迎和最差勁的5位總統

鏟史官 2025-04-15 18:22:20
1073 跟貼 1073
DeepSeek公布推理引擎開源路徑，承諾將核心優化注入vLLM生態

DeepTech深科技 2025-04-16 11:15:42
1 跟貼 1
對話開源中國馬越：DeepSeek不是國運級的創新，年輕人才是

36氪 2025-03-13 18:14:13
6 跟貼 6
就因為姓“空”，他們生活中處處BUG！干啥都能讓電腦宕機，簡直電子柯南

英國那些事兒 2025-02-24 23:18:08
80 跟貼 80
大光頭接連秀操作！誰能讀對牌？

天天競技 2025-04-15 11:32:25
0 跟貼 0
手把手教你使用 SPSS 分析實時熒光定量數據

生物學霸 2025-03-24 17:53:26
0 跟貼 0
必須服從調劑沒得選，張雪峰罕見紅溫，你TM沒學校上活該

中書省的世界觀 2025-04-15 02:54:06
0 跟貼 0
3D打印獅子模型，這就是科技的力量，網友：毛是用的邊角料？

河海觀潮 2025-04-15 13:15:28
3 跟貼 3
CTO 詳解理想「系統開源」：希望成為汽車圈的「DeepSeek」

極客公園 2025-04-15 22:24:28
0 跟貼 0
烏蘭巴托直播甲亢哥談鹵鵝哥，跨國讓鹵鵝哥要辦美簽

凱叔閑聊 2025-04-13 21:43:13
0 跟貼 0
外交部回應美對華加征245%關稅

央視新聞 2025-04-16 15:32:49
2485 跟貼 2485
這劇本你見過嗎？三鎮87分鐘1-4落后連追3球，并讀秒絕平國安

懂球帝 2025-04-15 21:49:38
4321 跟貼 4321
Deepseek：人生最虧的十件事——別等撞了南墻才醒悟

尚曦讀史 2025-04-16 11:14:07
9 跟貼 9
直播間運營上錯價格，時大漂亮當場暴怒，質問運營有沒有智商！

娶回時尚 2025-04-15 09:25:25
1 跟貼 1
春播倒計時！DeepSeek揭秘：全網瘋搶的“黑土鎏金米”暗藏黑科技

農視網 2025-04-16 10:36:36
1 跟貼 1
Microsoft Excel的5個開源替代方案，100%免費

外語行天下 2025-04-16 13:44:51
0 跟貼 0
女生開直播遭網友調戲，不料自己才是老司機，說著說著就露餡了！

搞怪趣星球 2025-04-14 10:23:51
11 跟貼 11
谷歌DeepMind新競業政策被炮轟，員工抱怨AI界休一年誰還簽你？

量子位 2025-04-16 14:06:30
0 跟貼 0
DeepSeek談藝 | 楊參軍：寫生不是目的，而是通向真實的路徑

文化視界網 2025-04-16 17:49:35
0 跟貼 0
威少本賽季兩分命中率51.7%生涯新高籃下命中率64%平生涯紀錄

直播吧 2025-04-16 19:48:47
0 跟貼 0

紀委是怎么“拿人”的？一張圖告訴你，流程比你想的更嚴！

紀委是怎么“拿人”的？一張圖告訴你，流程比你想的更嚴！

愛意隨風起呀

2025-04-14 02:46:05

王藝迪小組出局，賽后發言有點可怕：頭腦清晰，還有自己的打算

王藝迪小組出局，賽后發言有點可怕：頭腦清晰，還有自己的打算

郝小小看體育

2025-04-16 13:07:42

謝媽媽好友透露！在兒子謝浩男沒回來之前，大妹是全家主心骨！

謝媽媽好友透露！在兒子謝浩男沒回來之前，大妹是全家主心骨！

游古史

2025-04-16 15:48:34

離譜！英國網球美女要求裁判：對手太臭讓她去噴除臭劑輸球+道歉

離譜！英國網球美女要求裁判：對手太臭讓她去噴除臭劑輸球+道歉

畫夕

2025-04-16 08:57:57

布彭扎最后一條社媒是4月3日，慶祝自己單場2射1傳

布彭扎最后一條社媒是4月3日，慶祝自己單場2射1傳

直播吧

2025-04-16 18:44:10

男子花費88萬，包酒店頂層為87歲老母慶生，事后母子雙雙跳樓

男子花費88萬，包酒店頂層為87歲老母慶生，事后母子雙雙跳樓

罪案洞察者

2025-04-11 16:23:36

更多細節：“訂婚強奸案”男方拒不認罪，其母因公布女方隱私遭訓誡

更多細節：“訂婚強奸案”男方拒不認罪，其母因公布女方隱私遭訓誡

新京報

2025-04-16 18:00:33

收評：滬指探底回升錄得7連漲多只銀行股創歷史新高

收評：滬指探底回升錄得7連漲多只銀行股創歷史新高

財聯社

2025-04-16 15:03:05

美軍6航母壓境，解放軍硬核劃禁區！中美真要開戰？

美軍6航母壓境，解放軍硬核劃禁區！中美真要開戰？

起喜電影

2025-04-12 09:52:51

堂兄弟倆遭 “一周8萬元高薪”誘惑乘機抵昆明后失聯，曾發回有人背槍照片，警方調查稱已出境

堂兄弟倆遭 “一周8萬元高薪”誘惑乘機抵昆明后失聯，曾發回有人背槍照片，警方調查稱已出境

大風新聞

2025-04-15 11:46:09

美國對華關稅最高升至245%，關稅已經沒有意義

美國對華關稅最高升至245%，關稅已經沒有意義

17譚

2025-04-16 14:57:57

廣東8地市試點醫療機構啟動免陪照護服務

廣東8地市試點醫療機構啟動免陪照護服務

中工網

2025-04-14 16:34:02

看熱鬧不嫌事大？船記：祖巴茨對陣勇士全場0犯規，這簡直是奇跡

看熱鬧不嫌事大？船記：祖巴茨對陣勇士全場0犯規，這簡直是奇跡

雞丁侃球

2025-04-16 15:50:02

太有趣了！遼寧新疆同航班赴烏魯木齊，韓德君隨隊，哈雷爾被包夾

太有趣了！遼寧新疆同航班赴烏魯木齊，韓德君隨隊，哈雷爾被包夾

籃球資訊達人

2025-04-16 12:27:54

特朗普政府突發信號！美國可能利用“關稅”買入比特幣警告全球爭奪戰已打響

特朗普政府突發信號！美國可能利用“關稅”買入比特幣警告全球爭奪戰已打響

FX168鏈界觀察

2025-04-15 10:30:11

景德鎮撞死一家三口司機當庭鞠躬道歉，辯稱天太晚看不見

景德鎮撞死一家三口司機當庭鞠躬道歉，辯稱天太晚看不見

中國新聞周刊

2025-04-15 16:43:38

“根本上不了車”！今早突發，廣州地鐵道歉→

“根本上不了車”！今早突發，廣州地鐵道歉→

FM96.2廣州新聞電臺

2025-04-16 12:36:29

于根偉爭議不斷！從“洗牌”到全華班、烏龍，津門虎玩砸田忌賽馬

于根偉爭議不斷！從“洗牌”到全華班、烏龍，津門虎玩砸田忌賽馬

奧拜爾

2025-04-16 19:59:51

斯坦福學生搞出的論文神器太逆天！秒搜熱門論文，3分鐘搞定論文總結、翻譯，效率飆升100倍！

斯坦福學生搞出的論文神器太逆天！秒搜熱門論文，3分鐘搞定論文總結、翻譯，效率飆升100倍！

機器學習與Python社區

2025-04-15 18:19:19

外媒：歐足聯批準了皇馬VS阿森納次回合關閉伯納烏頂棚的要求

外媒：歐足聯批準了皇馬VS阿森納次回合關閉伯納烏頂棚的要求

直播吧

2025-04-16 00:29:15

數字生命卡茲克

反復橫跳于不同的AI領域，努力分享一些很酷的AI干貨

283文章數 387關注度

往期回顧全部

科技要聞

華為問界M8售價公布：36.98萬元起

頭條要聞

拜登批特朗普"不到百天破壞力驚人" 多名前政要也發聲

頭條要聞

拜登批特朗普"不到百天破壞力驚人" 多名前政要也發聲

體育要聞

諾坎普奇跡的兩位當事人，差點靈魂互換

娛樂要聞

娛樂圈的“現實”在岳云鵬身上應驗了

財經要聞

增長5.4% 一季度GDP增速為何超預期？

汽車要聞

又帥又快超實用極氪007GT獵裝車才是完美的車？

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

房產

健康

旅游

教育

軍事航空

房產要聞

中海｜南海·叁號院，以海岸美學重塑海口灣生活向往

在中國，到底哪些人在吃“偉哥”？

旅游要聞

熱聞|清明假期將至，熱門目的地有哪些?

教育要聞

高校要求！教師每節課設計不少于1個這樣的教學片段

軍事要聞

涉嫌泄密美防長高級顧問被調查

© 1997-2025 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版主站蜘蛛池模板：囊谦县| 阆中市| 莱州市| 印江| 当涂县| 商都县| 滨州市| 温州市| 乐都县| 怀安县| 莱州市| 禄劝| 秭归县| 浙江省| 横山县| 嘉兴市| 宿州市| 油尖旺区| 龙泉市| 台中县| 吉林市| 密山市| 徐汇区| 金寨县| 安宁市| 成武县| 体育| 扎鲁特旗| 公安县| 建湖县| 丹阳市| 德惠市| 育儿| 永福县| 韩城市| 故城县| 新绛县| 泸定县| 酒泉市| 普陀区| 枣强县|

<output id="5jzcs"><pre id="5jzcs"></pre></output>

<wbr id="5jzcs"><var id="5jzcs"><th id="5jzcs"></th></var></wbr>

<p id="5jzcs"><sup id="5jzcs"></sup></p>