99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

太猛了!英偉達讓 Deepseek R1 編寫 GPU 內核,結果 R1 寫的比熟練工程師還好

0
分享至


DeepSeek 又上大分!

英偉達使用 DeepSeek-R1 讓 AI 自動生成 GPU 內核代碼,結果效果超越人類工程師,更離譜的是在 KernelBench Level 1 上實現了 100% 的數值正確性


我們一起來扒一扒事情原委:

隨著 AI 模型越來越強大,要解決的問題也越來越復雜。這時候,一種叫做“推理時序 scaling” (inference-time scaling)的新技巧就火了起來,聽起來高大上,其實說白了,就是給 AI更多的時間去思考

就像我們人類解難題一樣,難題太復雜?那就多花點時間,多想想不同的解法,最終選出最優方案!“推理時序 scaling” 就是讓 AI 在推理過程中,分配更多的計算資源,嘗試更多可能性,最終找到最佳答案。這也被稱為AI 的“reasoning” 或 “long-thinking” (長思考)能力

這次 Nvidia 的工程師們就用DeepSeek-R1模型,加上“推理時序 scaling”技術,搞了個實驗,結果讓人驚掉下巴!他們想讓 AI自動生成 GPU 上的 Attention (注意力機制) 內核代碼

要知道,Attention 機制可是大語言模型的基石,但是它的計算量巨大,尤其是處理長文本的時候,簡直是性能殺手!所以,優化 Attention 內核代碼就顯得尤為重要。這活兒非常考驗技術,經驗豐富的工程師也要花費大量時間和精力

更麻煩的是,Attention 機制還有各種變體 (比如 causal, relative positional embeddings 等等),多模態模型 (比如 vision transformers) 還會引入更復雜的 Attention 機制 (Spatial Neighborhood Attention), 人工優化簡直要命!

但是!Nvidia 這次直接讓DeepSeek-R1 模型上陣,自動生成這些復雜的 GPU 內核代碼!而且還用上了 “推理時序 scaling” 的大招!

?? “閉環驗證” + “長時間推理” = 超強 AI 代碼生成器!

Nvidia 的工程師們設計了一個巧妙的“閉環驗證” (closed-loop)工作流程。簡單來說就是:


  1. 1. 人工給 DeepSeek-R1 模型一個初始 prompt (指令),告訴它要生成什么樣的 GPU 內核代碼


  2. 2. DeepSeek-R1 生成第一版代碼

  3. 3. “驗證器” (verifier) 在 Nvidia H100 GPU 上運行生成的代碼,并進行分析

  4. 4. 驗證器根據分析結果,生成新的 prompt,反饋給 DeepSeek-R1 模型

  5. 5. DeepSeek-R1 模型根據新的 prompt,繼續優化代碼

這個過程就像一個AI 程序員和 AI 代碼評審員之間的持續對話,不斷迭代優化代碼。更厲害的是,Nvidia 工程師們讓這個過程持續了 15 分鐘!這就是 “推理時序 scaling” 的威力!給 AI 足夠的時間,它就能不斷改進,最終達到驚人的效果!

KernelBench 權威評測:100% Level-1 問題搞定!96% Level-2 問題拿下!

效果怎么樣呢?數據說話!Nvidia 用 Stanford 的KernelBench 基準測試來評估生成的內核代碼。結果顯示,對于Level-1 難度的問題,DeepSeek-R1 生成的代碼 100% 數值正確!對于 Level-2 難度的問題,也達到了 96% 的正確率!


在某些情況下,DeepSeek-R1 生成的內核代碼,性能甚至超過了經驗豐富的工程師手工優化的代碼!

推理時間越長,效果越好!

英偉達還展示了“推理時間預算” (inference-time budget)對模型性能的影響。分配給 AI 更多的時間 (超過 10 分鐘),就能顯著提高代碼的正確率!這再次證明了 “推理時序 scaling” 的有效性

Nvidia 這次實驗,無疑展示了DeepSeek-R1 模型“推理時序 scaling”技術在GPU 內核自動生成領域的巨大潛力

未來 AI 可以自動優化各種底層代碼,程序員可以把更多精力放在更高層次的創新上,這將極大地加速 AI 技術的發展!

當然,Nvidia 也承認,這還只是一個開始,要實現更廣泛、更穩定的應用,還需要更多的研究和努力。但無論如何,這都是一個激動人心的開端

參考:

https://developer.nvidia.com/blog/automating-gpu-kernel-generation-with-deepseek-r1-and-inference-time-scaling/

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
吉利車展造了個“安全游樂園”?AR碰撞測試玩到停不下來

吉利車展造了個“安全游樂園”?AR碰撞測試玩到停不下來

名車點評
2025-04-27 17:46:34
“不能讓李嘉誠跑了!”中方這次下了死命令,有一道口子決不能開

“不能讓李嘉誠跑了!”中方這次下了死命令,有一道口子決不能開

獵火照狼山
2025-04-29 08:26:46
打工人花5萬塊,也能喜提高顏值座駕

打工人花5萬塊,也能喜提高顏值座駕

車觀察
2025-04-28 17:43:10
并肩作戰的兄弟!巴特勒談勇士隊友:我愿意為這些家伙而死

并肩作戰的兄弟!巴特勒談勇士隊友:我愿意為這些家伙而死

直播吧
2025-04-29 13:05:20
海底24小時+鋼針穿刺,L6神盾電池讓2萬家庭閉眼沖

海底24小時+鋼針穿刺,L6神盾電池讓2萬家庭閉眼沖

汽車知識報
2025-04-27 13:06:52
肖飛事件,麻醉醫生連續發文:壓這么久還是沒壓住,醫院不該隱身

肖飛事件,麻醉醫生連續發文:壓這么久還是沒壓住,醫院不該隱身

明月聊史
2025-04-29 12:38:11
諷刺!董襲瑩美國留學7年,花費千萬!畢業典禮上被院長點名表揚

諷刺!董襲瑩美國留學7年,花費千萬!畢業典禮上被院長點名表揚

魔都姐姐雜談
2025-04-29 11:16:25
吉利銀河戰艦亮相上海車展:全域AI讓它上天入地無所不能!

吉利銀河戰艦亮相上海車展:全域AI讓它上天入地無所不能!

極客看車
2025-04-27 17:46:48
安全才是“老司機”首選,銀河 L6用e-CMA鋼骨+E懸掛征服市場

安全才是“老司機”首選,銀河 L6用e-CMA鋼骨+E懸掛征服市場

車達人匯
2025-04-27 13:06:08
2.9L油+2000km續航!銀河L6 EM-i引爆上海車展

2.9L油+2000km續航!銀河L6 EM-i引爆上海車展

汽車知識報
2025-04-28 12:55:05
友好醫院事件中的五大輸家,最慘的是不是肖副主任

友好醫院事件中的五大輸家,最慘的是不是肖副主任

辣條小劇場
2025-04-29 03:33:26
協和董小姐的經歷告訴我們:好崗位就像艾滋病,只通過母嬰、血液與性進行傳播

協和董小姐的經歷告訴我們:好崗位就像艾滋病,只通過母嬰、血液與性進行傳播

西虹市閑話
2025-04-29 16:22:01
吉利銀河L6EM-i 上海車展霸屏:2L級國民家轎掀起“技術普惠”風暴

吉利銀河L6EM-i 上海車展霸屏:2L級國民家轎掀起“技術普惠”風暴

名車點評
2025-04-28 12:56:12
廣東省委書記黃坤明會見中國大唐集團董事長呂軍一行

廣東省委書記黃坤明會見中國大唐集團董事長呂軍一行

界面新聞
2025-04-29 09:56:17
廣東女子把帶血衛生巾扔下砸中鄰居,丈夫道歉 被鄰居用菜刀砍殘

廣東女子把帶血衛生巾扔下砸中鄰居,丈夫道歉 被鄰居用菜刀砍殘

水晶的視界
2025-04-29 08:27:20
中國外交部發布《不跪》視頻,潛藏四層深意!

中國外交部發布《不跪》視頻,潛藏四層深意!

解筱文
2025-04-29 12:47:52
“高潮針”打過的都說好?提高G點敏感度2倍,手指一彎就想尿

“高潮針”打過的都說好?提高G點敏感度2倍,手指一彎就想尿

社會醬
2025-04-28 16:29:35
2.9L油+2000km續航!銀河L6 EM-i引爆上海車展

2.9L油+2000km續航!銀河L6 EM-i引爆上海車展

環球車聞
2025-04-28 12:54:25
車展圍觀吉利戰艦!AI四驅黑科技,爛路秒變高速路

車展圍觀吉利戰艦!AI四驅黑科技,爛路秒變高速路

車達人匯
2025-04-28 18:49:38
全球最大安全實驗室+銀河戰艦首秀!吉利這波操作讓車主直呼安心

全球最大安全實驗室+銀河戰艦首秀!吉利這波操作讓車主直呼安心

極客看車
2025-04-28 21:06:40
2025-04-29 16:52:49
AI寒武紀 incentive-icons
AI寒武紀
專注于人工智能,科技領域
653文章數 259關注度
往期回顧 全部

科技要聞

Qwen3登頂開源榜 阿里稱大模型是十年長跑

頭條要聞

印巴再度交火 外交部回應是否計劃"介入調解"

頭條要聞

印巴再度交火 外交部回應是否計劃"介入調解"

體育要聞

勇士火箭雷霆太陽,你們是怎么失去他的?

娛樂要聞

甜馨簽樂華出道惹爭議 維護爸媽被質疑

財經要聞

特朗普執政百日下的美元危機

汽車要聞

年輕or傳統?上汽奧迪A5L與一汽奧迪A5L有什么不同?

態度原創

家居
本地
數碼
手機
公開課

家居要聞

雅奢氛圍 營造品質生活

本地新聞

春色滿城關不住 | 北洋門扉開:名校與花潮撞個滿懷

數碼要聞

最新泄露信息顯示索尼WH-1000XM6降噪耳機距離發布又近了一步

手機要聞

小屏黨春天 OPPO Find X8s學生購機優惠多多

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 金塔县| 宣城市| 合江县| 桂阳县| 出国| 京山县| 隆尧县| 河南省| 镇原县| 凤城市| 贺兰县| 津市市| 沁源县| 常山县| 彩票| 三亚市| 霸州市| 沅江市| 雷波县| 吐鲁番市| 萝北县| 青田县| 丹巴县| 贵阳市| 平塘县| 桦南县| 金阳县| 陆河县| 平安县| 杭锦旗| 新乐市| 丰原市| 镇远县| 乐山市| 榆社县| 丹东市| 桐梓县| 建平县| 阿克苏市| 甘孜县| 罗山县|