99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

反向傳播、前向傳播都不要,這種無梯度學習方法是Hinton想要的嗎

0
分享至

機器之心報道

編輯:張倩、+0

Noprop:沒有反向傳播或前向傳播,也能訓練神經網絡。

「我們應該拋棄反向傳播并重新開始?!乖缭趲啄昵?,使反向傳播成為深度學習核心技術之一的 Geoffrey Hinton 就發表過這樣一個觀點。



而一直對反向傳播持懷疑態度的也是 Hinton。因為這種方法既不符合生物學機理,與大規模模型的并行性也不兼容。所以,Hinton 等人一直在尋找替代反向傳播的新方法,比如 2022 年的前向 - 前向算法。但由于性能、可泛化性等方面仍然存在問題,這一方向的探索一直沒有太大起色。

最近,來自牛津大學和 Mila 實驗室的研究者向這一問題發起了挑戰。他們開發了一種名為 NoProp 的新型學習方法,該方法既不依賴前向傳播也不依賴反向傳播。相反,NoProp 從擴散和流匹配(flow matching)方法中汲取靈感,每一層獨立地學習對噪聲目標進行去噪。



  • 論文標題:NOPROP: TRAINING NEURAL NETWORKS WITHOUT BACK-PROPAGATION OR FORWARD-PROPAGATION
  • 論文鏈接:https://arxiv.org/pdf/2503.24322v1

研究人員認為這項工作邁出了引入一種新型無梯度學習方法的第一步。這種方法不學習分層表示 —— 至少不是通常意義上的分層表示。NoProp 需要預先將每一層的表示固定為目標的帶噪聲版本,學習一個局部去噪過程,然后可以在推理時利用這一過程。

他們在 MNIST、CIFAR-10 和 CIFAR-100 圖像分類基準測試上展示了該方法的有效性。研究結果表明,NoProp 是一種可行的學習算法,與其他現有的無反向傳播方法相比,它實現了更高的準確率,更易于使用且計算效率更高。通過擺脫傳統的基于梯度的學習范式,NoProp 改變了網絡內部的貢獻分配(credit assignment)方式,實現了更高效的分布式學習,并可能影響學習過程的其他特性。

在看了論文之后,有人表示,「NoProp 用獨立的、無梯度的、基于去噪的層訓練取代了傳統的反向傳播,以實現高效且非層次化的貢獻分配。這是一項具有開創性意義的工作,可能會對分布式學習系統產生重大影響,因為它從根本上改變了貢獻分配機制。

其數學公式中涉及每層特定的噪聲模型和優化目標,這使得無需梯度鏈即可進行獨立學習。其優勢在于通過讓每一層獨立地對一個固定的噪聲目標進行去噪,從而繞過了反向傳播中基于順序梯度的貢獻分配方式。這種方式能夠實現更高效、可并行化的更新,避免了梯度消失等問題,盡管它并未構建傳統的層次化表示。」



還有人表示,「我在查看擴散模型架構時也產生過這樣的想法…… 然而,我認為這可能是一種非最優的方法,所以它現在表現得如此出色讓我感到很神秘。顯而易見的是其并行化優勢?!?/p>





為什么要尋找反向傳播的替代方案?

反向傳播雖是訓練神經網絡的主流方法,但研究人員一直在尋找替代方案,原因有三:

  1. 生物學合理性不足:反向傳播需要前向傳遞和后向傳遞嚴格交替,與生物神經系統運作方式不符。
  2. 內存消耗大:必須存儲中間激活值以計算梯度,造成顯著內存開銷。
  3. 并行計算受限:梯度的順序傳播限制了并行處理能力,影響大規模分布式學習,并導致學習過程中的干擾和災難性遺忘問題。

目前為止,反向傳播的替代優化方法包括:

  • 無梯度方法:如直接搜索方法和基于模型的方法
  • 零階梯度方法:使用有限差分近似梯度
  • 進化策略
  • 基于局部損失的方法:如差異目標傳播(difference target propagation)和前向 - 前向算法

但這些方法因在準確性、計算效率、可靠性和可擴展性方面的限制,尚未在神經網絡學習中廣泛應用。





實現細節

NoProp 架構如圖 1 所示。







實驗結果

作者對 NoProp 方法進行了評估,分別在離散時間設置下與反向傳播方法進行比較,在連續時間設置下與伴隨敏感性方法(adjoint sensitivity method)進行比較,場景是圖像分類任務。

結果如表 1 所示,表明 NoProp-DT 在離散時間設置下在 MNIST、CIFAR-10 和 CIFAR-100 數據集上的性能與反向傳播方法相當,甚至更好。此外,NoProp-DT 在性能上優于以往的無反向傳播方法,包括 Forward-Forward 算法、Difference Target 傳播以及一種稱為 Local Greedy Forward Gradient Activity-Perturbed 的前向梯度方法。雖然這些方法使用了不同的架構,并且不像 NoProp 那樣顯式地對圖像輸入進行條件約束 —— 這使得直接比較變得困難 —— 但 NoProp 具有不依賴前向傳播的獨特優勢。



此外,如表 2 所示,NoProp 在訓練過程中減少了 GPU 內存消耗。



為了說明學習到的類別嵌入,圖 2 可視化了 CIFAR-10 數據集中類別嵌入的初始化和最終學習結果,其中嵌入維度與圖像維度匹配。



在連續時間設置下,NoProp-CT 和 NoProp-FM 的準確率低于 NoProp-DT,這可能是由于它們對時間變量 t 的額外條件約束。然而,它們在 CIFAR-10 和 CIFAR-100 數據集上通常優于伴隨敏感性方法,無論是在準確率還是計算效率方面。雖然伴隨方法在 MNIST 數據集上達到了與 NoProp-CT 和 NoProp-FM 相似的準確率,但其訓練速度明顯較慢,如圖 3 所示。



對于 CIFAR-100 數據集,當使用 one-hot 編碼時,NoProp-FM 無法有效學習,導致準確率提升非常緩慢。相比之下,NoProp-CT 仍然優于伴隨方法。然而,一旦類別嵌入與模型聯合學習,NoProp-FM 的性能顯著提高。







更多詳細內容請參見原論文。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
美媒緊盯:中國,60天了…

美媒緊盯:中國,60天了…

觀察者網
2025-04-07 15:56:08
毛新宇看望86歲的姑姑李敏,李敏忍不住哭了,毛新宇也掉了眼淚

毛新宇看望86歲的姑姑李敏,李敏忍不住哭了,毛新宇也掉了眼淚

李昕言溫度空間
2025-01-09 20:20:04
歐盟準備加入反制美國的陣營,意義重大,特朗普已經無力回天

歐盟準備加入反制美國的陣營,意義重大,特朗普已經無力回天

遠方的獅
2025-04-07 23:56:17
CBA最差外援?上場9分鐘,球隊輸14分,球迷:態度差,在場上散步

CBA最差外援?上場9分鐘,球隊輸14分,球迷:態度差,在場上散步

籃球專區
2025-04-07 22:53:59
南京同曦0:2不敵新疆被淘汰出局,誰注意到曾繁日,他怒吼林葳

南京同曦0:2不敵新疆被淘汰出局,誰注意到曾繁日,他怒吼林葳

觀察鑒娛
2025-04-08 09:11:33
想回頭也難了!寧愿“自毀前程”也要取悅美國,中國決定撤離援助

想回頭也難了!寧愿“自毀前程”也要取悅美國,中國決定撤離援助

科學知識點秀
2025-04-05 08:20:05
“魯A99999”套牌車街頭被查,山東警方通報:拘留、罰款

“魯A99999”套牌車街頭被查,山東警方通報:拘留、罰款

FM93浙江交通之聲
2025-04-08 06:25:55
文聯韋立被查,韋立多張高顏值照片流出

文聯韋立被查,韋立多張高顏值照片流出

風云觀察者
2025-04-05 16:13:59
CBA觀察|生涯至今最郁悶一戰 他們直接把楊瀚森吹哭了

CBA觀察|生涯至今最郁悶一戰 他們直接把楊瀚森吹哭了

狼叔評論
2025-04-07 23:05:22
救命!北京圓柏花粉遮天蔽日,能不能把樹砍了?

救命!北京圓柏花粉遮天蔽日,能不能把樹砍了?

科普中國
2025-04-07 21:15:51
央視怒批!目不識丁、丟人現眼,難怪兩會上馮遠征建議演員多學習

央視怒批!目不識丁、丟人現眼,難怪兩會上馮遠征建議演員多學習

峰哥娛樂動漫
2025-03-10 08:22:49
華爾街開始坐立不安,一旦重現2008年金融危機,中國不會再救美國

華爾街開始坐立不安,一旦重現2008年金融危機,中國不會再救美國

滄海一書客
2025-04-07 12:46:27
我53歲,退休后才發現,有退休金和沒退休金的生活,有天壤之別

我53歲,退休后才發現,有退休金和沒退休金的生活,有天壤之別

蟬吟槐蕊
2025-04-07 09:11:47
女籃2米11國手生理期堅持參賽,血染球褲,賽后發文道歉

女籃2米11國手生理期堅持參賽,血染球褲,賽后發文道歉

米修體育
2025-04-08 01:41:28
羅晉:我這輩子最正確的決定,就是錯過苗圃后,娶了比我火的唐嫣

羅晉:我這輩子最正確的決定,就是錯過苗圃后,娶了比我火的唐嫣

宇哥看世界ii
2025-04-06 17:18:22
80后國企“美女董事長”:掌管500億資產,白天工作,晚上解扣子

80后國企“美女董事長”:掌管500億資產,白天工作,晚上解扣子

boss外傳
2025-03-13 18:05:03
有一個事,不知道大家發現沒有
?就是戚薇和李承鉉太不正常了

有一個事,不知道大家發現沒有 ?就是戚薇和李承鉉太不正常了

小光侃娛樂
2025-04-06 12:55:05
中國跳水隊1天連丟2金:男子10米臺+男雙3米板全失守 敗給同1對手

中國跳水隊1天連丟2金:男子10米臺+男雙3米板全失守 敗給同1對手

風過鄉
2025-04-07 12:39:39
直播吧:美方經紀公司將動用大量資源助林葳沖擊NBA

直播吧:美方經紀公司將動用大量資源助林葳沖擊NBA

直播吧
2025-04-08 08:53:03
陳幸同退賽太原站!內藏兩大玄機:鎖死張本美和,護航王曼昱!

陳幸同退賽太原站!內藏兩大玄機:鎖死張本美和,護航王曼昱!

大嘴說臺球
2025-04-07 17:31:13
2025-04-08 09:59:00
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
10324文章數 142285關注度
往期回顧 全部

科技要聞

特朗普堅持征收關稅 周一美科技股劇烈震蕩

頭條要聞

美方威脅進一步對華加征50%關稅 商務部回應

頭條要聞

美方威脅進一步對華加征50%關稅 商務部回應

體育要聞

刷屏中文互聯網,甲亢哥是怎么火的?

娛樂要聞

李玟離世兩年!清明前夕姐姐趕到武漢紀念

財經要聞

"中國版平準基金"橫空出世 央行最新表態

汽車要聞

途昂Pro的五套組合拳打完 看清油車的自我救贖

態度原創

手機
旅游
藝術
本地
公開課

手機要聞

谷歌向 Pixel 9 /三星 S25 推出 Gemini Live AI“實時拍攝”功能

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

本地新聞

我在新昌當女主|大佛寺氛圍感拉滿 古偶頂流機位GET

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 河东区| 古田县| 泰安市| 衡水市| 图们市| 凤山县| 乌鲁木齐市| 新源县| 藁城市| 循化| 将乐县| 子长县| 宁蒗| 松桃| 鄯善县| 威信县| 若尔盖县| 东台市| 清水河县| 三河市| 科技| 永仁县| 宾阳县| 遂平县| 淅川县| 昆山市| 库伦旗| 金秀| 波密县| 巫溪县| 景德镇市| 宜都市| 铜山县| 保亭| 九江市| 广平县| 中江县| 三明市| 江北区| 龙泉市| 台北市|