在剛剛éŽåŽ»çš„æ©Ÿå™¨å¸ç¿’é ‚æœƒâ€”â€”ç¥žç¶“ä¿¡æ¯è™•ç†ç³»çµ±å¤§æœƒï¼ˆNeurIPS,Neural Information Processing Systems)上,ç«å‡ºåœˆçš„æ—¢æœ‰ OpenAI å‰é¦–å¸ç§‘å¸å®¶ä¼Šçˆ¾äºžÂ·è˜‡èŒ¨å…‹ç¶ï¼ˆIlya Sutskever)的“é è¨“ç·´çµæŸâ€è¨€è«–,也有美國ç´ç´„大叿•™æŽˆ Kyunghyun Cho çš„æœƒåŽæ„Ÿæƒ³æ–‡ç« 《我在 NeurIPS’24 上感å—到了焦慮和挫敗》。
而一åä¾†è‡ªå¾·åœ‹æ¼¢å ¡çš„ 00 åŽè²åˆ©å…‹æ–¯Â·å½¼å¾—森(Felix Petersen)也å°å°åœ°å‡ºåœˆäº†ä¸€æŠŠã€‚æ—©å¹´ï¼Œå½¼å¾—æ£®åœ¨å¾·åœ‹æ´ªå ¡æ–‡ç†ä¸å¸è®€æ›¸ï¼ŒåŽä¾†åœ¨å¾·åœ‹åº·æ–¯å¦èŒ¨å¤§å¸è®€å®Œæœ¬ç§‘å’Œåšå£«ã€‚
17 æ²æ™‚,他開發出一種 X 射線激光器,一度曾引起æ¥ç•Œé—œæ³¨ï¼Œå¹¶å¾—åˆ°äº†å¾·åœ‹åª’é«”çš„å ±é“ã€‚å‰›åˆ°å¤§å¸æ™‚,他ä¸åƒ…已能輔導別人,還管ç†è‘—å¾·åœ‹æ´ªå ¡é«”è‚²é¤¨çš„æ©Ÿå™¨äººå°çµ„。
(來æºï¼šSüDKURIER)
圖 | 19 æ²æ™‚的彼得森(來æºï¼šå½¼å¾—森個人主é )
ç›®å‰ï¼Œä»–在美國斯å¦ç¦å¤§å¸åšåšå£«åŽï¼Œå¸«å¾žäºŽè©²æ ¡çš„æ–¯ç‰¹å‡¡è«¾Â·åŸƒçˆ¾è’™ï¼ˆStefano Ermon)教授。在本次 NeurIPS 上,彼得森展示了自己和導師è¨è¨ˆçš„ç”±é‚輯門組æˆçš„神經網絡(下稱“é‚輯門網絡â€ï¼‰ã€‚
圖 | 彼得近照森(來æºï¼šhttps://petersen.ai/)
é—œäºŽé€™ä¸€æˆæžœçš„相關論文已以《å·ç©å¯å¾®åˆ†é‚輯門網絡》(Convolutional Differentiable Logic Gate Networks)為題發在arXiv上 [1]。
圖 | 相關論文 (來æºï¼šarXiv)
讓é‚輯門網絡變得“æ¾å¼›â€
那么,彼得森為何è¦ç ”發é‚輯門網絡?
這è¦å¾ž GPT-4 å’Œ Stable Diffusion ç‰å¤§æ¨¡åž‹èªªèµ·ï¼Œåœ¨é€™äº›å¤§æ¨¡åž‹ä¸ç¥žç¶“網絡是通éŽå°‡æ„ŸçŸ¥å™¨é€£æŽ¥åœ¨ä¸€èµ·è€Œæ§‹å»ºçš„,感知器是å°äººé¡žå¤§è…¦ç¥žç¶“元的一種高度簡化模擬。
盡管感知器éžå¸¸å¼·å¤§ï¼Œä½†æ˜¯å®ƒå€‘也消耗了大é‡èƒ½é‡ï¼Œä»¥è‡³äºŽå¾®è»Ÿå·²ç¶“锿ˆäº†ä¸€é …å”è°è¦é‡æ–°å•Ÿå‹•ä¸‰é‡Œå³¶æ ¸é›»ç«™ï¼Œä»¥ä¾¿ç‚ºå…¶äººå·¥æ™ºèƒ½é€²æ¥æä¾›å‹•åŠ›ã€‚
部分å•é¡Œåœ¨äºŽæ„ŸçŸ¥å™¨åªæ˜¯è»Ÿä»¶å±¤é¢çš„æŠ½è±¡ã€‚在圖形處ç†å™¨ï¼ˆGPU,Graphics Processing Unit)上é‹è¡Œæ„ŸçŸ¥å™¨ç¶²çµ¡çš„æ™‚候,需è¦å°‡é€™ä¸€ç¶²çµ¡è½‰æ›ç‚ºç¡¬ä»¶èªžè¨€ï¼Œè€Œé€™éœ€è¦æ™‚間和能é‡ã€‚
但是,直接使用硬件來構建網絡則能çœåŽ»å¾ˆå¤šæˆæœ¬ã€‚彼得森èªç‚ºï¼Œèˆ‡æ”¯æŒå¤§å¤šæ•¸ç¾ä»£äººå·¥æ™ºèƒ½ç³»çµ±çš„傳統神經網絡相比,直接å˜äºŽè¨ˆç®—機芯片硬件ä¸çš„神經網絡å¯ä»¥æ›´å¿«åœ°è˜åˆ¥åœ–åƒï¼Œå¹¶ä¸”æ¶ˆè€—çš„èƒ½é‡æ›´å°‘。
未來æŸä¸€å¤©ï¼Œç›´æŽ¥å˜äºŽè¨ˆç®—機芯片硬件ä¸çš„神經網絡甚至å¯ä»¥ç›´æŽ¥å…§ç½®åˆ°æ™ºèƒ½æ‰‹æ©Ÿå’Œå…¶ä»–è¨å‚™çš„芯片ä¸ï¼Œå¾žè€Œå¤§å¤§æ¸›å°‘呿œå‹™å™¨ç™¼é€æ•¸æ“šå’Œå¾žæœå‹™å™¨ç™¼é€æ•¸æ“šçš„需求。
那么,該怎樣實ç¾ä¸Šè¿°ç›®æ¨™ï¼Ÿå¦‚剿‰€è¿°ï¼Œå½¼å¾—森è¨è¨ˆäº†ç”±é‚輯門組æˆçš„神經網絡。
é‚輯門,是計算機芯片的基本構建模塊。é‚輯門由晶體管組æˆï¼Œå®ƒå¯ä»¥æŽ¥å—兩個比特(1 或 0ï¼‰ä¾†ä½œç‚ºè¼¸å…¥ï¼Œå¹¶èƒ½æ ¹æ“šç‰¹å®šæ™¶é«”ç®¡æ¨¡å¼è¦å®šçš„è¦å‰‡è¼¸å‡ºä¸€å€‹æ¯”特。
å°±åƒæ„ŸçŸ¥å™¨ä¸€æ¨£ï¼Œé‚輯門å¯ä»¥éˆæŽ¥æˆç¶²çµ¡ã€‚而é‹è¡Œé‚輯門網絡å¯è¬‚既便宜ã€åˆå¿«é€Ÿã€åˆç°¡å–®ã€‚彼得森在 NeurIPS 的演講ä¸è¡¨ç¤ºï¼Œé‚輯門網絡的能耗比感知器網絡低數åè¬å€ã€‚
(來æºï¼šarXiv)
ç›®å‰ï¼Œå½¼å¾—森并沒有刻æ„去尋找構建節能人工智能網絡的方法。他是基于å°äºŽâ€œå¯å¾®åˆ†æ¾å¼›ï¼ˆdifferentiable relaxations)â€çš„興趣,æ‰é–‹å§‹ç ”ç©¶é‚輯門。
å¯å¾®åˆ†æ¾å¼›ï¼ŒæŒ‡çš„æ˜¯å°‡æŸé¡žæ•¸å¸å•題變æˆå¾®ç©åˆ†å¯ä»¥è§£æ±ºçš„å½¢å¼ã€‚讓深度å¸ç¿’é©å‘½æˆç‚ºå¯èƒ½çš„åå‘傳æ’(訓練)算法,是應用å¯å¾®åˆ†æ¾å¼›æ–¹æ³•的一個經典案例。
但是,由于åå‘å‚³æ’æ˜¯åŸºäºŽå¾®ç©åˆ†è€Œæ§‹å»ºçš„ï¼Œå› æ¤å¹¶ä¸èƒ½ç›´æŽ¥ç”¨äºŽè¨“ç·´é‚輯門網絡。é‚輯門åªèƒ½ç”¨ 0 å’Œ 1,而微ç©åˆ†éœ€è¦å¾—到 0 å’Œ 1 之間的所有ä¸é–“值。
為æ¤ï¼Œå½¼å¾—森è¨è¨ˆäº†ä¸€ç¨®æ–¹æ³•:創建類似于使用 0 和使用 1 çš„é‚輯門ã€åŒæ™‚也能給出ä¸é–“å€¼ç”æ¡ˆçš„函數,讓é‚輯門網絡變得“æ¾å¼›â€ï¼Œä»¥ä¾¿èƒ½å¤ 進行åå‘傳æ’。
通éŽè¨“練這些門é‹è¡Œæ¨¡æ“¬ç¶²çµ¡ï¼Œå¯ä»¥å°‡é‚輯門網絡轉æ›å›žèƒ½åœ¨è¨ˆç®—機硬件ä¸å¯¦ç¾çš„æ±è¥¿ã€‚
這種方法的一個挑戰是,“æ¾å¼›â€çš„網絡很難被訓練。網絡ä¸çš„æ¯å€‹ç¯€é»žæœ€çµ‚éƒ½æœ‰å¯èƒ½æˆç‚º 16 個ä¸åŒé‚輯門ä¸çš„任何一個,與æ¯å€‹é‚輯門相關的 16 ç¨®æ¦‚çŽ‡å¿…é ˆè¢«è¿½è¹¤è¢«è¨˜éŒ„å¹¶ä¸æ–·è¢«èª¿æ•´ã€‚
而這需è¦å¤§é‡çš„æ™‚間和能é‡ã€‚彼得森說,相比在 GPU ä¸Šè¨“ç·´å‚³çµ±ç¥žç¶“ç¶²çµ¡ï¼Œè¨“ç·´ä»–æ‰€æ‰“é€ çš„é‚輯門網絡在時間上è¦å¤šå‡ºæ•¸ç™¾å€ã€‚åœ¨ç„¡æ³•è² æ“”æ•¸åè¬ GPU 的大å¸é‡Œï¼ŒGPU åœ¨æ™‚é–“åˆ†é…æ”¶ç´æŸœå¾ˆé›£å‘¨è½‰å¾—開。
å› æ¤ï¼Œå½¼å¾—森與åˆä½œè€…開發了é‚輯門網絡。盡管開發éŽç¨‹ç„¡æ¯”困難,但是一旦網絡經éŽè¨“練,它就會變得越來越便宜。
二進制神經網絡,則是å¦å¤–一種已有的超高效網絡,在這一網絡ä¸éœ€è¦ä½¿ç”¨åªèƒ½è™•ç†äºŒé€²åˆ¶å€¼çš„簡化感知器。為了驗è‰é‚輯門網絡的效果,彼得森將它與二進制神經網絡進行比較。
在åšå°æ¯”時他使用了 CIFAR-10 數據集,該數據集包括從“é’è›™â€åˆ°â€œå¡è»Šâ€ç‰ 10 種ä¸åŒé¡žåˆ¥çš„低分辨率圖片。
他讓é‚è¼¯é–€ç¶²çµ¡å’ŒäºŒé€²åˆ¶ç¥žç¶“ç¶²çµ¡ï¼ŒåŒæ™‚é‡å° CIFAR-10 數據集ä¸çš„圖åƒé€²è¡Œåˆ†é¡žï¼Œå€Ÿæ¤ç™¼ç¾é‚輯門網絡與其他方法åšå¾—一樣好。
具體來說:相比其他分類神經網絡所需的é‚輯門數é‡ï¼Œé‚輯門網絡所使用的é‚輯門數é‡ä¸åƒ…低于å‰è€…所需數é‡çš„å分之一,并在ä¸åˆ°åƒåˆ†ä¹‹ä¸€çš„æ™‚間內完æˆäº†åŒä¸€ä»»å‹™ã€‚
ç¾å ´å¯ç·¨ç¨‹é–€é™£åˆ—(FPGA,Field Programmable Gate Array),å¯è¢«ç”¨äºŽæ¨¡æ“¬é‚輯門的多種ä¸åŒæ½›åœ¨æ¨¡å¼ã€‚
為æ¤ï¼Œå½¼å¾—森使用了 FPGA測試了é‚輯門網絡。這是一種å¯ç·¨ç¨‹è¨ˆç®—機芯片,å¯ç”¨äºŽæ¨¡æ“¬é‚輯門的多種ä¸åŒæ½›åœ¨æ¨¡å¼ï¼ˆçµ„åˆï¼‰ã€‚
事實上,也å¯ä»¥åœ¨å°ˆç”¨é›†æˆé›»è·¯ï¼ˆASIC,Application Specific Integrated Circuit)芯片上實ç¾è©²ç¶²çµ¡ï¼Œé€™æ¨£é‚„能進一æ¥é™ä½Žæˆæœ¬ï¼Œå› 為 FPGA ä½¿ç”¨äº†æ›´å¤šçµ„ä»¶æ•…å…¶æˆæœ¬æ›´é«˜ã€‚
åœ¨ä¸€äº›è³‡æºæœ‰é™çš„å ´æ™¯ä¸ï¼Œæ¯”如在移動è¨å‚™å’ŒåµŒå…¥å¼ç³»çµ±ä¸Šï¼Œå®ƒå€‘å°äºŽèƒ½é‡å’Œé€Ÿåº¦çš„è¦æ±‚很高。而å³ä½¿åœ¨è™•ç†èƒ½åŠ›æœ‰é™çš„環境ä¸ï¼Œé‚輯門網絡也能讓深度å¸ç¿’繼續工作。
(來æºï¼šarXiv)
或在機器å¸ç¿’é ˜åŸŸé–‹è¾Ÿæ›´å¤šå¯èƒ½æ€§
ä¸éŽï¼Œå°äºŽå½¼å¾—æ£®çš„ç ”ç©¶æˆæžœï¼Œä¹Ÿæœ‰å¸è€…å°äºŽå…¶æ‡‰ç”¨å‰æ™¯è¡¨ç¤ºæ“”æ†‚ã€‚ç¾Žåœ‹åŠ å·žå¤§å¸åœ£åœ°äºžå“¥åˆ†æ ¡é›»æ°£èˆ‡è¨ˆç®—機工程教授法里ç´èŒ²Â·åº«å°šæ³•爾(Farinaz Koushanfar)表示,她ä¸ç›¸ä¿¡é‚輯門網絡在é¢è‡¨æ›´ç¾å¯¦çš„å•é¡Œæ™‚èƒ½å¤ ç™¼æ®ä½œç”¨ã€‚
她說:“這是一個有趣的想法,但我ä¸ç¢ºå®šå®ƒçš„è¦æ¨¡æœ‰å¤šå¤§ã€‚â€å¥¹æŒ‡å‡ºï¼Œé‚輯門網絡åªèƒ½é€šéŽ relaxation ç–略進行近似訓練,而近似訓練å¯èƒ½æœƒå¤±æ•—。
盡管目å‰çœ‹èµ·ä¾†å•題ä¸å¤§ï¼Œä½†æ˜¯åº«å°šæ³•爾表示隨著網絡的發展,å•題å¯èƒ½æœƒè¶Šä¾†è¶Šå¤§ã€‚
彼得森也承èªï¼Œè®“é‚è¼¯é–€çš„æ€§èƒ½åª²ç¾Žå‚³çµ±ç¥žç¶“ç¶²çµ¡å¹¶ä¸æ˜¯ä»–çš„ç›®æ¨™ã€‚é€ å‡ºæœ‰æ•ˆä¸”ç›¡å¯èƒ½é«˜æ•ˆçš„æ±è¥¿å°±è¶³å¤ äº†ã€‚â€œé€™ä¸æœƒæ˜¯æœ€å¥½çš„æ¨¡åž‹ã€‚â€ä»–說,“但它應該是最便宜的。â€
é‚è¼¯é–€ç¶²çµ¡åœ¨åœ–åƒæ¨™è¨˜ç‰ä»»å‹™ä¸Šçš„表ç¾ä¸å¦‚傳統神經網絡,但美國康奈爾大å¸é›»æ°£èˆ‡è¨ˆç®—機工程教授 Zhiru Zhang 表示,這種方法的速度和效率使其潛力巨大。
他說:“如果我們能縮å°å·®è·ï¼Œé‚£ä¹ˆé€™å¯èƒ½æœƒåœ¨æ©Ÿå™¨å¸ç¿’çš„é€™ä¸€é ˜åŸŸé–‹è¾Ÿå¾ˆå¤šå¯èƒ½æ€§ã€‚â€
å› æ¤ï¼Œå½¼å¾—森å°äºŽæœªä¾†å¾ˆæœ‰ä¿¡å¿ƒã€‚他打算繼續改進é‚è¼¯é–€ç¶²çµ¡çš„èƒ½åŠ›ï¼Œå¹¶æœŸå¾…æœ€çµ‚èƒ½å¤ å‰µå»ºä¸€å€‹â€œç¡¬ä»¶åŸºç¤Žæ¨¡åž‹â€ã€‚
試想一下,å‡å¦‚一個é‚輯門網絡ä¸åƒ…功能強大而å¯ä»¥å¯¦ç¾é€šç”¨ï¼Œé‚£ä¹ˆå°±èƒ½ç›´æŽ¥åœ¨èŠ¯ç‰‡ä¸Šå¯¦ç¾å¤§è¦æ¨¡æ‡‰ç”¨ï¼Œè€Œé€™äº›èŠ¯ç‰‡é€²è€Œèƒ½è¢«é›†æˆåˆ°æ‰‹æ©Ÿå’Œè¨ˆç®—機ç‰è¨å‚™ä¸ã€‚
é€™æ¨£ä¸€ä¾†å°±æœ‰æœ›å¸¶ä¾†å·¨å¤§çš„èƒ½æºæ•ˆç›Šã€‚如果é‚輯門網絡能從低分辨率信æ¯ä¸ï¼Œæœ‰æ•ˆåœ°é‡å»ºç…§ç‰‡å’Œé‡å»ºè¦–é »ï¼Œé‚£ä¹ˆæœå‹™å™¨å’Œå€‹äººè¨å‚™ä¹‹é–“所需è¦ç™¼é€çš„æ•¸æ“šå°±æœƒå°‘得多。
åƒè€ƒè³‡æ–™ï¼š
1.https://arxiv.org/abs/2411.04732
https://www.suedkurier.de/region/kreis-konstanz/konstanz/Streng-geheimes-Forschungsprojekt-17-jaehriger-Informatik-Student-entwickelt-neuartigen-Roentgenlaser;art372448,9184349
https://www.technologyreview.com/2024/12/20/1109183/the-next-generation-of-neural-networks-could-live-in-hardware/
https://www.linkedin.com/in/felix-petersen-4aa014140/
https://petersen.ai/
é‹ç‡Ÿ/排版:何晨é¾
ç‰¹åˆ¥è²æ˜Žï¼šä»¥ä¸Šå…§å®¹(å¦‚æœ‰åœ–ç‰‡æˆ–è¦–é »äº¦åŒ…æ‹¬åœ¨å…§)為自媒體平臺“網易號â€ç”¨æˆ¶ä¸Šå‚³å¹¶ç™¼å¸ƒï¼Œæœ¬å¹³è‡ºåƒ…æä¾›ä¿¡æ¯å˜å„²æœå‹™ã€‚
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.