99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

見證歷史!AI想的科研idea,真被人類寫成論文發表了

0
分享至

天啦擼!!AI想出來的idea,還真有人寫成論文了。

甚至預印本arXiv、博客、代碼全都有了。



今年8月,Sakana AI(由Transformer論文8位作者的最后一位Llion Jones創業成立)這家公司推出了史上首位“AI科學家”,且一登場就一口氣生成了十篇完整學術論文。



而現在,受其中一篇論文想法的啟發,人類研究員真的寫出相關論文并在arXiv上公開了。

OpenAI前研究團隊負責人Jeff Clune激動直言:

簡直不敢相信!這是它產生的我最喜歡的想法之一。看到與人類達成一致真是太酷了,人類確實執行得更好。



話不多說,讓我們來康康論文具體內容。

Claude提的idea,被人類寫成論文了

翻開“AI科學家”之前撰寫的論文,我們找到了Jeff Clune提到的這一篇。

《Grokking Through Compression: Unveiling Sudden Generalization via Minimal Description Length》
通過壓縮實現Grokking:借助最小描述長度(MDL)揭示突然泛化現象



根據描述,這篇論文的想法由Claude 3.5 Sonnet在第22次迭代時提出。

它主要探討了神經網絡中最小描述長度(MDL)與 “grokking” 現象(模型經長時間訓練后突然泛化)的關系,從信息論視角研究突然泛化的機制。

其中,MDL可以被看成一種衡量模型復雜度和可壓縮性的方法,即模型既要能夠很好地擬合數據,又不能過于復雜(避免過擬合)。



具體而言,研究引入了一種基于權重剪枝的新型MDL估計技術,并將其應用于多種數據集,包括模塊化算術和排列任務。相關實驗揭示了MDL減少與泛化能力提高之間存在強烈的相關性(下圖),MDL的轉變點通常在“grokking”事件發生之前或與之同時出現。

此外,研究觀察到在“grokking”與非“grokking”情境下MDL演變模式的差異,前者以快速的MDL減少后持續泛化為特征。這些發現為理解“grokking”的信息論基礎提供了見解,并表明在訓練期間監控MDL可以預測即將發生的泛化



Okk,了解了原論文,我們再來看人類選手最新發表的內容。



概括而言,他們研究了神經網絡在 “grokking” 現象中的復雜性動態,即網絡從記憶訓練數據到實現完美泛化的過渡過程,并提出了一種基于失真壓縮理論的新方法來衡量神經網絡的復雜性。

首先,作者之一Branton DeMoss自述,他們受到了Sean Carroll和Scott Aaronson之前研究的啟發。

通過觀察咖啡與奶油混合的現象,Scott等人發現復雜性隨著時間的推移首先上升,然后下降,這一過程與熵單調增加的趨勢相似。

而DeMoss團隊形式化了這一直覺,并將其應用于神經網絡,以跟蹤這些網絡學習的抽象復雜度。



展開來說,作者們同樣先介紹了grokking現象,即神經網絡在長時間過度擬合訓練數據后突然能夠泛化的能力。

其中x軸表示優化步數,y軸表示準確率;紅線代表訓練集的準確率,綠線代表驗證集的準確率。

可以看到,如果訓練一個小型Transformer來進行模擬,在幾百個訓練步驟之后,模型已經完美地擬合了訓練數據;然而,它直到大約10^5個訓練步驟才能實現泛化。



為了解釋這一現象,團隊引入了一種基于失真壓縮和Kolmogorov復雜性的新方法來衡量神經網絡的復雜性,并通過這一框架追蹤了grokking過程中網絡復雜性的動態變化。

按照作者的比喻,這就像“神經網絡的JPEG”。

研究結果表明,網絡在從記憶到泛化的過渡中,其復雜性首先上升,隨后在泛化發生時下降

進一步地,研究發現如果神經網絡沒有任何形式的正則化(一種防止過擬合的技術),它將無法從記憶階段過渡到泛化階段,而是會無限期地保持記憶模式。

沒有正則化的反應:



有正則化的反應:



此外,作者指出傳統的復雜性評判標準(如參數數量和權重范數)并不能準確描述模型的復雜性,因為它們忽略了訓練過程中的變化。

對此,他們采用了最小描述長度(MDL)原則和Kolmogorov復雜度來定義和近似復雜性,并通過實驗驗證了這種方法,并強調了簡單模型在數據壓縮中的優勢。

最終,研究表明理解復雜性對預測模型泛化能力至關重要。



更多細節感興趣可以查閱原論文(地址文末)。

可以看出,一個由AI最初提出的想法,最終由人類來完成了更細致的論證。

有網友就分析指出AI寫的那篇實驗結果不及人類研究員:



而之前撰寫過“AI科學家”總論文的共同一作Cong Lu也表示:

誰知道未來AI還會激發出哪些其他想法……



BTW,就在Sakana AI公布“AI科學家獨立生成10篇學術論文”的消息后,公司在9月份還拿到了一筆2億美元的A輪融資,里面還有英偉達的參與。

總之,AI以后不僅能自己寫論文,還能和人類搭配干活了。



特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
23分慘敗!上海隊還是嫩了一點,本來可以避開廣東

23分慘敗!上海隊還是嫩了一點,本來可以避開廣東

兩兄弟養牛
2025-04-12 04:51:58
王寶強倫敦街頭高調撒糖!新女友身高178cm,還是世界小姐兼學霸

王寶強倫敦街頭高調撒糖!新女友身高178cm,還是世界小姐兼學霸

白露文娛志
2025-04-12 00:44:10
奧美拉唑已被列為重點監控藥物!具體原因為何?長期服用有何影響

奧美拉唑已被列為重點監控藥物!具體原因為何?長期服用有何影響

今日養生之道
2025-03-16 05:33:40
蘭德爾接受采訪,愛德華茲更衣室大喊:我是全世界最好的,去告訴所有的女孩

蘭德爾接受采訪,愛德華茲更衣室大喊:我是全世界最好的,去告訴所有的女孩

雷速體育
2025-04-11 22:37:11
錫安場外生活太豐富了!兩名女友在其家中互毆,驚動警方

錫安場外生活太豐富了!兩名女友在其家中互毆,驚動警方

仰臥撐FTUer
2025-04-10 12:09:06
冤大頭!中國小伙花50萬在老撾蓋別墅,慘遭女友家驅趕送進去兩次

冤大頭!中國小伙花50萬在老撾蓋別墅,慘遭女友家驅趕送進去兩次

新語愛八卦
2025-04-11 11:17:02
盧卡申科說了實話:俄羅斯有可能“背棄”中國,但絕不會是現在

盧卡申科說了實話:俄羅斯有可能“背棄”中國,但絕不會是現在

前沿天地
2025-04-11 00:32:05
53票贊成46票反對!美國最新投票結果出爐,特朗普迎來3個壞消息

53票贊成46票反對!美國最新投票結果出爐,特朗普迎來3個壞消息

起喜電影
2025-04-11 18:06:17
特朗普對華關稅加至145%,綁架全球對抗中國?中方已找到美國軟肋

特朗普對華關稅加至145%,綁架全球對抗中國?中方已找到美國軟肋

小晨同學啊
2025-04-11 15:15:55
拉涅利:羅馬不是一天建成的,不過重返歐冠可不需要幾個世紀

拉涅利:羅馬不是一天建成的,不過重返歐冠可不需要幾個世紀

懂球帝
2025-04-12 02:09:23
最后時刻已過,特朗普沒等來中方電話,160多國卻收到中方通知

最后時刻已過,特朗普沒等來中方電話,160多國卻收到中方通知

消息快訊
2025-04-11 11:25:16
山東泰山4-0深圳新鵬城,賽后評分:不是克雷桑第1,山東22號第1

山東泰山4-0深圳新鵬城,賽后評分:不是克雷桑第1,山東22號第1

側身凌空斬
2025-04-11 21:28:32
每吃一次,大腦萎縮就快一步?這4種食物是大腦老化的“加速器”

每吃一次,大腦萎縮就快一步?這4種食物是大腦老化的“加速器”

腫瘤的真相與誤區
2025-02-18 19:35:20
未來10年,河北省3個縣或將“消失”,其中有你的家鄉嗎?

未來10年,河北省3個縣或將“消失”,其中有你的家鄉嗎?

嘆知
2025-04-11 14:28:05
馬英九:若大陸統一臺灣的手段不和平,過程不民主,臺灣人不接受

馬英九:若大陸統一臺灣的手段不和平,過程不民主,臺灣人不接受

紅色鑒史官
2025-04-08 23:05:02
特朗普支持者、美國大豆協會主席敦促美方停止對華貿易戰:豆農生計岌岌可危

特朗普支持者、美國大豆協會主席敦促美方停止對華貿易戰:豆農生計岌岌可危

環球網資訊
2025-04-11 11:49:27
逃離美國資產!美國股債匯三殺,標普一度接近熔斷,特朗普發聲,耶倫警告

逃離美國資產!美國股債匯三殺,標普一度接近熔斷,特朗普發聲,耶倫警告

華爾街見聞官方
2025-04-11 08:25:21
39歲澤尻英龍華樣貌激變!復出一年喜提新代言,網友嘆:這就是老天爺一再賞飯的臉!

39歲澤尻英龍華樣貌激變!復出一年喜提新代言,網友嘆:這就是老天爺一再賞飯的臉!

東京新青年
2025-04-11 18:38:31
為啥娃七八歲后家長就不熱衷于曬娃了?網友:自己看!

為啥娃七八歲后家長就不熱衷于曬娃了?網友:自己看!

有趣的火烈鳥
2025-04-09 16:25:09
美媒:一旦中國收復臺灣,美軍將全面空襲中國,解放軍會迎戰嗎?

美媒:一旦中國收復臺灣,美軍將全面空襲中國,解放軍會迎戰嗎?

青煙小先生
2025-04-10 06:30:05
2025-04-12 05:08:49
量子位 incentive-icons
量子位
追蹤人工智能動態
10303文章數 176094關注度
往期回顧 全部

科技要聞

單臺年入20萬!首批人形機器人致富者來了

頭條要聞

專家:不用太擔心關稅 現在要看的是中美雙方誰扛不住

頭條要聞

專家:不用太擔心關稅 現在要看的是中美雙方誰扛不住

體育要聞

球迷天天罵,但我們要進歐冠了

娛樂要聞

汪小菲馬筱梅婚禮又有了耐人尋味的新聞

財經要聞

造假累計數百億 揭秘東旭集團造假手法

汽車要聞

25款風云A8/T9/T10齊上市 多款車型發布一口價

態度原創

健康
家居
本地
手機
親子

在中國,到底哪些人在吃“偉哥”?

家居要聞

浪漫與優雅 不被定義的現代法式

本地新聞

華北將迎“歷史罕見”大風

手機要聞

iQOO Z10 Turbo系列再次被確認:真機已現身,性能配置也已清晰

親子要聞

媽媽送兒子去上學,在學校門口貼心叮囑。

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 西昌市| 增城市| 邵阳县| 富民县| 济南市| 逊克县| 嵊州市| 上饶县| 广水市| 名山县| 合阳县| 辽阳县| 鄱阳县| 武清区| 黄骅市| 河西区| 运城市| 耿马| 海盐县| 祁门县| 葫芦岛市| 安吉县| 昌都县| 个旧市| 阳山县| 许昌市| 灵璧县| 青海省| 崇礼县| 淮滨县| 乐亭县| 香港 | 嘉定区| 福清市| 孟连| 吐鲁番市| 顺义区| 林芝县| 修水县| 闵行区| 道孚县|