99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

只因論文「碰瓷」,ICLR 2025區(qū)域主席直接拒稿!最強rebuttal,贏回榮耀

0
分享至


新智元報道

編輯:KingHZ

【新智元導讀】1%合成數(shù)據(jù),就能讓AI模型瞬間崩潰!如此顛覆性發(fā)現(xiàn),只因未引用他人論文,ICLR區(qū)域主席直接拒稿,好在作者成功rebuttal,論文最終選為Spotlight。而背后,竟是一樁圖靈獎得主Yann Lecun關注的學界爭議!

ICLR 2025,公開審稿,多級反轉(zhuǎn)!

只因沒有引用COLM 2024會議的一篇論文,區(qū)域主席根據(jù)公開評論,竟建議拒絕投稿論文!

雖然最終論文《強模型崩潰》(Strong Model Collapse)被接受,并選為亮點論文(Spotlight),但過程可謂危險至極!


來自Meta等研究機構證實:1%合成數(shù)據(jù),就能讓模型瞬間崩潰。

作者將文章投稿ICLR 2025后,審稿人對這篇論文的評價一致為正面。

區(qū)域主席(Area Chair),基于公開評論建議拒絕該論文,只因缺少對COLM 2024論文的引用。

即便在OpenReview上的私下討論(公眾無法查看)中,審稿人最終決定,缺少這篇引用不能成為拒絕的唯一依據(jù)。

但區(qū)域主席推翻了審稿人的意見,建議拒絕了此論文。

收到投訴后,ICLR決定審查此案。

調(diào)查后,一致決定支持審稿人的意見,因此最終接受了這篇論文。

任何平均得分高于閾值的論文,將自動考慮作為亮點論文。


評審意見主頁:https://openreview.net/forum?id=et5l9qPUhm

公開評審:李鬼倒打李逵?

對ICLR論文提出疑問的斯坦福大學CS博士生Rylan Schaeffer,他是COLM 2024下列論文的作者。


他強調(diào),ICLR 2025的論文《強模型崩潰》作者,故意不引用COLM 2024論文:

1.他們明確知曉有一篇先前的已發(fā)布工作,直接與他們的敘述和科學主張相矛盾;

2.他們使用了該先前工作中提出的方法論,而同時又侮辱了該工作并未給予應有的致謝。

他堅持認為ICLR 2025投稿論文是故意壓制矛盾證據(jù),混淆對模型崩潰(潛在)危害的理解。

ICLR的作者就是赤裸裸的學術不端,是科學界的恥辱!

特別是對于ICLR沒有引用他寫作的COLM 2024論文,他認為這無法忍受。

我們懇請評審專家和區(qū)域主席要求《強模型崩潰》的作者解決以下問題:

1.此項工作與現(xiàn)有關于避免模型崩潰文獻的關系,

2.如何解釋看似矛盾的結論產(chǎn)生的不同建模假設,以及哪種假設最能反映現(xiàn)實場景。

評估哪些假設最符合現(xiàn)實場景對于評估這項工作的實際影響至關重要。

在去年,Rylan Schaeffer就表示,如果對模型崩潰(model collapse)有興趣,強烈要求閱讀他們的COLM 2024論文。


反駁:Rylan Schaeffer才是抄襲者

在得到會議程序委員會及歷任主席一致認同后,ICLR論文一作Elvis Dohmatob,在X上公開回應了Rylan Schaeffer的指責,認為Rylan Schaeffer存在嚴重的不當行為:

抄襲我們的先前工作,

論文內(nèi)容主要由人工智能生成(是的,作者將我們的論文輸入到LLM中生成了另一篇論文),

違反倫理審查委員會(IRB)規(guī)定等。

在長時間的雙方溝通中,這些問題逐步被揭露出來。

在帖子后,ICLR 2025官方賬號,澄清了提交論文4488評審的過程,真如開頭所言。


NYU教授還原全過程

去年,《強模型崩潰》的作者Julia Kempe和「李鬼」Rylan Schaeffer多次溝通,公開了論文其他作者的道歉郵件。

特別是,模型崩潰、混合原始數(shù)據(jù)與合成數(shù)據(jù)等領域已有很多優(yōu)秀論文的情況下(包括在《自然》雜志上發(fā)表的文章),當Gerstgrasser等人首次向發(fā)送他們《模型崩潰是不可避免的嗎?》的v1版本時,很少有對一發(fā)表論文的相關討論。

甚至有Rylan Schaeffer的合著者表示論文粗制濫造, 就是趕鴨子上架:

他們斯坦福的導師跟他們來往并不密切。

學生趕在截止日期前,馬上提交論文。我們對論文粗制濫造的關切,幾乎被漠視了。

可悲的是,這已經(jīng)成為他們的文化的一部分。

至于沒有引用相關論文的原因,我直到現(xiàn)在仍然不明白。


更加驚訝的是,「李鬼」Rylan Schaeffer所謂的「模型坍塌必讀理論」,是Julia Kempe之前定理的一個微不足道的推論,而且Rylan Schaeffer的論文還具有誤導性。

但奇怪的是,這些公式化的表述與論文中的語言相似,符號也古怪地相似:


左:「李逵」的論文符號,右:「李鬼」的論文符號

然而,隨后Julia Kempe等明白了!

在指出了最明顯的遺漏后,「李鬼」論文的作者等人發(fā)送了一份報告,暗示Julia Kempe等人的反饋,被AI用來合成論文。


Julia Kempe等人被當作免費勞動力使用,這令Julia Kempe大開眼界!

但可悲的是,Rylan Schaeffer等人的論文雖被COLM 2024接受,但仍然包含誤導性結論。

在涉及到個人學術聲譽的斗爭中,Julia Kempe也得到了同事的支持,甚至得到了圖靈獎得主、AI大佬Yann Lecun的關注和支持!


模型崩潰與合成數(shù)據(jù)

雙方的焦點在于「模型崩潰」。

第1點:關于Gerstgrasser等人的論文與先前工作的科學矛盾。

Gerstgrasser等人的論文,并沒有以任何有意義的方式避免模型崩潰。

正方Julia Kempe等人,在ICLR 2025論文中,明確將「模型崩潰」定義為「AI模型性能的重大下降」。

避免模型崩潰意味著:縮小使用真實數(shù)據(jù)和合成數(shù)據(jù)訓練時的性能差距。

反方Rylan Schaeffer、Gerstgrasser等人,將避免模型崩潰定義為:「在多次訓練模型時,防止發(fā)生遞歸性退化」。

該論文承認,盡管當樣本逐漸積累時,性能退化是有界的,但仍然存在性能損失。

這一定義僅代表了縮小真實數(shù)據(jù)和合成數(shù)據(jù)之間差距的部分條件。從這個意義上講,Gerstgrasser等人并未解決或緩解模型崩潰問題。

在關于模型崩潰的大多數(shù)文獻中,主流觀點認為,縮小性能差距是避免模型崩潰的主要標準。

從實際角度來看,縮小真實數(shù)據(jù)與合成數(shù)據(jù)之間的差距,是避免模型崩潰的更具操作性和相關性的定義。

僅僅確保性能不出現(xiàn)發(fā)散,仍然可能導致模型無法匹配合成數(shù)據(jù)生成器的質(zhì)量,從而使合成數(shù)據(jù)對性能造成損害。

只有當性能差距完全縮小時,合成數(shù)據(jù)的負面影響才能完全減輕。

由于定義和理由上的差異,考慮到縮小性能差距是正確的定義,通過這一廣泛接受的視角,正方Julia Kempe等人已經(jīng)重新審視了所有關于模型崩潰的相關工作。

第二點:與Gerstgrasser等人的先前互動

不幸的是,公開評論似乎破壞了審稿過程的匿名性。

正反雙方的確有過互動。

以下是該互動的簡要總結:

  1. 技術上不足:Gerstgrasser等人的論文只是增量性的技術貢獻,而且非常薄弱。它不過是對已有論文的已有設定和論點的輕微修改。其結果是已有定理的簡單推論。

  2. 誤導性/不準確的結論:Gerstgrasser等人的論文并未以任何合理的方式解決模型崩潰問題(請參見上文關于定義的討論)。

不幸的是,Gerstgrasser等人,基本上忽視了互動的建設性批評,甚至將評論僅作為腳注,附在論文的末尾。

因此,在目前的狀態(tài)下,正方仍然認為Gerstgrasser等人的論文,在科學上并不成立,因此沒有覺得有必要引用。

最終的論文結果,說明榮耀應該歸于Julia kempe等人。

這也與此前領域內(nèi)專家的意見一致。


參考資料:

https://x.com/dohmatobelvis/status/1911107171078615088

https://x.com/KempeLab/status/1817135401124934089

https://x.com/RylanSchaeffer/status/1911153029509992859

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領航智能+時代
12528文章數(shù) 66013關注度
往期回顧 全部

科技要聞

OpenAI放大招!GPT-4.1上線,編程戰(zhàn)力全開

頭條要聞

澤連斯基喊話特朗普訪烏:他才會明白俄羅斯做了什么

頭條要聞

澤連斯基喊話特朗普訪烏:他才會明白俄羅斯做了什么

體育要聞

他演過周星馳電影,62歲還要拿世界冠軍

娛樂要聞

專訪 | 王安宇:角色是為觀眾服務的

財經(jīng)要聞

特朗普攪亂貿(mào)易意欲何為?謎題即將解開

汽車要聞

B級車要集體失眠? 吉利銀河星耀8"全都要"

態(tài)度原創(chuàng)

旅游
藝術
健康
時尚
公開課

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

在中國,到底哪些人在吃“偉哥”?

水晶專場|| 百元級的快樂,鐘楚曦真的太會買首飾了!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 绍兴市| 东光县| 朝阳区| 鄂州市| 塘沽区| 泾阳县| 阜宁县| 瑞金市| 随州市| 枝江市| 登封市| 尤溪县| 文登市| 临安市| 年辖:市辖区| 柳河县| 绥中县| 兴城市| 鄯善县| 涪陵区| 五大连池市| 民乐县| 吉首市| 如东县| 铁岭市| 临潭县| 平邑县| 称多县| 开封县| 竹北市| 中江县| 丽水市| 伊吾县| 宿州市| 合阳县| 扶沟县| 盐山县| 洛川县| 汾阳市| 和静县| 武胜县|