西諺有云:不想當將軍的士兵不是好士兵,在學術界我們也可以說,不想當PI的博士不是好博士。更高的學術職級通常意味著更多的學術資源和研究自由,但是晉升的機會永遠是有限的,因此所有的大學和研究機構都想有一套最好的標準來篩選出那些最優秀、最有想法的年輕人,把機會給他們可能獲得更高的回報。雖然全世界的標準制定者都宣稱自己的那套辦法是最科學、最客觀的,然而研究表明,絕大部分的標準依然還是圍著論文打轉,那么論文工廠的欣欣向榮也就是順理成章的事了。
圖源:pixabay.com
近期發表在Nature上的一篇論文進行了一項迄今為止最大規模的學術晉升標準研究,研究者對全球190所大學的314項政策和58個政府機構的 218 項政策進行匯總分析,包含了121個國家和地區,時間跨度從2016年到2023年,主要聚焦于正教授的晉升標準。研究發現,雖然許多政策都將研究影響、社會服務、國際合作和學術誠信等考察項目引入了評價體系,然而最重要的因素依然是論文:97%的政策納入了論文評價指標,92% 的政策規定了嚴格的定量指標,包括發表數量、期刊影響因子、引用量、專利數量等,甚至包括研究人員在作者名單中的排名順序,都可能獲得額外加分。[1]
532項政策中的不同評估標準
圖源:Nature(2025).
https://doi.org/10.1038/s41586-024-08422-9
分析顯示,亞洲的大學優先考慮研究成果和影響,但對知名度、更廣泛的社會參與度和專業經驗的重視程度低于歐洲大學。與歐洲機構相比,拉丁美洲的大學不太看重論文產出、知名度和參與度,大洋洲的機構則更注重研究成果和影響。他們觀察到,雖然美英德等高收入國家近年來在不斷強調對學者的研究質量進行更深入準確的評估而不是僅僅依靠論文指標,但是這只是很少的一些大學的個別領域的做法。而在大部分中等收入國家,論文指標是絕對的“硬標準”,相比于充分評價科學家的真實能力和成果,用指標當標準,簡單、高效,最重要的是,也更具有“客觀性”——就像貌似公平的高考一樣,一切拿分數說話最簡單。
研究人員也同意這種看法:當“符合標準”成為目標后,這些標準往往就很難再起到證明某些事情的能力,因為它很快就會被扭曲和操縱,這又被稱“坎貝爾定律”或者“古德哈特定律”。[2]既然論文指標直接關系到研究人員的職業生涯和發展前景,通過某種方式“優化”這個指標簡直就是順理成章的事。相比于大多說老老實實卷成果、卷學術的科學家,相當一部分的人選擇走捷徑:發表數量、期刊影響因子、引用量,這三大指標都可能成為操縱的目標,其中期刊影響因子當然是最困難的,那個甚至連期刊本身都很難精確控制,但是其余兩個都是“人力可為”的。
此前知社曾轉載過西班牙國家報的相關報道,西班牙最古老的大學薩拉曼卡大學的新任校長胡安?曼努埃爾?科爾查多(Juan Manuel Corchado)就熱衷于刷引用量,他利用自我引用、會議論文、關系引用以及作為編輯的職權組織了一個“引用卡特爾”,在幾年內給自己刷了45000個引用,用這個指標將自己塑造成了全球頂級AI專家,并以此謀得了校長之職。(參考閱讀:西班牙頂尖大學新任校長當選十天即遭調查)
9月27日,薩拉曼卡大學校長胡安·科爾查多出席新學年開學典禮。
圖源:USAL
這種方式效果雖然令人瞠目結舌,但卻是門檻頗高:沒有一定的行政級別帶來的權力和大量的人脈關系,相關操作很難奏效。對于更多的普通科學家來說,付錢給論文工廠幫忙發論文可能是更簡單的選擇。
長期關注學術誠信問題的公益組織撤稿觀察最近組織了一場小型研討會,出席的成員都是著名的“學術偵探”:伊麗莎白?比克、戴維?比姆勒、多蘿西?畢曉普、紀堯姆?卡巴納克,他們曾指出過數以千計的論文問題,帶來了不少的撤稿和更正聲明,但是按照他們的看法,他們做到的這些事實在是微不足道,因為偽造論文的生意規模之大,遠超人們的想象。
圖源:David Parkins
如果獲得一篇包含自己名字的論文呢?辦法真的很多:有一篇論文馬上就能發表,付錢把你的名字加上去就好了;胡亂湊一份手稿,發給編輯和評審都是“自己人”的刊物,保證發表;或者更專業一點的,在原始數據中加點料,P個圖片,就很容易得出想要的結論,然后找到恰好能忽略這個問題的編輯幫你發出去。
圖源:不可描述
自從2013年首次確認出售作者署名的案例后,包含上述各種手法的論文工廠迎來了爆炸式增長,一項估計表明,問題可能早得多——2000 年至 2022 年間發表的至少 40 萬篇論文顯示出論文工廠痕跡(見《自然》 第 623 卷,第 466-467 頁;2023 年)。而在同一時期,即便是目前最全面的撤稿觀察數據庫中,也只記錄了55000 篇論文被撤回或更正,要注意的是,許多撤回和更正可能只是正常學術活動的一部分而不是論文工廠的原因。[3]
學術偵探們認為,最原始的驅動力顯然來自上述的國際通行評價標準:論文指標的權重太大了,發得多就比發的少的人更容易晉升,而其中的風險卻是不對等的:做成了能晉升,做不成頂多白扔點錢,因為很少有類似買論文這種學術不端的人被徹底砸掉飯碗,從大學到出版商,對于調查問題論文的行動都非常緩慢而且不情不愿,原因是一旦證實,對自己的聲譽沒什么好處。“圖片女王” 伊麗莎白?比克表示,她在2014年到2015年間曾公開指出5800篇論文中的圖片存在明顯的重復,但是直到十年之后的2024年,只有一半論文被更正或撤回。
圖源:pixabay.com
從研究領域來說,某些特定的領域特別容易造假,如人類癌癥中的非編碼 RNA 和晶體學——大量不同的 RNA 組合和晶體結構可能都需要被研究,但是科學資源總是有限的,因此偽造更容易發生,據不完全統計,在化學領域,因學術不端而被撤回的論文中有 44% 發表在晶體學領域。
從不同國家的角度來看,中國的撤稿問題相當嚴重。截止2023年底,中國在國際刊物上的撤稿數量上大幅度領先,數量達到17541篇,遠遠超過第二名美國的3006篇。而這只是單獨完成單位歸屬中國的數量,如果將聯合發表的論文納入統計,撤稿觀察數據庫中通過Crossref存檔的 50002 篇撤稿論文中,約有 54% 涉及至少一家中國研究機構,是美國撤稿數量的五倍多。而且撤稿原因存在明顯差異,中國的撤稿問題與論文工廠有關的比例高得多。
然而作為撤稿問題的另一面,中國國內學術刊物的撤稿率卻低的出奇:截至 2021 年,中國國內學術期刊中僅檢索到 404 篇撤稿,僅占撤稿觀察數據庫同時記錄的 15726 篇國際刊物撤稿量的 2.6%。[4]
大語言模型(LLM)的快速發展讓學術偵探們感到憂心,利用這種先進的工具,從制作論文,到避開抄襲檢測和圖片修飾檢測,AI同樣會幫助論文工廠迅速提高“生產效率”,同時在互聯網上以各種令人眼花繚亂的方式尋找客戶,這些技術因素都會幫助論文工廠同步進化。
總體而言,他們認為,通過各種方式提醒人們論文工廠的存在,揭露其種種操作手段,盡最大努力指出問題論文都是在治標而不是治本:只要論文指標依然是學術界獲得晉升和獎勵的敲門磚,人們就永遠有足夠的動力去操縱相關指標,如果想要從根本上解決問題,就需要學術界發生結構性轉變,這種轉變要求所有利益相關者之間的有效對話和協同行動,共同尋找評估和篩選、獎勵優秀科學家的新方法和新模式。雖然這并不容易,但是依然屬于“人力可為”的范圍之內:魔高一尺出現時就是需要道高一丈的時候了。
對此您怎么看?不妨留言與大家討論。
參考文獻:
1.https://www.nature.com/articles/d41586-025-00143-x
2. https://www.nature.com/articles/s41586-024-08422-9
3. https://www.nature.com/articles/d41586-025-00212-1
4. https://www.nature.com/articles/s41562-024-02099-w
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.