網易首頁 > 網易號 > 正文申請入駐

7B小模型寫好學術論文，新框架告別AI引用幻覺

2025-04-11 14:34:12　來源: 量子位

北京舉報

分享至

ScholarCopilot團隊投稿
量子位 | 公眾號 QbitAI

學術寫作通常需要花費大量精力查詢文獻引用，而以ChatGPT、GPT-4等為代表的通用大語言模型（LLM）雖然能夠生成流暢文本，但經常出現“引用幻覺”（Citation Hallucination），即模型憑空捏造文獻引用。這種現象嚴重影響了學術論文的可信度與專業性。

現在，加拿大滑鐵盧大學與卡內基梅隆大學的華人研究團隊，提出了一種名為 ScholarCopilot 的智能學術寫作大模型框架，專門針對學術場景，致力于精準地生成帶有準確引用的學術文本。

ScholarCopilot與傳統方法的區別

傳統的檢索增強生成（Retrieval-Augmented Generation, RAG）方法采用“先檢索、再生成”的靜態流程，這種方式存在以下問題：

檢索與生成過程相互獨立，容易導致意圖不匹配；
無法根據上下文需求動態調整引用策略，影響引用準確性。

針對這些局限性，ScholarCopilot提出了一種“邊生成、邊檢索”的動態機制：

在生成文本時，模型動態地判斷何時需要引用文獻，并生成一個特殊的檢索信號（[RET]）；
隨后實時檢索學術數據庫中的相關文獻，將檢索到的內容融入后續生成過程；
通過聯合優化生成任務和檢索任務，提升引用的準確度與相關性。

簡單來說，ScholarCopilot的寫作方式更接近人類真實的寫作習慣：平時正常撰寫論文內容，當需要引用文獻時再主動檢索相關文獻的BibTeX信息插入引用，隨后繼續撰寫下文。同時，模型在撰寫后續內容時，也會參考已插入的引用文獻，確保生成的文本與引用內容緊密相關。

ScholarCopilot的性能表現

研究團隊以阿里云近期發布的Qwen-2.5-7B模型為基礎，使用了50萬篇arXiv論文進行訓練，并在多個維度上進行了性能評估：

引用檢索準確性（Top-1 accuracy）達到40.1%，顯著超過現有的檢索模型：

E5-Mistral-7B-Instruct（15.0%）
BM25（9.8%）

論文生成質量方面（包括相關性、連貫性、學術嚴謹性、完整性和創新性），綜合得分為16.2（滿分25），高于參數量更大的Qwen-2.5-72B-Instruct模型（15.8）和Qwen-2.5-7B-Instruct模型（13.9）。

在一項由10位擁有平均4.2年學術寫作經驗的學生（5名博士、4名碩士、1名本科生）參與的真人評測中：

ScholarCopilot在引用質量上的用戶偏好率達到100%；
整體實用性偏好率超過70%。

ScholarCopilot的不足與未來方向

盡管取得了顯著進步，ScholarCopilot仍存在一些局限性。通過上述用戶調研，受訪者提出了以下幾點改進建議：

內容生成更全面：
模型在生成內容的豐富性與信息全面性方面仍需進一步提升；
創新性不足：
目前模型在生成創新性想法和研究問題方面表現一般，還有較大改進空間。

此外，受訪者還建議未來版本可考慮：

與主流學術寫作平臺（如Overleaf）進行更緊密的整合；
支持分章節獨立生成和任意光標位置的文本預測功能。

研究團隊表示，這些反饋意見為后續開發提供了明確的改進方向。

后續展望

ScholarCopilot研究團隊希望通過不斷優化模型性能、擴展檢索數據庫和改進用戶交互體驗，讓研究人員在學術寫作中能更專注于研究本身，而非繁瑣的文獻檢索與引用管理。

當前相關論文、代碼與模型已經公開發布，感興趣的讀者可自行了解詳細信息，進一步體驗與評估該模型的實際表現：

論文鏈接：https://arxiv.org/pdf/2504.00824
項目網站：https://tiger-ai-lab.github.io/ScholarCopilot/
演示視頻：https://www.youtube.com/watch?v=QlY7S52sWDA

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

見證歷史！AI想的科研idea，真被人類寫成論文發表了

量子位 2024-12-18 13:21:51
0 跟貼 0
只因論文「碰瓷」，ICLR 2025區域主席直接拒稿！最強rebuttal，贏回榮耀

新智元 2025-04-13 17:44:13
1 跟貼 1

DeepSeek的橫空出世，讓AI+騰訊云數據庫產生了什么化學反應？

量子位 2025-03-04 20:07:47
0 跟貼 0

算法不重要，AI的下一個范式突破，「解鎖」新數據源才是關鍵

機器之心Pro 2025-04-13 14:10:07
0 跟貼 0
微軟AI模型MatterGen能根據需求生成新材料

量子位 2025-01-21 18:07:40
0 跟貼 0

10分鐘教你機器學習建模的6大步驟

醫咖會 2025-03-14 19:53:09
0 跟貼 0

Claude 4六個月內發布！Anthropic聯創Kaplan：AGI兩三年內到來

新智元 2025-04-12 12:51:58
6 跟貼 6
擴散模型獎勵微調新突破：Nabla-GFlowNet讓多樣性與效率兼得

機器之心Pro 2025-04-13 14:57:44
1 跟貼 1

蘋果發現多模態模型Scaling Laws 早融合比后融合好MoE勝密集模型

機器之心Pro 2025-04-13 14:24:14
0 跟貼 0
鄒城市引來了機器人產業｜行走黃河

經濟觀察報 2025-04-13 17:31:11
1 跟貼 1
國際學術觀點（2025.4）

大眾日報 2025-04-10 10:16:12
0 跟貼 0
畢業論文在網上自查時需要注意哪些問題？

AIGC論文查重檢測 2025-04-13 07:30:03
0 跟貼 0
讓文獻按影響因子大小排列的神器在此

生物學霸 2025-01-11 16:07:00
0 跟貼 0
熊孩子拿假蛇嚇唬人，女生給客人戴鐲子時受驚摔碎鐲子

重慶聚焦站 2025-04-12 14:12:06
1128 跟貼 1128
敦煌日月：出土天文歷法文獻探賾

尚曦讀史 2025-04-12 09:51:04
0 跟貼 0
碩博畢業論文一稿就過了！多虧了師兄給我推薦了這個辦法

浪花媽媽 2025-04-14 00:09:29
0 跟貼 0
為什么大學老師上課普遍都很水？網友：還是重科研，重論文造成的

娛樂圈人物大賞 2025-04-14 00:05:25
0 跟貼 0
一老人牛棚喂牛時，牛突然攻擊老人被活活頂死發出慘叫聲畫面流出

爆料視頻 2025-04-13 11:27:18
5545 跟貼 5545
菲律賓取消362億鐵路項目，放棄與中國合作，日本韓國印度將接手

樂雯小視界 2025-04-13 07:03:28
0 跟貼 0
上個月，我去了趟烏魯木齊回來后，我只想說：能不去就盡量不去！

訪史 2025-04-11 10:34:33
66 跟貼 66
美媒：殲-50是空中飛行“紙老虎”，是嚇唬西方的第六代機模型

沐風論道 2025-04-12 21:53:45
0 跟貼 0
關稅戰要半途而廢？特朗普顧問被曝學術造假，馬斯克補上關鍵一刀

大光觀察 2025-04-11 14:44:36
0 跟貼 0
歐洲15國聯軍，戳破虛偽的謊言

難得君 2025-04-11 14:02:42
1027 跟貼 1027
一群保鏢護著男星胡一天前行對商場路人大喊:靠邊

動態新聞 2025-04-13 18:52:48
3491 跟貼 3491
一群騎行男女偷菠蘿被村民抓住，每個人車上都裝著一大袋

眾橫四海 2025-04-13 11:55:45
2937 跟貼 2937
晉城交警模型宣傳勸導市民騎車戴頭盔“柳絮紛飛，戴好頭盔，安全不吃虧”網友：誰懂這一鏡到底的實力！

營天下 2025-04-12 19:07:55
0 跟貼 0
公開數據庫挖掘：20分鐘帶你了解CHARLS數據庫！

醫咖會 2025-03-07 19:37:34
0 跟貼 0
獵裝車主靜態體驗極氪007GT

車扯 2025-04-11 10:00:00
0 跟貼 0
最強32B開源中文推理大模型易主：1/20 DeepSeek-R1參數量SOTA

量子位 2025-04-13 21:16:47
3 跟貼 3
好久沒有來菜園了，今天媳婦把菜園整理一下，順便再栽點無花果樹

大慶在農村 2025-04-13 08:34:31
674 跟貼 674
強化學習的改進只是「噪音」？最新預警：冷靜看待推理模型進展

機器之心Pro 2025-04-13 15:12:39
0 跟貼 0
3710億數學tokens，全面開放！開源數學預訓練數據集MegaMath發布

機器之心Pro 2025-04-13 18:43:37
1 跟貼 1
謝賽寧等新作上線，多模態理解生成大一統！思路竟與GPT-4o相似？

新智元 2025-04-12 18:23:04
2 跟貼 2
買房后提前探班，被趕出售樓處，業主：跟扔小雞一樣的

瀟湘晨報 2025-04-13 08:30:31
617 跟貼 617
C羅凌空世界波震驚球迷：如果這個球是梅西進的，將會獲得普斯卡什獎

雷速體育 2025-04-13 08:23:09
2147 跟貼 2147
美國星座級護衛艦項目困境重重，未來前路未卜

溫柔度 2025-04-12 16:43:17
0 跟貼 0
靜態體驗，2025款小鵬X9升級真聽勸！

胖哥汽車頻道 2025-04-11 10:00:00
0 跟貼 0
大風吹到廣西了！柳州“一秒天黑”下起壯觀的“紫荊花雨”

大目看點 2025-04-13 12:06:09
1729 跟貼 1729
成都蓉城三大主力官宣傷停，未來復出時間敲定，值得期待

國香就愛說足球 2025-04-13 19:39:25
353 跟貼 353
俄軍首次擊落烏軍F16戰機，全過程細節流出，1500萬獎勵即將兌現

碳基生物關懷組織 2025-04-13 19:30:17
2011 跟貼 2011

手機 / 數碼

房產 / 家居

7B小模型寫好學術論文，新框架告別AI引用幻覺

特朗普政府豁免消費電子等產品的對等關稅

特朗普"180度大轉彎" 首次"對中國商品實施重大豁免"

特朗普"180度大轉彎" 首次"對中國商品實施重大豁免"

那個抱起全紅嬋的英國女孩

倪虹潔給陳德容上了一課，贏得漂亮！

美方豁免部分產品對等關稅 商務部回應

審美和深層次豪華 阿維塔06都辦到了

態度原創

小米 15 Pro 手機徠卡水印不支持后期關閉問題已優化

“一手好牌打得稀爛”，女兒中山大學畢業變水碩，母親仍不悔悟

今年春夏最實用的穿衣法則，照著搭就很時髦！

“拒絕上學門診”一號難求，家長也別逼孩子

故宮珍藏的墨跡《十七帖》，比拓本更精良，這才是地道的魏晉寫法

7B小模型寫好學術論文，新框架告別AI引用幻覺

美方豁免部分產品對等關稅商務部回應

審美和深層次豪華阿維塔06都辦到了

今年春夏最實用的穿衣法則，照著搭就很時髦！

“拒絕上學門診”一號難求，家長也別逼孩子