99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

讓AI替碼農卷復雜任務,賈佳亞團隊提出MoTCoder,準確率刷新SOTA

0
分享至



論文一作李靖瑤,香港中文大學博士生(DV Lab),師從賈佳亞教授。主要研究方向是大語言模型,包括模型預訓練、后訓練、推理優化。作者陳鵬光、夏彬等均為 DV Lab 成員。

大模型寫代碼早就是基操了,但讓它寫算法競賽題或企業級系統代碼,就像讓只會煮泡面的人去做滿漢全席 —— 生成的代碼要么是 “鐵板一塊” 毫無章法,要么是 “一鍋亂燉” 難以維護。

如何讓大模型像工程師一樣思考,用模塊化思維拆解復雜問題?

近日,賈佳亞團隊提出MoTCoder(Module-of-Thought Coder),通過創新的模塊化思維指令微調(MoT Instruction Tuning),顯著提升了模型在復雜編程任務中的準確率與可維護性。實驗顯示,在 APPS 和 CodeContests 等權威編程基準上,MoTCoder 的 pass@1 準確率直接刷新記錄,甚至超越 SOTA 6%,讓大模型在 “瘋狂打碼” 時更接近「人類智慧」。



  • 論文標題:MoTCoder: Elevating Large Language Models with Modular of Thought for Challenging Programming Tasks
  • 論文鏈接:https://arxiv.org/abs/2312.15960

目前,團隊已發出程序員快樂包 —— 代碼、模型與數據集通通開源,歡迎在線體驗:

  • 代碼庫:https://github.com/dvlab-research/MoTCoder
  • 32B 模型:https://huggingface.co/JingyaoLi/MoTCoder-32B-V1.5
  • 7B 模型:https://huggingface.co/JingyaoLi/MoTCoder-7B-v1.5
  • 350K 訓練數據集:https://huggingface.co/datasets/JingyaoLi/MoT-Code-350K

復雜編程的解耦神器

當前主流代碼生成模型(如 Qwen2.5-Coder)生成的代碼往往就是這種單塊式的結構,雖然在簡單任務上表現良好,但面對復雜場景時難掩缺陷:

  • 拆解復雜任務:不存在的!讓它寫個分布式系統,輸出代碼堪比災難現場;
  • 維護成本爆炸:生成的代碼注釋比程序員(bu shi)頭發還少,debug 時被同事懷疑是祖傳咒語。

試想象一下,你讓模型寫個自動駕駛算法,結果它吐出幾千行密密麻麻的代碼,像一團亂麻根本無從下手。這就是傳統模型的單塊式代碼 —— 把所有邏輯塞進一個函數,不講章法地一鍋亂燉。



圖 1a: 傳統模型生成的單塊式代碼

而 MoTCoder 則能 “遇招拆招”,把復雜任務拆成 “輸入解析”、“核心算法”、“異常處理” 等標準化模塊,像樂高積木般嚴絲合縫組裝,每個模塊還自帶 “說明書”,強迫癥患者看完都直呼舒適!



圖 1b: MoTCoder 生成的模塊化代碼



圖 2:MoTCoder 的兩階段模塊化設計流程

MoTCoder 的三大核心突破

(1)性能開掛:復雜任務準確率刷新 SOTA

得益于模塊化思維對復雜邏輯的拆解能力,在 APPS 數據集上,MoTCoder-32B 的 pass@1 超越同等規模模型 5.8%;在 CodeContests 數據集上,MoTCoder-32B 更是直接上演「屠榜」戲碼,超越 SOTA 5.9%!



圖 3:MoTCoder 的戰斗力曲線

(2)大模型代碼質檢員

MoTCoder 通過多輪自我反思機制,能自動檢測并修正代碼錯誤。實驗顯示:

  • 未修正狀態下,MoTCoder 可達到 SOTA 模型 5 輪人工修正后的效果
  • 開啟自檢后,準確率更進一步提升 4%

(3)代碼質量全面碾壓傳統模型

通過專業的代碼質量分析工具 Radon 對 APPS 和 CodeContests 數據集上的生成代碼進行評估,MoTCoder 在所有難度級別中都保持了明顯更高的可維護性指數(Maintainability Index)。

實驗數據顯示,相比普通微調模型和基線模型,MoTCoder 生成的代碼具有更低的復雜度、更精簡的代碼量和更合理的注釋比例。

程序員狂喜:簡直好用哭了!



圖 4:MoTCoder 生成的代碼具有更優的可維護性特征

智能調度:簡單題極簡模式,難題樂高模式

這種優勢源于 MoTCoder 的模塊化訓練方法,使生成的代碼結構更清晰、邏輯更簡明。在時間和內存消耗的對比中(圖 5),MoTCoder 生成的代碼展現出顯著優勢。雖然其運行時間與普通微調模型相當,但在內存占用上始終低于基準模型。這得益于 MoTCoder 對全局變量和函數局部變量的智能區分,能夠及時釋放未使用的內存資源。



圖 5:MoTCoder 生成的代碼具有更低的內存消耗



圖 6:不同難度的代碼函數數量與準確率關系

賈佳亞團隊在開發過程中發現了一個有趣的現象(圖 6):

- 入門題:函數數量增加,準確率反而下降(簡單問題無需拆解)

- 面試題:函數數量變化對準確率影響較小(保持穩定)

- 競賽題:函數數量與準確率呈正相關(復雜問題必須模塊化)

MoTCoder 自帶智能調度系統,問題復雜度決定了其模塊化策略:面對兩行代碼就能搞定的題目,啟動極簡模式;而遭遇代碼量堪比畢業論文的變態需求,則秒切樂高模式。而這種思維方式已達到人類工程師的解題路徑。

這種特性也使得 MoTCoder 可覆蓋從算法競賽到工業級開發多個落地場景:

  • 算法競賽:秒解 Codeforces/LeetCode 難題,生成帶注釋的標準答案;
  • 大型系統設計:自動生成微服務架構代碼,接口清晰、模塊解耦;
  • 企業級應用開發:生成可長期維護性的代碼庫,降低技術債務累積速度。

MoTCoder 讓代碼生成從 “功能實現” 躍遷至 “工程實踐”,或許是時候重新定義智能編程了 —— 不僅要生成代碼,更要生成好代碼。賈佳亞團隊表示,將繼續深化智能編程的研究,并探索其在更多工業界場景的深度應用。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
“狼見了都發抖”,東北虎女飼養員帶火動物園:打賞都給動物改善伙食

“狼見了都發抖”,東北虎女飼養員帶火動物園:打賞都給動物改善伙食

封面新聞
2025-04-11 22:45:12
蔡少芬張晉的新瓜太炸了,模范夫妻裝不下去了?

蔡少芬張晉的新瓜太炸了,模范夫妻裝不下去了?

In風尚
2025-03-23 13:07:47
不會被收稅!中國放了美國芯片一馬,蘋果、高通、英偉達松了口氣

不會被收稅!中國放了美國芯片一馬,蘋果、高通、英偉達松了口氣

克萊恩財經
2025-04-11 22:02:26
向鵬事件發酵,國際乒聯緊急出手,我們終于能對"黃牌裁判"說不了

向鵬事件發酵,國際乒聯緊急出手,我們終于能對"黃牌裁判"說不了

小彭聊社會
2025-04-12 01:01:46
美對華關稅升至145%!40船大豆將運抵中國,特朗普吃癟,贏家出現

美對華關稅升至145%!40船大豆將運抵中國,特朗普吃癟,贏家出現

梁訊
2025-04-11 11:04:22
按市政府統一要求,醫院紅十字招牌被換成綠色?當地回應

按市政府統一要求,醫院紅十字招牌被換成綠色?當地回應

觀察者網
2025-04-11 21:40:11
中國全面反擊后,萬斯痛批要對華開戰的美國鷹派,稱:你們太瘋狂

中國全面反擊后,萬斯痛批要對華開戰的美國鷹派,稱:你們太瘋狂

小陸搞笑日常
2025-04-12 01:05:28
又來威脅!特朗普警告:若不能達成協議 將恢復高額“對等關稅”

又來威脅!特朗普警告:若不能達成協議 將恢復高額“對等關稅”

財聯社
2025-04-11 08:10:16
知情人士:美烏會談氣氛緊張,達成礦產協議前景渺茫

知情人士:美烏會談氣氛緊張,達成礦產協議前景渺茫

界面新聞
2025-04-12 07:16:37
韓國女星臺上面色潮紅,舉止異樣,原因竟是財閥給她的小玩意

韓國女星臺上面色潮紅,舉止異樣,原因竟是財閥給她的小玩意

第四思維
2025-04-08 19:38:41
網友:烏紗帽被摘!終于有人為違規付出代價,河南3校負責人被免

網友:烏紗帽被摘!終于有人為違規付出代價,河南3校負責人被免

火山詩話
2025-04-12 05:45:10
西門子西班牙分公司遇難CEO足跡遍布多國;直升機斷成兩半墜毀

西門子西班牙分公司遇難CEO足跡遍布多國;直升機斷成兩半墜毀

瀟湘晨報
2025-04-11 15:01:15
27國一致同意!第一波反制來襲,歐盟決定跟中國并肩作戰

27國一致同意!第一波反制來襲,歐盟決定跟中國并肩作戰

二向箔
2025-04-11 17:38:29
男子因婚后半年發現妻子出軌,用電線自縊!肝癌晚期父親發聲!

男子因婚后半年發現妻子出軌,用電線自縊!肝癌晚期父親發聲!

烏娛子醬
2025-04-11 21:44:02
“清華這次演都不演了”,只錄取第2名被質疑太水,背景已流出

“清華這次演都不演了”,只錄取第2名被質疑太水,背景已流出

熙熙說教
2025-04-11 15:52:19
徹底涼涼!文和友事件越演越烈,嚇得甲亢哥回國,把國人臉丟盡!

徹底涼涼!文和友事件越演越烈,嚇得甲亢哥回國,把國人臉丟盡!

卷史
2025-04-11 18:11:43
不出意外的話,5月以后,全國50%家庭,或將面臨“3大好事”

不出意外的話,5月以后,全國50%家庭,或將面臨“3大好事”

巢客HOME
2025-04-11 23:43:48
剛剛,特斯拉中國停售Model S、Model X

剛剛,特斯拉中國停售Model S、Model X

大象新聞
2025-04-11 12:54:04
【俠客島】對話鄭永年:我們要“超越關稅看關稅”

【俠客島】對話鄭永年:我們要“超越關稅看關稅”

海外網
2025-04-11 21:21:05
中方出"王炸",對所有美國商品征125%關稅!對普通人生活有何影響

中方出"王炸",對所有美國商品征125%關稅!對普通人生活有何影響

二向箔
2025-04-11 20:14:18
2025-04-12 07:55:00
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
10345文章數 142293關注度
往期回顧 全部

科技要聞

單臺年入20萬!首批人形機器人致富者來了

頭條要聞

大部分貨源都來自中國 亞馬遜慌了

頭條要聞

大部分貨源都來自中國 亞馬遜慌了

體育要聞

球迷天天罵,但我們要進歐冠了

娛樂要聞

汪小菲馬筱梅婚禮又有了耐人尋味的新聞

財經要聞

造假累計數百億 揭秘東旭集團造假手法

汽車要聞

25款風云A8/T9/T10齊上市 多款車型發布一口價

態度原創

本地
教育
藝術
游戲
房產

本地新聞

華北將迎“歷史罕見”大風

教育要聞

博士申請考核被鴿!考生控訴:既然不用,為何還歡迎來課題組讀博

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

LPL觀眾徹底絕望?BLG爆冷不敵AL,涵藝連發多條微博開噴!

房產要聞

官宣6月!地鐵12號線沖刺開通,白云金沙洲終于等來破局

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 治县。| 东港市| 全南县| 大新县| 云浮市| 商都县| 缙云县| 富蕴县| 高州市| 富源县| 阳江市| 阜新市| 邳州市| 武城县| 原阳县| 大悟县| 罗山县| 徐汇区| 邳州市| 滦南县| 鸡东县| 和龙市| 高密市| 陆川县| 自贡市| 韶关市| 松滋市| 嘉祥县| 枞阳县| 如东县| 集贤县| 镶黄旗| 布拖县| 上高县| 兴国县| 德化县| 公主岭市| 文化| 勐海县| 罗定市| 屏东县|