99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

一文讀懂「AI大模型高效推理」:分類、局限性和3大提升方法

0
分享至


在一些需要慢思考的場景中,如數學問題求解或科學研究,大型推理模型(LRM)需要在給出最終回答之前,進行分析性和深思熟慮的推理。

然而,LRM 深思熟慮的推理過程導致其資源消耗極高,帶來了 token 消耗大、內存開銷高和推理時增加等一系列挑戰,這不僅增加了服務公司的推理成本,也降低了用戶的體驗。

以往針對 LLM 推理效率的研究,如模型壓縮、高效模型設計和系統級優化等,雖然能夠緩解高內存開銷和推理時增加的問題,但并非專門為 LRM 設計,無法有效地解決 LRM 中 token 低效的問題。

為此,來自新加坡國立大學的團隊及其合作者進行了專門針對 LRM 的高效推理方法的綜述,重點關注在保持推理質量的同時緩解 token 效率低下的問題。主要貢獻如下:

  • 對當前的 LRM 高效推理方法進行了全面的論文綜述,并進行了分層分類,即顯式緊湊型思維鏈(explicit compact CoT)和隱式潛在型思維鏈(implicit latent CoT),以及優缺點討論。

  • 從性能和效率的角度對最新方法進行了實證研究,并從用戶控制、可解釋性、安全性和應用方面總結了 4 個挑戰:用戶可控推理、推理可解釋性與效率平衡、安全保障和應用拓展。

  • 強調了從模型合并、非自回歸架構和 agent 路由的角度進一步改進現有方法的技術見解。


圖|綜述框架


圖|大型推理模型的推理方法分類

相關研究論文以

Efficient Inference for Large Reasoning Models: A Survey
為題,已發表在預印本網站 arXiv 上。

LRM 的兩大分類

根據當前的研究形式,研究團隊將 LRM 分為了兩大類:

  • 顯式緊湊型 CoT,通過引入顯式指令、獎勵或預算約束來鼓勵使用較短的推理鏈,而不是冗長的 CoT。

  • 隱式潛在型 CoT,將顯式的長 CoT 壓縮為緊湊、連續的推理狀態。


圖|GSM8K 數據集上最新推理方法的基準測試

研究團隊認為,隱式潛在型 CoT 在推理準確度上可以超過顯式緊湊型 CoT,同時也能夠顯著降低生成的成本。

1.式緊湊型 CoT

最近的研究關注如何在保持推理準確性的同時,開發更緊湊的推理路徑:

CoT 壓縮通過將中間推理限制在必要步驟、使用一個小的路由模型生成推理草圖、動態調整推理 token 等方式,在保持解決方案質量的同時簡化推理過程。但可能會犧牲透明度,存在忽略關鍵的中間邏輯的風險,這可能會破壞可解釋性。

基于緊湊推理鏈的微調利用 LLM 生成壓縮的長 CoT 版本、整理專家驗證的簡潔答案、標注數據集進行微調等方法,提高了 LRM 的效率,但成本高,并且依賴于精心整理的數據集和大量再處理工作,限制了它們對開放式領域的適應性。

基于獎勵的激勵越來越多的研究引入明確的獎勵信號,例如基于長度的獎勵以抑制冗長的推理;利用強化學習訓練模型以進行動態資源分配;基于推理成本控制推理分布;平衡對心推理路徑的探索與對簡潔、已驗證推理路徑的利用;交互式或用戶導向的長度控制機制。

但是,這類激勵信號可能導致模型傾向于簡單答案,影響復雜任務的深度推理。并且,僅靠效率不足以實現實際部署,現實的應用程序需要在緊湊性、推理魯棒性、可解釋性和域泛化(domain generalization)之間取得平衡。


圖|顯式緊湊型 CoT 的要點

2.隱式潛在型 CoT

隱式潛在型 CoT 則通過將推理從顯式 token 轉移到潛在 token,在隱藏層而非自然語言中編碼推理,以此提升 token 效率。用知識蒸餾、潛在嵌入、沉思 token 等方法,優化了各個層面的推理,在保持準確性的同時減少了延遲。

這類方法通過內化推理步驟提高效率,在推理準確性上甚至可以超越顯式 CoT 方法,且能顯著降低生成成本,展現出良好的可擴展性,但犧牲了模型的可解釋性,使得推理過程難以驗證。


圖|隱式潛在型 CoT的要點

研究團隊認為,未來的工作應側重于從潛在表征中提取人類可解釋的推理痕跡,從而實現效率和透明度的平衡。

局限性和挑戰

此外,研究團隊也從用戶體驗、可解釋性、安全性和應用性的角度,討論了現有推理方法的局限性和挑戰。


圖|局限性和挑戰的要點

在用戶體驗方面盡管部分 LRM 已支持用戶配置推理模式,使用戶能夠調整推理深度,在透明度和效率之間取得平衡,同時優化用戶體驗,但還需探索更精細的控制機制,可以側重于用戶的交互式和個性化推理。

在可解釋性上當前為提高效率的方法可能會降低可解釋性,比如減少顯式推理步驟或轉向潛在表示推理,使得理解模型結論的得出過程變得困難。未來的研究應開發適應性推理策略來平衡效率和可解釋性。

當涉及安全性時現有高效推理方法在提升 token 效率的同時,可能會破壞 LRM 的安全對齊,增加越獄攻擊和隱私泄露等風險。未來的工作應在訓練中整合安全約束,并制定更強有力的基于推理的保障措施。

從應用的角度來看在社會科學、情感智能和創意寫作等領域,LRM 存在開放式問題,比如難以制定明確目標,且高計算需求和延遲限制了其在時間敏感領域的應用。高效的推理方法則可以提高 LRM 在更廣泛應用中的可行性,例如實時應用程序和開放式任務。

3 個方法,提高推理效率

那么,如何提高 LRM 的推理效率呢?

研究團隊從新架構、模型合并、agent 路由 3 個方面提出了提升 LRM 推理效率的策略。

新架構方面,主要包括混合自回歸和擴散模型、內存高效 transformers 和基于圖的推理,是進一步提高推理效率同時保持推理質量的潛在技術。

模型合并上,將傳統 LLM 和 LRM 的模型權重合并,使合并后的模型兼具 LLM 的快速響應和 LRM 的推理能力。但在模塊選擇、權重分配和架構兼容性方面存在挑戰。

agent 路由則是根據任務難度為不同的 LRM 分配資源,以優化推理效率。目前包括兩種路由策略:一是基于路由模型,通過訓練一個獨立的路由模型,根據輸入任務的特征決定使用哪個 LRM;二是基于信心指標,利用模型對自身預測的信心程度來選擇合適的 LRM 。


圖|進一步優化的要點

如需了解更多詳情,請查看原論文。

論文鏈接:https://arxiv.org/abs/2503.23077

整理:錦鯉

如需轉載或投稿,請直接在公眾號內留言

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
他是建國以來潛逃級別最高的貪官:至今還未落網,逃跑方式成了謎

他是建國以來潛逃級別最高的貪官:至今還未落網,逃跑方式成了謎

文史旺旺旺
2024-09-01 01:20:35
“黑幫洪門”強勢回歸!消滅臺獨,賴清德傻眼了,洪門有多厲害?

“黑幫洪門”強勢回歸!消滅臺獨,賴清德傻眼了,洪門有多厲害?

說天說地說實事
2025-03-30 21:32:40
政府敗訴! 新冠疫苗引發13種嚴重副作用, 損傷心臟和神經!

政府敗訴! 新冠疫苗引發13種嚴重副作用, 損傷心臟和神經!

灰產圈
2025-04-23 12:06:00
澤連斯基承認:烏克蘭沒有足夠武器,缺乏重新控制克里米亞所需軍力

澤連斯基承認:烏克蘭沒有足夠武器,缺乏重新控制克里米亞所需軍力

環球網資訊
2025-04-26 14:07:06
蘋果為什么不造車?果斷解散了造車團隊,庫克似乎發現了什么

蘋果為什么不造車?果斷解散了造車團隊,庫克似乎發現了什么

柳先說
2025-04-24 12:06:43
37歲曹駿打破年輕天花板限制:這一次,他給整個娛樂圈上了一課

37歲曹駿打破年輕天花板限制:這一次,他給整個娛樂圈上了一課

果娛
2025-04-25 15:19:00
荷蘭專家:中國要復制ASML的光刻機并不難,但是中國企業并不會去復制,而是選擇開發自研設備

荷蘭專家:中國要復制ASML的光刻機并不難,但是中國企業并不會去復制,而是選擇開發自研設備

逍遙漠
2025-04-25 21:25:33
情侶在母嬰室做不雅之事被逮,女子年輕貌美,堪比當年優衣庫事件

情侶在母嬰室做不雅之事被逮,女子年輕貌美,堪比當年優衣庫事件

明月聊史
2025-04-23 16:53:17
“一絲不掛”新舞蹈?惹爭議,被摸下體更不害臊,金星質疑是對的

“一絲不掛”新舞蹈?惹爭議,被摸下體更不害臊,金星質疑是對的

吃魚思故淵
2024-05-16 21:48:21
又美又颯!吳艷妮13米00奪第七:戰斗天使真美,挑戰世界頂尖選手

又美又颯!吳艷妮13米00奪第七:戰斗天使真美,挑戰世界頂尖選手

李喜林籃球絕殺
2025-04-26 21:09:17
四川:成都市關于能否限制外地車牌車輛早晚高峰通行的回復

四川:成都市關于能否限制外地車牌車輛早晚高峰通行的回復

娛樂洞察點點
2025-04-26 09:57:02
“丹鳳眼”有多罕見?看一眼就再難忘,精致到骨子里的眼型

“丹鳳眼”有多罕見?看一眼就再難忘,精致到骨子里的眼型

星光歷史
2024-12-22 10:37:17
“治港敗類”曾蔭權:治理香港7年,為何卻在卸任后,獲刑20個月

“治港敗類”曾蔭權:治理香港7年,為何卻在卸任后,獲刑20個月

星光看娛樂
2025-03-31 17:52:22
4強對陣出爐!國乒占據1席,國乒小將3:1獲勝,頭號種子被淘汰

4強對陣出爐!國乒占據1席,國乒小將3:1獲勝,頭號種子被淘汰

國乒二三事
2025-04-26 18:21:58
67歲萬梓良在中山吃燕窩,頭發稀疏牙齒黃,室內煙不離手臉通紅

67歲萬梓良在中山吃燕窩,頭發稀疏牙齒黃,室內煙不離手臉通紅

吃貨小小貓咪
2025-04-25 15:04:26
突然爆雷!5只A股,遭*ST!

突然爆雷!5只A股,遭*ST!

券商中國
2025-04-26 17:11:58
50歲女子深夜腰痛以為腰閃了,1周后去世,醫生嘆息:早干什么去了

50歲女子深夜腰痛以為腰閃了,1周后去世,醫生嘆息:早干什么去了

消化石醫生
2025-04-13 09:40:20
灰熊身處淘汰邊緣!ESPN預測G4雷霆勝率高達73.1%,灰熊僅為26.9%

灰熊身處淘汰邊緣!ESPN預測G4雷霆勝率高達73.1%,灰熊僅為26.9%

雷速體育
2025-04-26 08:59:52
比布雷頓森林體系解體時還慘!特朗普“百日執政”=美元最血腥魔咒?

比布雷頓森林體系解體時還慘!特朗普“百日執政”=美元最血腥魔咒?

財聯社
2025-04-26 10:00:06
保級成功,狼隊宣布下賽季季票價格保持不變

保級成功,狼隊宣布下賽季季票價格保持不變

懂球帝
2025-04-26 09:51:10
2025-04-27 00:35:00
學術頭條
學術頭條
致力于學術傳播和科學普及,重點關注人工智能、生命科學等前沿科學進展。
1247文章數 5069關注度
往期回顧 全部

科技要聞

百度心響實測:“能用版Manus”開了個好頭

頭條要聞

馬斯克和美財長激烈爭吵細節披露:胸口相抵 狂飆臟話

頭條要聞

馬斯克和美財長激烈爭吵細節披露:胸口相抵 狂飆臟話

體育要聞

去更大的舞臺追夢 專訪中國男籃國手楊瀚森

娛樂要聞

金掃帚獎出爐,包貝爾意外獲“影帝”

財經要聞

韓國的"宇樹科技" 是怎樣被財閥毀掉的?

汽車要聞

充電5分鐘續航100公里 探訪華為兆瓦超充站

態度原創

本地
健康
家居
游戲
手機

本地新聞

云游湖北 | 漢川文旅新體驗:千年陶藝邂逅湖光

唇皰疹和口腔潰瘍是"同伙"嗎?

家居要聞

清徐現代 有溫度有態度

創意總監談《羊蹄山之魂》:它是我們做的最開放游戲!

手機要聞

vivo大折疊屏新機曝光,三季度登場

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 普洱| 金平| 白河县| 弥渡县| 手机| 邓州市| 四川省| 嘉峪关市| 扶余县| 海淀区| 霍林郭勒市| 兴宁市| 水富县| 扶绥县| 米易县| 桂林市| 湘潭县| 黄山市| 永新县| 云和县| 鸡西市| 普洱| 隆回县| 容城县| 亚东县| 平南县| 罗源县| 军事| 彭山县| 光泽县| 澳门| 陆丰市| 昌图县| 武清区| 平武县| 临漳县| 泊头市| 宜宾县| 深水埗区| 南充市| 松桃|