99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

MiniRAG:一個極致簡潔、高效的新型RAG系統

0
分享至

來源:量子位

檢索增強生成(RAG)雖好,但一直面臨著資源消耗大、部署復雜等技術壁壘。

近日,香港大學黃超教授團隊提出MiniRAG,成功將RAG技術的應用門檻降至1.5B參數規模,實現了算力需求的大幅降低。這一突破性成果不僅為邊緣計算設備注入新活力,更開啟了基于小模型輕量級RAG的探索。


研究團隊開發的這套MiniRAG系統采用小模型架構,實現了輕量級的檢索增強生成功能。通過本地部署的方式,既降低了資源消耗,又能妥善保護用戶隱私。

為驗證系統在現實環境下的實用性,團隊專門設計了LiHua-World評測數據集,這套數據集包含了個人通訊、信息檢索等日常應用場景的模擬數據,為小模型RAG性能評估提供了系統化的測試標準。


模型的性能評測評估了不同框架在遷移至小模型時的適應能力差異:GraphRAG完全無法保持基本功能,LightRAG的表現銳減近半,而MiniRAG即便在輕量化后依然保持了較高水準,最優情況下性能僅下降不到1%,最差情況也僅降低21%左右。值得關注的是,MiniRAG在顯著節省存儲空間的同時(僅需原來25%),仍能維持如此穩定的輸出質量。

MiniRAG架構設計

針對傳統RAG系統過度依賴大型語言模型的問題,研究團隊提出了新的MiniRAG框架。這一設計摒棄了依賴大模型處理復雜語義理解和多步推理的傳統路線,轉而構建了一套適配小型語言模型特點的精簡架構。

通過深入研究,團隊發現小型語言模型雖然在復雜認知任務上存在局限,但具有三個可供充分利用的優勢特性:

  • 在模式識別和局部文本處理等基礎任務上表現突出

  • 借助結構化信息的引入可顯著提升其語義理解能力

  • 通過將復雜任務分解為簡單子任務的策略,能夠保證系統穩定可靠運行

基于這些發現,研究團隊開發了兩項核心技術創新:

  • 異構圖索引:優化信息組織結構,提升檢索精確度

  • 輕量級知識檢索:確保高效準確的信息獲取


基于小模型的語義檢索機制

為突破端側智能檢索的瓶頸,MiniRAG團隊構建了一套全新的語義感知框架。這套系統將離散的文本信息與結構化的實體知識融為一體,構建成一張動態感知的智能網絡,實現了檢索效率的質的飛躍。

  • 文本語義分析:識別并存儲文檔中的核心要素,包括時間、地點、事件描述和領域概念

  • 文本Chunk融合:維護原始段落的完整性,保留必要的上下文信息

這種設計讓系統在檢索時可以充分利用結構化特征和原文信息。通過并行匹配策略,既提升了檢索的準確度,又有效避免了小模型在語義理解上的局限性,使端側RAG應用更加實用可靠。

輕量級知識檢索架構

端側RAG應用面臨著獨特的挑戰:計算資源受限且需要保護數據隱私,這使得傳統的大模型方案難以落地。基于此,MiniRAG提出了一套輕量化的圖式檢索方案,通過優化的語義分析和簡化的嵌入技術,在保證效果的同時大幅降低了系統開銷。
檢索框架主要包含兩個關鍵設計:

  • 查詢語義映射:系統采用精簡的語義分析流程,專注于提取查詢中的關鍵實體和邏輯關系。這種輕量級的處理方式充分發揮了小模型在特定任務上的優勢,確保檢索過程快速高效。

  • 拓撲增強檢索:檢索過程分為兩個環節,先基于語義特征快速定位核心信息點,再通過異質圖結構化的關聯分析擴展相關內容,實現準確和全面的信息獲取。

這種設計既保證了檢索質量,又很好地適應了端側環境的資源約束。相比傳統方案,具有更強的實用性和可擴展性。

模擬真實端側場景的評測數據集: “假如你是LiHua…”

為了更準確地評估端側RAG系統的實際表現,團隊開發了一個貼近現實的評測數據集。這個名為LiHua-World的數據集模擬了一位普通用戶”李華”在移動設備上產生的各類信息記錄,包括社交對話、運動日志、休閑娛樂和日程安排等豐富內容。

數據集涵蓋了從單一信息查詢到多層次關聯分析的各類任務。通過還原移動設備的真實使用場景,LiHua-World不僅體現了端側應用的實際需求,更建立起一個完整的評測體系,為端側RAG技術的發展和優化提供了可靠的實驗基準。


實驗評估

團隊通過實驗設計對MiniRAG系統進行了性能評測,重點關注其在端側實際應用場景中的表現。評估工作主要從三個層面展開:

  • 整體性能評估- 團隊選取了當前主流的移動端RAG解決方案作為對照組,從檢索質量、運行效率和資源占用等維度進行了量化對比,全面衡量系統的綜合表現

  • 模塊效能分析:深入探索MiniRAG核心組件的性能貢獻,包括語義感知異構圖索引機制的檢索效果、輕量級檢索策略的計算開銷,以及各模塊間的協同效應

  • 實際場景案例研究:實驗中團隊考察系統處理復雜信息檢索和多步推理等高難度任務的能力。通過實際案例的詳細分析,直觀展示了MiniRAG在真實環境中的應用價值和優勢


性能評估結果

實驗重點考察了各類RAG系統在適配小型語言模型(SLMs)時的表現差異。測試結果顯示,傳統方案在這一場景下普遍面臨嚴峻挑戰:以LightRAG為例,系統整體效果大幅下滑,性能降幅接近一半。更令人擔憂的是,GraphRAG在小模型環境下完全喪失了基本功能。這些現象反映出現有RAG架構過度依賴大模型的計算能力。

相較之下,MiniRAG通過優化的圖索引設計和創新的檢索機制,有效地解決了這一技術瓶頸。實驗數據令人振奮:在遷移至小型語言模型的過程中,系統性能最大降幅僅為兩成左右,個別任務類型的性能甚至基本保持不變(降幅不足1%)。這充分證明了MiniRAG在輕量化場景下的獨特優勢和較強適應能力。


存儲效率評測

經過詳細的性能測試,MiniRAG在資源優化方面展現出顯著優勢。對比使用gpt-4-mini的LightRAG基準系統,團隊的方案僅占用四分之一的存儲空間就達到了相近的性能指標。這種顯著的存儲壓縮(降低約75%)并未影響系統的檢索質量,說明了團隊在架構設計上的價值。

消融實驗分析

團隊制定了一套系統化的評測方案,旨在深入分析各核心模塊對整體性能的具體貢獻。評測分為兩個主要部分:

首先是索引機制測試,我們將系統中的異構圖索引替換為基于語義描述的傳統方案(簡記為- 實驗),這類方案與現有主流系統采用相似的處理思路,主要通過模型的語義理解來構建實體和關系的描述表示。

其次是檢索流程測試,通過在圖檢索環節選擇性地禁用不同功能組件(簡記為- 實驗),我們能夠準確衡量每個模塊的獨立貢獻。這種細粒度的實驗設計為評估創新組件的實際價值提供了可靠依據。


實驗結果表明:

基于小語言模型RAG的挑戰。實驗數據充分揭示了傳統索引方法在小模型環境下的局限性。當我們用基于文本語義的傳統索引技術(- 測試)替換MiniRAG的創新方案時,系統表現大幅衰退。這一結果印證了我們的理論推測:小型語言模型在處理復雜知識結構和深層語義理解時確實存在天然瓶頸。

Reasoning Path Discovery的有效性。進一步的功能模塊測試也帶來了重要發現。實驗表明,無論是剔除邊際關聯信息(- )還是移除塊級節點(- ),都會對系統效果造成顯著影響。這些關鍵組件不僅通過智能路徑推理提升了查詢準確度,還有效克服了小型語言模型在知識處理上的固有不足。這雙重優勢凸顯了MiniRAG架構設計的獨特價值。

實際案例分析

以下通過一個富有挑戰性的餐廳識別場景,展示MiniRAG如何在實際應用中充分發揮其技術優勢,尤其在處理多維度信息檢索方面的出色表現。

挑戰:復雜查詢解析的困境

研究團隊選取了一個具有挑戰性的測試案例,查詢內容為:Wolfgang和Li Hua為慶祝Wolfgang升職而共進晚餐的那家意大利餐廳叫什么名字?這一查詢涉及多重約束條件,要求系統能從在線聊天數據中準確識別特定意大利餐廳及其相關上下文。盡管LightRAG采用了phi-3.5-mini-instruct模型,但受限于小型語言模型的固有局限性,特別是在提取high-level信息和處理圖索引噪聲方面的不足,導致其檢索效果不夠理想。

MiniRAG的解決方案

MiniRAG通過其獨特的查詢引導推理路徑發現機制成功應對了上述挑戰。系統利用異構圖索引結構,首先預測答案類型(如”社交互動”或”地點”),然后通過策略性分解查詢要素(專注于”意大利場所”和”餐廳”語境),結合目標實體匹配,實現了精確且具有上下文關聯的知識檢索。這種結構化推理方法使MiniRAG能夠精確導航知識空間,最終成功定位目標餐廳——Venedia Grancaffe。


結論

MiniRAG是一款輕量級的檢索增強生成系統,成功解決了小型語言模型(SLMs)在傳統RAG框架中的應用限制。該系統采用創新的異構圖索引架構和輕量級啟發式檢索機制,有效整合了文本與圖式方法的優勢,大幅降低了對模型能力的依賴要求。實驗結果表明,基于SLMs的MiniRAG性能可與大語言模型方案媲美。

為促進邊緣設備RAG技術的發展,研究團隊同時發布了首個專門的評估基準數據集,重點覆蓋個人通信和多約束查詢等實際應用場景。這一研究不僅代表著端側RAG系統的重要突破,也為注重隱私保護和資源效率的邊緣AI應用開創了新的可能。

項目鏈接: https://github.com/HKUDS/MiniRAG
論文鏈接: https://arxiv.org/abs/2501.06713
實驗室主頁: https://github.com/HKUDS


蛇年大吉


紅梅傲雪報春來


喜氣洋洋迎新歲


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
4月25日俄烏:特朗普繼續為俄開脫,俄軍少將莫斯科被炸身亡

4月25日俄烏:特朗普繼續為俄開脫,俄軍少將莫斯科被炸身亡

山河路口
2025-04-25 19:35:58
殺害最小人質恐怖頭目全家被以色列送上路

殺害最小人質恐怖頭目全家被以色列送上路

移光幻影
2025-04-25 11:31:56
深夜23點!山東泰山正式官宣,崔康熙鄭重表態,4人缺席魯滬大戰

深夜23點!山東泰山正式官宣,崔康熙鄭重表態,4人缺席魯滬大戰

璞玉話體壇
2025-04-26 08:41:36
2024年浙江公安查辦侵犯知識產權案件1923起 同比增長63.0%

2024年浙江公安查辦侵犯知識產權案件1923起 同比增長63.0%

環球網資訊
2025-04-25 23:28:19
昆明“大器史局長”婚內出軌!小三:床上,他帶我去天堂!

昆明“大器史局長”婚內出軌!小三:床上,他帶我去天堂!

文刀萬
2024-04-09 10:58:09
出差15天,公婆和小姑住進陪嫁房,施工員老公的解釋讓我果斷離

出差15天,公婆和小姑住進陪嫁房,施工員老公的解釋讓我果斷離

施工員小天哥
2025-04-25 13:24:01
北京地鐵臟衣服乘客家屬發聲感謝,外地人也看出北京人的講究

北京地鐵臟衣服乘客家屬發聲感謝,外地人也看出北京人的講究

九方魚論
2025-04-26 07:42:03
不是青島,王睿澤官宣,加盟新球隊,已抵達廣東,杜鋒期待

不是青島,王睿澤官宣,加盟新球隊,已抵達廣東,杜鋒期待

東球弟
2025-04-26 10:47:02
美國政府瘋狂刪除科研數據,科學家連夜保存研究心血:我們必須爭分奪秒

美國政府瘋狂刪除科研數據,科學家連夜保存研究心血:我們必須爭分奪秒

紅星新聞
2025-04-25 15:47:11
特朗普麻煩大了?我方甩出最大“王牌”,不是美債,美國絕沒料到

特朗普麻煩大了?我方甩出最大“王牌”,不是美債,美國絕沒料到

傲氣經說
2025-04-26 11:18:02
再不談就晚了,印度開始拉閘斷水,中美俄反應一致,巴軍出現異動

再不談就晚了,印度開始拉閘斷水,中美俄反應一致,巴軍出現異動

老謝談史
2025-04-26 11:57:54
麗澤路,今晨開通!

麗澤路,今晨開通!

BRTV新聞
2025-04-26 10:33:26
傻子入洞房不懂,還要新娘教

傻子入洞房不懂,還要新娘教

文雅筆墨
2025-04-25 12:03:14
突發!遼寧某職校宿舍發生命案,疑似有人傷亡,官方卻保持沉默

突發!遼寧某職校宿舍發生命案,疑似有人傷亡,官方卻保持沉默

平老師666
2025-04-26 11:47:47
女生之間的聊天尺度有多大?哈哈,全都是虎狼之詞啊!

女生之間的聊天尺度有多大?哈哈,全都是虎狼之詞啊!

書畫藝術收藏
2025-04-22 19:40:04
美國再次天塌,沙特搶先與中國簽署重磅協議,特朗普無計可施?

美國再次天塌,沙特搶先與中國簽署重磅協議,特朗普無計可施?

文雅筆墨
2025-04-25 19:57:28
研究發現:若晚餐經常吃太早,不超半年,胰腺或迎來6種不良變化

研究發現:若晚餐經常吃太早,不超半年,胰腺或迎來6種不良變化

朗威游戲說
2025-04-24 08:20:00
美艦橫穿臺海!不到12小時我方傳來消息,4艘055同時開建!

美艦橫穿臺海!不到12小時我方傳來消息,4艘055同時開建!

阿纂看事
2025-04-24 11:45:14
憤怒至極!中國學生遭外籍生群毆滿臉是血,網友:學學哈工大!

憤怒至極!中國學生遭外籍生群毆滿臉是血,網友:學學哈工大!

侃故事的阿慶
2025-04-26 07:50:36
真是天佑中華!中美博弈的關鍵時刻,中國又傳來重大喜訊!

真是天佑中華!中美博弈的關鍵時刻,中國又傳來重大喜訊!

洞悉評說
2025-04-25 15:29:07
2025-04-26 15:39:00
人工智能研究 incentive-icons
人工智能研究
分享深度學習、CV、NLP
258文章數 125關注度
往期回顧 全部

科技要聞

李斌:對蔚來公司四季度盈利非常有信心

頭條要聞

男子炒股11年賺6000萬:初始本金150萬 曾1天虧1100萬

頭條要聞

男子炒股11年賺6000萬:初始本金150萬 曾1天虧1100萬

體育要聞

去更大的舞臺追夢 專訪中國男籃國手楊瀚森

娛樂要聞

金掃帚獎出爐,包貝爾意外獲“影帝”

財經要聞

韓國的"宇樹科技" 是怎樣被財閥毀掉的?

汽車要聞

充電5分鐘續航100公里 探訪華為兆瓦超充站

態度原創

藝術
旅游
數碼
時尚
公開課

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

數碼要聞

NVIDIA 將于5月19日發布 RTX 5060

今夏流行“不穿褲子”!洋氣顯瘦顯腿長,誰穿誰好看!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 佛学| 绍兴县| 长乐市| 沙湾县| 腾冲县| 富顺县| 秦安县| 镶黄旗| 吉安市| 衡阳市| 凤阳县| 威信县| 辽阳县| 成都市| 海南省| 长治县| 江都市| 仁寿县| 礼泉县| 玉树县| 垣曲县| 肥东县| 宜州市| 炎陵县| 湟中县| 资讯 | 浑源县| 巴林右旗| 三门峡市| 保定市| 肥东县| 钦州市| 崇义县| 环江| 且末县| 张北县| 海阳市| 札达县| 望城县| 米林县| 青田县|