99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

越來越火的大模型應用——RAG,到底是個啥?

0
分享至

缺乏應用的大模型,是沒有價值的。

你可能使用過Kimi、豆包這樣的大模型工具。它們能夠充當我們的創作助手、咨詢專家,甚至可以進行情感陪護。但這樣的應用,還遠遠不能發揮出大模型的真正價值。

我們期望大模型在更專業的生產領域發揮作用,提升生產力,引領真正的科技變革。

當前被普遍看好的兩個大模型專業應用方向,分別是RAG(Retrieval-Augmented Agenerated,檢索增強生成)與Agent(AI智能體)。

本篇文章,先帶大家認識一下RAG。


01

了解大模型的“幻覺”

在了解RAG之前,我們先了解一下大模型著名的“幻覺”問題。

“幻覺”,指的是大模型在試圖生成內容或回答問題時,輸出的結果不完全正確甚至錯誤,即通常所說的“一本正經地胡說八道”。

這種“幻覺”可以體現為對事實的錯誤陳述與編造、錯誤的復雜推理或者在復雜語境下處理能力不足等。

“幻覺”的主要原因,來自于:

(1)訓練知識存在偏差:老師教錯了,學生自然對不了。

在訓練大模型時,輸入的海量知識可能包含錯誤、過時,甚至帶有偏見的信息。

這些信息在被大模型學習后,就可能在未來的輸出中被重現。

(2)過度泛化地推理:自作聰明,以偏概全了。

大模型嘗試通過大量的語料,來學習人類語言的普遍規律與模式。

這可能導致“過度泛化”的現象,即把普通的模式推理用到某些特定場景,就會產生不準確的輸出。

(3)理解存在局限性:死記硬背,加上問題太難了。

大模型并沒有真正“理解”訓練知識的深層含義,也不具備人類普遍的常識與經驗。因此,可能會在一些需要深入理解與復雜推理的任務中出錯。

(4)缺乏特定領域的知識:沒學過,瞎編個答案蒙一下。

通用大模型,是一個掌握了大量人類通用知識,且具備超強記憶與推理能力的優秀學生,而不是某個垂直領域的專家(比如醫學或者法律專家)。

當面臨一些復雜度較高的領域性問題,或者私有知識相關的問題時(比如介紹企業的某個新產品),它就可能會編造信息并將其輸出。

當然,除了“幻覺”問題,大模型還存在知識落后、輸出難以解釋、輸出不確定等一些問題。

這也決定了大模型在大規模商業生產應用中會面臨著挑戰:

很多時候,我們不僅需要理解力和創造力,還需要極高的準確性(不僅要會寫作文,還要會準確解答數學題)。

02

RAG如何優化“幻覺”問題

RAG,正是為了盡力解決大模型在實際應用中面臨的一些問題(特別是“幻覺”問題)而誕生的一種優化方案,也是最重要的方案。

其基本思想可以簡單表述如下:

將傳統的生成式大模型與實時信息檢索技術相結合,為大模型補充來自外部的相關數據與上下文,以此幫助大模型生成更豐富、更準確、更可靠的內容。

這允許大模型在生成內容時,可以依賴實時與個性化的數據和知識,而不只是依賴訓練知識。

簡單的說:RAG給大模型增加了一個可以快速查找的“知識外掛”。


用一個例子幫助理解RAG的概念:

如果把大模型比喻成一個經過大量知識與技能訓練的優秀學生,把大模型響應的過程比喻成考試。那么,這個優秀學生在考試時,仍然可能會遇到沒有掌握的知識,從而編造答案(幻覺)。

RAG,就是在這個學生考試時,臨時給他的一本參考書。我們可以要求他在考試時,盡量參考這本書作答。

那么,在遇到與這本書中的知識相關的問題時,他的得分是不是就高多了呢?

03

模擬簡單的RAG場景

假如你需要開發一個在線的自助產品咨詢工具,允許客戶使用自然語言進行交互式的產品問答,比如“請介紹一下您公司這款產品與××產品的不同之處”。

為了讓客戶有更好的體驗,你決定使用大模型來構造這樣的咨詢功能,并將其嵌入公司的官方網站。

如果你直接使用通用大模型,那么結果很可能如圖1-10所示。


不出意外,大模型顯然不具備貴公司的最新手機產品知識,因此無法回答客戶的問題(有時候可能會嘗試編造答案)。

現在,如果你采用了RAG的思想,那么,可以先從企業私有的知識庫中,檢索出下面一段相關的補充知識。


你把檢索出的補充知識組裝到提示詞中,將其輸入大模型,并要求大模型基于提供的知識來回答你的問題。

大模型很聰明地“吸收”了補充的外部知識,并結合自己已經掌握的知識,成功推理并給出了答案:


是的,RAG本質上就是一種借助“外掛”的提示工程,但絕不僅限于此。

因為在這里簡化了很多細節,只是為了展示RAG最核心的思想:給大模型補充外部知識以提高輸出答案的質量。

04

RAG與模型微調

要想提高大模型在特定行業與場景中輸出的適應性與準確性,除了使用RAG,還可以使用自己的數據對大模型進行微調。

簡單地說,微調就是對基礎模型在少量(相對于預訓練的數據量來說)的、已標注的數據上進行再次訓練與強化學習,以使得模型更好地適應特定的場景與下游任務。

顯然,微調是另外一種給大模型“灌輸”新知識的方法。兩者的主要差異在于:

  • RAG無需額外的訓練,隨時可以提供補充的知識,調試簡單。缺點是受到上下文空間的限制,且回答時性能略差(畢竟要現學現用)。

  • 微調需要專門的數據準備和訓練時間,技術要求相對較高,效果較難預測,不太適合更新頻繁的知識。好處是應用層面會更簡單。

以前面的例子來說明微調和RAG的區別:

如果大模型是一個優秀學生,正在參加一門考試,但是這門考試中有很多知識是這位學生沒有學習過的,現在使用RAG和微調兩種方法對這位學生提供幫助。

* RAG:在考試時給他提供某個領域的參考書,要求他現學現用,自己翻書理解后給出答案。

* 模型微調:在考試前一天對他進行突擊輔導,使他掌握了新的領域知識,然后讓他參加考試。

無法確切地說在什么場景中必須使用RAG、在什么場景中必須使用微調。結合當前的一些研究及普遍的測試結果,可以認為,以下場景中更適合考慮微調的方案(在不考慮成本的前提下):

(1)需要注入較大數據量且相對穩定、迭代周期較長的領域知識;需要形成一個相對通用的領域大模型用于對外服務或者運營。

(2)執行需要極高準確率的部分關鍵任務,且其他手段無法滿足要求,此時需要通過高效微調甚至全量微調來提高對這些任務的輸出精度,比如醫療診斷。

(3)在采用提示工程、RAG等技術后,無法達到需要的指令理解準確、輸出穩定或其他業務目標。

在除此之外的很多場景中,可以優先考慮使用RAG來增強大模型生成。當然,在實際條件允許的前提下,兩者的融合應用或許是未來更佳的選擇

05

初步認識RAG架構

最后,我們從技術層來看一個最基礎、最常見的RAG應用的邏輯架構與流程。


注意:在這張圖中僅展示了一個最小粒度的RAG應用的基礎原理。通常情況下,可以把一個簡單的RAG應用從整體上分為數據索引(Indexing)與數據查詢(Query)兩個大的階段,而在每個階段都包含不同的處理環節。

以上面的舉例來解釋:

  • 索引階段就是編寫考試時需要的參考書,這本書要容易快速查找特定知識。

  • 查詢階段就是考試時使用這本書的過程,先查找參考資料,然后解答問題。

在實際RAG應用中,對于不同的應用場景、客觀條件、工程要求,會有更多的模塊、架構與流程的優化設計,以應對眾多的技術細節與挑戰。

比如,自然語言表達的輸入問題可能千變萬化,你從哪里檢索對應的外部知識?你需要用怎樣的索引來查詢外部知識?你怎樣確保補充的外部知識是回答這個問題最需要的呢?

就像上面例子中的學生,如果考試的知識點是英語語法,你卻給他一本《微積分》,那顯然是于事無補的。

諸如這一類的問題,都屬于更深入的高級RAG模塊與優化的范疇,感興趣的同學可以自行學習。這里,我們推薦一本非常全面的RAG應用的學習書籍:

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
越南官方媒體首次公開承認中國在抗美援越中的貢獻

越南官方媒體首次公開承認中國在抗美援越中的貢獻

曉風說
2025-04-26 23:14:55
烏克蘭與歐洲公布和平提案文本,反制特朗普“和平計劃”

烏克蘭與歐洲公布和平提案文本,反制特朗普“和平計劃”

史政先鋒
2025-04-26 23:34:10
美國關稅從145%降到35%,中國跟不跟?外交部10個字回應

美國關稅從145%降到35%,中國跟不跟?外交部10個字回應

一個有靈魂的作者
2025-04-27 15:29:12
紅旗國悅將全面替代豐田考斯特!將成為各單位的主力中巴車!

紅旗國悅將全面替代豐田考斯特!將成為各單位的主力中巴車!

阿鳧愛吐槽
2025-04-27 16:37:38
萬斯的粉絲號:中國人發明過什么東西嗎?列舉一個就行

萬斯的粉絲號:中國人發明過什么東西嗎?列舉一個就行

明月聊史
2025-04-27 23:15:17
真正讓國家蒙羞的,恰恰是某些“愛國者”

真正讓國家蒙羞的,恰恰是某些“愛國者”

黑噪音
2025-04-27 16:07:46
朱立倫、謝龍介赴警分局自首,強調沒有做錯

朱立倫、謝龍介赴警分局自首,強調沒有做錯

參考消息
2025-04-27 10:53:26
全民雙休要來?網傳五一后逐步落地雙休!看似不經意,實則布大局

全民雙休要來?網傳五一后逐步落地雙休!看似不經意,實則布大局

火山詩話
2025-04-27 08:31:39
吳亦凡坐牢4年再添新罪!胖9公斤獄中生活曝光

吳亦凡坐牢4年再添新罪!胖9公斤獄中生活曝光

葫蘆哥愛吐槽
2025-04-27 12:01:43
5-1!20次,利物浦英超奪冠次數平曼聯!第一次,斯洛特創造紀錄

5-1!20次,利物浦英超奪冠次數平曼聯!第一次,斯洛特創造紀錄

體育世界
2025-04-28 01:47:26
京東重磅消息!將招聘10萬名全職騎手,全部繳納五險一金,所有費用都由公司承擔

京東重磅消息!將招聘10萬名全職騎手,全部繳納五險一金,所有費用都由公司承擔

每日經濟新聞
2025-04-27 19:14:11
2-12被吊打!賽點出現了,丁俊暉到出局邊緣,布雷切爾狀態太好了

2-12被吊打!賽點出現了,丁俊暉到出局邊緣,布雷切爾狀態太好了

生活新鮮市
2025-04-28 00:20:25
這才是中年男人“反油膩”三大秘訣:不穿polo、不姨化、不露皮帶

這才是中年男人“反油膩”三大秘訣:不穿polo、不姨化、不露皮帶

時尚搭配師Nicole
2025-04-27 23:12:41
泰國一家在高速路應急車道上換尿布,遭遇車禍10口人死了8個

泰國一家在高速路應急車道上換尿布,遭遇車禍10口人死了8個

瀟湘晨報
2025-04-27 16:20:05
面相都變了!再看59歲曾華倩和59歲劉嘉玲,才明白兩人差別在哪里

面相都變了!再看59歲曾華倩和59歲劉嘉玲,才明白兩人差別在哪里

聯友說娛
2025-04-27 18:06:35
縷一縷中日友好醫院的瓜

縷一縷中日友好醫院的瓜

量子派
2025-04-27 23:51:56
印度突然開閘放水引發巴控克什米爾混亂

印度突然開閘放水引發巴控克什米爾混亂

參考消息
2025-04-27 18:26:08
一萬塊一支的"高潮針",少婦富婆們排隊打!網友:這茬韭菜又熟了

一萬塊一支的"高潮針",少婦富婆們排隊打!網友:這茬韭菜又熟了

派大星紀錄片
2025-04-27 17:38:53
5-1大勝!利物浦主場嗨翻了,時隔5年重奪英超冠軍,狂賺18億收入

5-1大勝!利物浦主場嗨翻了,時隔5年重奪英超冠軍,狂賺18億收入

侃球熊弟
2025-04-27 23:58:24
金正恩攜女兒登上的“大船”,有啥新鮮的?

金正恩攜女兒登上的“大船”,有啥新鮮的?

中國新聞周刊
2025-04-27 15:24:52
2025-04-28 02:16:49
鮮棗課堂 incentive-icons
鮮棗課堂
ICT知識科普。
850文章數 1247關注度
往期回顧 全部

科技要聞

充1秒跑2.5公里,寧德時代比亞迪華為激戰

頭條要聞

用馬斯克理念改造生產線 95后女生創業1年銷售額上億

頭條要聞

用馬斯克理念改造生產線 95后女生創業1年銷售額上億

體育要聞

我們來自北極圈,我們有全球最恐怖的主場!

娛樂要聞

華表獎獲獎名單!張譯二影帝惠英紅勇影后

財經要聞

2千億!核電開閘 國常會核準10臺新機組

汽車要聞

蔚來李斌的"十年磨一劍" 從看得見 到看不見

態度原創

教育
時尚
旅游
手機
本地

教育要聞

這類孩子一旦專注,一定一鳴驚人

5條適合春天的裙子、褲子!溫柔顯瘦美到爆炸!

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

手機要聞

華為 Mate XT 非凡大師推送 HarmonyOS 5 花粉 Beta 版

本地新聞

云游湖北 | 漢川文旅新體驗:千年陶藝邂逅湖光

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 从江县| 垦利县| 丹东市| 松潘县| 喀什市| 尉氏县| 吉水县| 莲花县| 开阳县| 隆林| 泗水县| 江门市| 侯马市| 綦江县| 六枝特区| 军事| 沁水县| 庆元县| 丰城市| 柳河县| 友谊县| 东港市| 洛南县| 宁远县| 吉首市| 花垣县| 辽宁省| 休宁县| 友谊县| 大邑县| 松滋市| 辉县市| 东阳市| 嘉祥县| 彩票| 新干县| 桑日县| 岐山县| 黄平县| 舒城县| 宿迁市|