網易首頁 > 網易號 > 正文申請入駐

厲害，阿里又放了一個大招 !

2024-11-28 08:58:52　來源: 碼農翻身

河南舉報

分享至

　　2023年大模型（LLM）火了以后，很多人用它來寫文章、寫文案、寫總結，生成圖片、極大地提高了工作效率。

　　但是用得多了以后就發(fā)現(xiàn)，這大模型還有很多缺陷的，它的訓練數據通常滯后，新的東西它根本不知道，由于訓練一次時間很長，成本很高，知識也很難更新。在高度專業(yè)化的領域，缺乏領域深度，并且可能會生成錯誤的回答。

　　RAG

　　為了解決大模型的這些問題，RAG（Retrieval-Augmented Generation）被提了出來。

　　RAG的想法很簡單，把傳統(tǒng)檢索和生成模型做結合，用戶在使用之前，先建立一個知識庫，把專業(yè)領域知識“向量化”以后，存到向量庫中。

　　當用戶提出以后，RAG先利用檢索模塊從知識庫中查找與輸入問題或上下文相關的內容，然后將檢索到的信息與原始輸入一起提供給大模型，最后大模型再進行生成輸出。

　　RAG通過檢索模塊訪問外部知識庫，突破生成模型的參數規(guī)模限制，提供最新且廣泛的知識。還能夠追蹤回答的來源，增強結果的可信度，知識更新也很方便。

　　所以RAG在智能客服，法律問答、學術問答等領域中非常好用。

　　RAG的痛點

　　但是RAG在工作的時候，需要用傳統(tǒng)的方法來檢索知識庫，從中檢索出來的很可能是“難負樣本”（Hard Negative Samples），什么是難負樣本呢？

　　舉個例子，假設你正在訓練一個貓和狗分類模型：

　　?正樣本：貓的圖片。

　　?負樣本：不是貓的圖片，比如狗、鳥、汽車等。

　　?普通負樣本：一輛汽車的圖片，與貓完全無關。

　　?難負樣本：一只小貓形狀類似的狗（比如有貓的毛色特征）

　　簡單來說，難負樣本就是和正樣本非常相似的負樣本，它們看起來與目標類別接近，實際上屬于錯誤類別。

　　RAG的檢索模塊是利用傳統(tǒng)檢索去訪問知識庫的，這時候很有可能會把“難負樣本”給檢索出來，然后輸入給大模型生成回答，大模型分不清真假，基于“難負樣本”進行回答，不但無法生成正確答案，反而會被誤導，導致回答質量下降，甚至引入“幻覺”現(xiàn)象。

　　RAG這么好的增強技術，難道就因為“難負樣本”給搞壞了嗎？能不能在檢索結果中把“難負樣本”給剔除出去？

　　阿里云百煉：RAG全新升級

　　最近我發(fā)現(xiàn)阿里巴巴的百煉平臺對RAG框架做了升級，有效地解決了“幻覺”問題。

　　通常情況下，在對知識庫進行搜索的時候，是根據文本相似度的閾值來進行判定的，例如下面的例子，閾值是0.4，chunk1和chunk2高于0.4，那就作為搜索結果返回了。chunk3的相似度是0.3，低于閾值，就被丟棄了。

　　最終，chunk1和chunk2再加上用戶的問題被發(fā)給大模型。

　　這種根據文本相似度判斷的方法速度比較快，但是準確一般，還有可能產生“難負樣本”，在大模型那里產生幻覺。

　　阿里云的百煉平臺則在相似度的基礎上，引入了“拒識模塊”，系統(tǒng)首先通過相似度閾值篩選出初步的搜索結果，然后利用大模型對這些結果進行深入分析，判斷它們與用戶查詢的關聯(lián)程度。

　　比如下圖，根據相似度閾值，chunk1和chunk2已經被取出，但是通過大模型的分析以后，發(fā)現(xiàn)chunk1和用戶的查詢沒有關聯(lián)，就被拋棄了。

　　最終，只有chunk1加上用戶的查詢發(fā)給了大模型來生成答案，由于信息關聯(lián)性極高，幻覺就被消除了。

　　通過這一機制，大模型在生成回答前，能夠先對候選信息進行一次全面的“質量檢查”，確保所有用于生成的信息都是高度相關且可靠的。

　　從具體實現(xiàn)上來說，“拒識模塊“包括了三個重點的組成部分：

　　1. 復雜的指令系統(tǒng)

　　既然要使用大模型來判斷檢索結果與用戶問題的相關度，那必然要有一套指令系統(tǒng)來告訴大模型怎么處理，例如告訴大模型：檢索結果中涉及的實體與用戶問題中的實體要完全一致啊，否則就認為不相關。

　　2. 大模型調用

　　調用大語言模型，得到每條檢索文檔的相關性判斷。

　　3. 后處理

　　根據大模型輸出的相關性結果，過濾掉那些不相關的檢索文檔。如果相關文檔列表為空，則直接返回無答案，避免大語言模型產生幻覺答案。

　　使用全新的RAG

　　“拒識模塊”的處理過程聽起來非常復雜，但是是阿里云百煉平臺上，已經把整個過程都封裝好了，用戶只需點幾下按鈕就可以啟用這個強大的功能。

　　在阿里云百煉平臺上，選擇創(chuàng)建一個RAG應用：

　　例如我創(chuàng)建RAG應用叫做“碼農翻身張大胖”，目的是把我公眾號的文章建立一個知識庫，讓這個智能體應用去檢索，回答用戶提出的問題。

　　這里要打開“知識庫檢索增強”，把我的文章傳上去，讓檢索模塊去搜索。

　　然后重點進行“檢索配置”，進行“回答范圍設定”，選擇“搜索閾值+大模型判斷”就可以了，剩下的就不用管了。

　　接下來，就可以向這個RAG應用發(fā)問了：

　　總結

　　阿里云百煉集成了200多款大模型的API，涵蓋通義千問、Llama、ChatGLM等國內外主流模型，可以直接調用模型進行推理，其中通義千問的QPS和TPM基本拉滿，可提升到500萬，完全可以滿足高并發(fā)場景的需求。

　　如果你想訓練自己的模型，百煉也提供從數據管理、模型調優(yōu)、評測到部署的全鏈路模型服務，用戶可彈性按需調用算力，無需關心底層架構。

　　在百煉平臺上，還可以輕松地創(chuàng)建RAG應用，一鍵開啟知識檢索增強（RAG），建立知識庫，在檢索配置上，通過“搜索閾值+大模型判斷”的方式，更好地解決了大模型幻覺問題，讓大模型在復雜場景下的應用開辟了新的可能性，進一步推動了人工智能技術的發(fā)展和應用。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

免費用！阿里通義大模型上新，超逼真音視頻生成SOTA！

機器之心Pro 2025-04-15 17:13:24
7 跟貼 7
GPT-4.1深夜登場，中科大校友領隊！百萬上下文編程驚人，GPT-4.5三個月后淘汰

新智元 2025-04-15 06:25:33
45 跟貼 45

剛剛，智譜一口氣免費開源6款模型，200 tokens/秒成商用速度之最

量子位 2025-04-15 11:03:20
55 跟貼 55

字節(jié)視頻基礎大模型發(fā)布！單GPU就可生成1080P，蔣路領銜團隊曝光

量子位 2025-04-15 15:18:50
20 跟貼 20
DeepSeek公布推理引擎開源路徑，承諾將核心優(yōu)化注入vLLM生態(tài)

DeepTech深科技 2025-04-16 11:15:42
1 跟貼 1

大模型承重墻，去掉了就開始擺爛！蘋果給出了「超級權重」

機器之心Pro 2024-11-19 15:50:17
1 跟貼 1

美國人瘋搶中國貨，阿里昔日手下敗將迎來潑天流量

36氪 2025-04-16 09:39:04
8 跟貼 8
讓開發(fā)者專注開發(fā)：魔搭社區(qū)上線MCP廣場，降低大模型調用復雜性

DeepTech深科技 2025-04-15 21:20:40
0 跟貼 0

從思考，到行動：由Manus爆火談AI Agent

鈦媒體APP 2025-03-14 14:44:11
1 跟貼 1
阿里通義大模型上新

機器之心Pro 2025-04-15 14:26:28
0 跟貼 0
寶馬與阿里巴巴達成AI領域戰(zhàn)略合作

每日經濟新聞 2025-03-26 11:59:03
0 跟貼 0
媽媽為兒子的學習操碎了心，兒子也為媽媽事業(yè)操心費力

重慶聚焦站 2025-04-15 12:12:52
2045 跟貼 2045
谷歌DeepMind新競業(yè)政策被炮轟，員工抱怨AI界休一年誰還簽你？

量子位 2025-04-16 14:06:30
0 跟貼 0
阿里萬相秒殺Sora，4070就能跑

量子位 2025-02-26 17:08:09
0 跟貼 0
DeepSeek之后，端側AI崛起

鈦媒體APP 2025-04-16 17:09:00
0 跟貼 0
長鏈推理表象下，大模型精細表征張冠李戴的本質

機器之心Pro 2025-03-13 17:09:44
0 跟貼 0
MiniMax押注線性注意力，讓百萬級長文本只用1/2700算力

量子位 2025-04-16 17:17:51
1 跟貼 1
雷軍背后的男人帶火世界的海爾

每日經濟新聞 2025-03-13 11:45:12
0 跟貼 0
阿里深夜開源Qwen2.5-Omni，7B參數完看、聽、說、寫

機器之心Pro 2025-03-27 10:36:47
0 跟貼 0
馬斯克發(fā)文力薦《1493》力挺全球化

看盡落塵花q 2025-04-15 04:54:18
1 跟貼 1
大模型落地成果顯著，粉筆AI榮獲中國AIGC產業(yè)峰會兩項大獎

芥末堆看教育 2025-04-16 17:08:15
0 跟貼 0
馬云談芯片：我們應該擁有自己的核心技術

芯榜 2025-04-15 23:35:24
0 跟貼 0
3D打印獅子模型，這就是科技的力量，網友：毛是用的邊角料？

河海觀潮 2025-04-15 13:15:28
3 跟貼 3
港股科網股走低，美團、小鵬汽車跌超7%

每日經濟新聞 2025-04-16 14:33:02
0 跟貼 0
以芯片、工具鏈和生態(tài)為引擎MediaTek掀起智能體AI普及第一波浪潮

機器之心Pro 2025-04-16 18:10:07
0 跟貼 0
斯通：不會把季后賽表現(xiàn)當成衡量未來的最大標準我更關注大樣本

直播吧 2025-04-15 20:24:01
54 跟貼 54
馬斯克借《1493》隱喻全球化不可逆，呼吁回歸自由貿易

眾生的世界觀 2025-04-15 04:04:37
0 跟貼 0
特朗普加稅后，突然爆火的敦煌網，壓力有點大

鈦媒體APP 2025-04-16 10:11:10
0 跟貼 0
阿里影業(yè)將出品張藝謀作品《驚蟄無聲》

界面新聞 2025-04-16 11:51:10
0 跟貼 0
拳皇2002風云：有指令投的金家藩才是巔峰，近身投擇永遠有機會

緋聞游戲解說 2025-04-13 01:50:04
3 跟貼 3
超速駕駛撞死1家3口！車載數據曝光，2次故意加速就是殺人鐵證！

主持人京京 2025-04-15 20:41:35
30 跟貼 30
阿里P7老公被裁，洗衣、做飯、接孩子

螞蟻大喇叭 2025-04-16 10:41:11
3 跟貼 3
一車在荒郊野外被貼條，車主：一個人都沒有，這也能違章？

老郭播報 2025-04-15 19:15:37
8139 跟貼 8139
華北制藥：已開展DeepSeek大模型部署工作

每日經濟新聞 2025-04-16 17:00:06
0 跟貼 0
敗給阿里的那天，他想通了人生最大的智慧

霧滿攔江 2025-04-16 12:24:01
0 跟貼 0
研究生在實驗室放「煙花」引發(fā)爆炸、誤開高溫模式樣本全報廢，導師：我早晚要被你嚇死

生物學霸 2025-03-07 17:50:20
0 跟貼 0
人社小課堂|便捷辦理＋貼心服務，社交“i人”也能輕松應對！

齊魯壹點 2025-04-16 14:20:15
2 跟貼 2
驚掉下巴：用紙片就能做個離心機？（320 份好禮包郵送）

生物學霸 2025-02-21 16:01:43
0 跟貼 0
國內首個面向職業(yè)教育的AIGC大模型實踐教學平臺在天津發(fā)布

中國教育新聞網 2025-04-16 17:08:09
0 跟貼 0
視頻推理R1時刻，7B模型反超GPT-4o！港中文清華推出首個Video-R1

新智元 2025-04-16 13:18:44
1 跟貼 1

碼農翻身

有趣且硬核的技術文章

119文章數 457關注度

往期回顧全部

增長5.4% 一季度GDP增速為何超預期？

金價首次突破3300美元！黃金還能買？
外交部回應美對華加征245%關稅
美國真搞國際笑話了，對華關稅加到245%
四大電視廠商業(yè)績“冰火兩重天”：技術紅利哪家享，出口博弈誰承壓

汽車要聞

又帥又快超實用極氪007GT獵裝車才是完美的車？

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

家居

手機

親子

數碼

軍事航空

家居要聞

手機 / 數碼

房產 / 家居

厲害，阿里又放了一個大招 !

華為問界M8售價公布：36.98萬元起

牛彈琴：美國拿245%關稅嚇唬人 仔細一看不過是小把戲

牛彈琴：美國拿245%關稅嚇唬人 仔細一看不過是小把戲

諾坎普奇跡的兩位當事人，差點靈魂互換

娛樂圈的“現(xiàn)實”在岳云鵬身上應驗了

增長5.4% 一季度GDP增速為何超預期？

又帥又快超實用 極氪007GT獵裝車才是完美的車？

態(tài)度原創(chuàng)

秋日的風 木質簡約空間

榮耀Power評測：18小時連續(xù)重度使用后還有電！

歐巴是家里的田螺姑娘 沒有歐巴我要怎么帶娃啊

鴻蒙智行發(fā)布會新品匯總：問界M8僅售35.98萬元起

涉嫌泄密 美防長高級顧問被調查

牛彈琴：美國拿245%關稅嚇唬人仔細一看不過是小把戲

牛彈琴：美國拿245%關稅嚇唬人仔細一看不過是小把戲

又帥又快超實用極氪007GT獵裝車才是完美的車？

秋日的風木質簡約空間

歐巴是家里的田螺姑娘沒有歐巴我要怎么帶娃啊

涉嫌泄密美防長高級顧問被調查