99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

【科普金華】AI 有多會一本正經地瞎編?超出你的想象!深度解析大模型的“幻覺”機制

0
分享至

你是不是也遇到過這樣的情況:問 AI 一個問題,它給了你一個特別詳細、豐富,看上去好有邏輯的答案。但當我們去核實時,卻發現這些信息完全是虛構的?

這就是著名的“AI 幻覺”現象。


上下滑動查看更多,圖源:河森堡 新浪微博

為什么會出現 AI 幻覺呢?今天就讓我們一起來揭開這個謎題。

為什么會出現 AI 幻覺?

AI 幻覺指的是 AI 會生成看似合理但實際確實錯誤的信息,最常見的表現就是會編造一些不存在的事實或者細節。

就像在考試時遇到不會的題目,我們會試圖用已知的知識去推測答案一樣。AI 在遇到信息缺失或不確定的情況時,會基于自己的“經驗”(訓練數據)進行填補和推理。

這不是因為它想要欺騙我們,而是因為它在試圖用自己理解的模式來完成這個任務。

1

基于統計關系的預測

因為 AI(尤其是像 ChatGPT 這樣的語言模型)通過大量的訓練數據學習文字之間的統計關系。它的核心目標是根據上下文預測最可能出現的下一個詞,并不是對問題或內容進行真正的理解。所以AI 本質上是通過概率最大化來生成內容,而不是通過邏輯推理來生成內容的

簡單來說, AI 就像是一個博覽群書的智者,通過學習海量的文本和資料來獲取知識。但是它并不是真正理解這些知識,而是通過找到文字之間的統計關系和模式來“預測”下一個最合適的詞。即AI 是根據之前學到的大量例子,來猜測接下來最有可能出現的詞。

不過有時候,模型也會“猜錯”。如果前面出現一點偏差,后面的內容就會像滾雪球一樣越滾越大。這就是為什么 AI 有時會從一個小錯誤開始,最后編織出一個完全虛構的故事。

2

訓練數據的局限性

由于 AI 并沒有真實世界的體驗,它的所有“認知”都來自訓練數據。可是訓練數據不可能包含世界上所有的信息,有時候甚至還會包含錯誤信息。這就像是一個人只能根據自己讀過的書來回答問題,如果書里有錯誤信息,或者某些領域的知識缺失,就容易產生錯誤的判斷。

舉個例子:早期 AI 幻覺較大的時候,可能會出現 AI 學過“北京是中國的首都”和“巴黎有埃菲爾鐵塔”這兩個知識點。當我們問它“北京有什么著名建筑”時,它可能會把這些知識錯誤地混合在一起,說“北京有埃菲爾鐵塔”。

3

過擬合問題

因為大模型的訓練參數量非常龐大,大模型會在訓練數據上產生“過擬合”的問題。即因為記住了太多錯誤或者無關緊要的東西,從而讓 AI 對訓練數據中的噪聲過于敏感,最終導致幻覺產生。

4

有限的上下文窗口

受限于技術原因,雖然現在大模型的上下文窗口越來越大( 比如可以處理 64k 或 128k 個 tokens ),但它們仍然是在一個有限的范圍內理解文本。這就像是隔著一個小窗口看書,看不到整本書的內容,容易產生理解偏差。

5

生成流暢回答的設計

現在很多大模型被設計成要給出流暢的回答,當它對某個問題不太確定時,與其說“我不知道”,它更傾向于基于已有知識編造看起來合理的答案

上面的種種情況疊加在一起,造成了現在非常嚴重的 AI 幻覺問題。

如何才能降低 AI 幻覺?

AI 看起來很方便,但 AI 一本正經的“胡說八道”有時候真的讓人非常頭疼,給的信息經常需要反復核實,有時反而不如直接上網搜索來得實在。

那么,如何應對 AI 幻覺呢?我們總結了下面這些方法幫助大家。

1

優化提問

想要獲得準確答案,提問方式很關鍵。與 AI 交流也需要明確和具體,避免模糊或開放性的問題,提問越具體、清晰,AI 的回答越準確。同時,我們在提問的時候要提供足夠多的上下文或背景信息,這樣也可以減少AI胡亂推測的可能性。

總結成提示詞技巧就是下面四種問法:

1. 設定邊界:“請嚴格限定在 2022 年《自然》期刊發表的研究范圍內”


示例:“介紹 ChatGPT 的發展歷程” → “請僅基于 OpenAI 官方 2022-2023 年的公開文檔,介紹 ChatGPT 的發展歷程”


2. 標注不確定:“對于模糊信息,需要標注‘此處為推測內容’”


示例:“分析特斯拉 2025 年的市場份額” → “分析特斯拉 2025 年的市場份額,對于非官方數據或預測性內容,請標注[推測內容]”


3. 步驟拆解:“第一步列舉確定的事實依據,第二步展開詳細分析”


示例:“評估人工智能對就業的影響” → “請分兩步評估 AI 對就業的影響:

1) 先列出目前已發生的具體影響案例;

2) 基于這些案例進行未來趨勢分析”。

4. 明確約束:明確告訴 AI 要基于已有事實回答,不要進行推測

示例:“預測 2024 年房地產市場走勢” → “請僅基于 2023 年的實際房地產數據和已出臺的相關政策進行分析,不要加入任何推測性內容”。

2

分批輸出

因為 AI 內容是根據概率來進行生成的,一次性生成的內容越多,出現 AI 幻覺的概率就越大,我們可以主動限制它的輸出數量。比如:如果我要寫一篇長文章,就會這么跟 AI 說:“咱們一段一段來寫,先把開頭寫好。等這部分滿意了,再繼續寫下一段。”這樣不僅內容更準確,也更容易把控生成內容的質量。

3

交叉驗證

想要提高 AI 回答的可靠性,還有一個實用的方法是采用“多模型交叉驗證”。使用的一個 AI 聚合平臺:可以讓多個 AI 模型同時回答同一個問題。當遇到需要嚴謹答案的問題時,就會啟動這個功能,讓不同的大模型一起參與討論,通過對比它們的答案來獲得更全面的認識。


點擊可放大,圖片來源:作者提供

再比如納米 AI 搜索平臺的“多模型協作”功能,它能讓不同的 AI 模型各司其職,形成一個高效的協作團隊。

讓擅長推理的 DeepSeek R1 負責分析規劃,再由通義千問進行糾錯補充,最后交給豆包 AI 來梳理總結。這種“專家組”式的協作模式,不僅能提升內容的可信度,還能帶來更加全面和深入的見解。


上下滑動查看更多,圖源:作者提供

4

RAG 技術

AI 是一個聰明但健忘的人,為了讓他表現更靠譜,我們可以給他配一個超級百科全書,他可以隨時查閱里面的內容來回答問題。

這本“百科全書”就是 RAG 的核心,它讓 AI 在回答問題之前,先從可靠的資料中找到相關信息,再根據這些信息生成答案。這樣一來,AI 就不容易“胡說八道”了。

目前 RAG 技術多用在醫療、法律、金融等專業領域,通過構建知識庫來提升回答的準確性。

當然實際使用中像醫療、法律、金融這樣的高風險領域,AI 生成的內容還是必須要經過專業人士的審查的。

5

巧用 AI 幻覺

最后再說一個 AI 幻覺的好處。

很多時候 AI 幻覺也是天馬行空的創意火花!就像一個異想天開的藝術家,不受常規思維的束縛,能蹦出令人驚喜的點子。

看看 DeepSeek 就知道了,它確實比 ChatGPT 和 Claude 更容易出現幻覺,但是今年 DeepSeek 能火得如此出圈也離不開其強大的創造能力。

有時候與其把 AI 幻覺當成缺陷,不如把它看作創意的源泉!在寫作、藝術創作或頭腦風暴時,這些“跳躍性思維”反而可能幫我們打開新世界的大門。

AI 幻覺的本質——AI 在知識的迷霧中,有時會創造出看似真實,實則虛幻的“影子”。但就像任何工具一樣,關鍵在于如何使用。

當我們學會用正確的方式與 AI 對話,善用它的創造力,同時保持獨立思考,AI 就能成為我們得力的助手,而不是一個“能言善辯的謊言家”。

畢竟,在這個 AI 與人類共同進步的時代,重要的不是責備 AI 的不完美,而是學會與之更好地協作。

策劃制作

作者丨田威 AI 工具研究者

審核丨于旸 騰訊玄武實驗室負責人

策劃丨林林

責編丨符思佳、林林

審校丨徐來

本文經授權轉自“科普中國”(id:Science_China)公眾號

編輯:吳裕慧

一審:施新杭

二審:盧立明

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
媒體爆料CBA重要決定,季后賽大變天,遼寧隊成贏家,廣東隊要慌

媒體爆料CBA重要決定,季后賽大變天,遼寧隊成贏家,廣東隊要慌

宗介說體育
2025-04-15 13:54:56
醫療界大消息來啦!四川打響第一炮:公立醫院一次掛號可管8天!

醫療界大消息來啦!四川打響第一炮:公立醫院一次掛號可管8天!

青青子衿
2025-04-15 00:20:20
福建美女“覃姐姐”去世,年僅26歲,司機開小米su7超速將其撞飛

福建美女“覃姐姐”去世,年僅26歲,司機開小米su7超速將其撞飛

180°視角
2025-04-15 12:33:40
5月1日起,城鎮戶口可遷回農村,重新分配土地和宅基地建房!

5月1日起,城鎮戶口可遷回農村,重新分配土地和宅基地建房!

樂山精選
2025-04-02 11:58:11
你都知道哪些行業內幕?網友:水果真的要少吃,吃多脾胃不好

你都知道哪些行業內幕?網友:水果真的要少吃,吃多脾胃不好

娛樂圈人物大賞
2025-04-15 00:05:27
謝浩男相比較跟爸爸相處跟媽媽相處完全是兩種狀態,明顯跟爸爸親

謝浩男相比較跟爸爸相處跟媽媽相處完全是兩種狀態,明顯跟爸爸親

小影的娛樂
2025-04-16 00:36:15
中國反制,美國暫緩關稅戰,烏克蘭有機會?基輔揚言購買美國導彈

中國反制,美國暫緩關稅戰,烏克蘭有機會?基輔揚言購買美國導彈

風信子的花
2025-04-16 01:40:08
實錘有后門!央視曝光3名美國NSA特工攻擊路徑,國產替代要加速

實錘有后門!央視曝光3名美國NSA特工攻擊路徑,國產替代要加速

游古史
2025-04-15 16:35:22
廣東一服飾公司財務造假6年,老板套現10億被捕,國資無奈接盤

廣東一服飾公司財務造假6年,老板套現10億被捕,國資無奈接盤

墨印齋
2025-04-15 18:40:29
鎖定西部第五!快船笑納76人三重大禮,莫雷神操作毀恩比德巔峰

鎖定西部第五!快船笑納76人三重大禮,莫雷神操作毀恩比德巔峰

奕辰說球
2025-04-15 11:24:26
掘金老板:已做出解雇決定后曾征求約基奇意見 被他拒絕了

掘金老板:已做出解雇決定后曾征求約基奇意見 被他拒絕了

直播吧
2025-04-15 08:44:10
東風26恐怖的生產數量,終于讓美國明白中國的打法

東風26恐怖的生產數量,終于讓美國明白中國的打法

科學知識點秀
2025-04-12 08:40:13
張柏芝小時候的身份證,這才是天生麗質

張柏芝小時候的身份證,這才是天生麗質

東方不敗然多多
2025-04-13 10:55:13
山西省委常委、政法委書記為重要貢獻舉報人頒獎

山西省委常委、政法委書記為重要貢獻舉報人頒獎

政知新媒體
2025-04-15 13:40:16
中國開始乘勝追擊,中美關稅戰的最終結局,特朗普已經沒得選

中國開始乘勝追擊,中美關稅戰的最終結局,特朗普已經沒得選

老高風云
2025-04-14 18:43:50
沈陽奔海自助餐要黃了?祁老板視頻發聲并直播哭泣

沈陽奔海自助餐要黃了?祁老板視頻發聲并直播哭泣

遼沈音信
2025-04-16 00:01:05
拜登預言成真,等特朗普干完這四年,美國或將成為“世界老二”?

拜登預言成真,等特朗普干完這四年,美國或將成為“世界老二”?

阿傖說事
2025-04-14 18:15:13
廊坊通報“廣告牌匾禁用紅藍黑”:三河市委主要負責人被免職

廊坊通報“廣告牌匾禁用紅藍黑”:三河市委主要負責人被免職

人民網
2025-04-15 10:45:26
京東、美團交火,殃及餓了么?

京東、美團交火,殃及餓了么?

無冕財經
2025-04-15 18:27:33
經此一戰,中國國際威望大增,全世界的人態度都變了

經此一戰,中國國際威望大增,全世界的人態度都變了

華山穹劍
2025-04-15 20:25:15
2025-04-16 02:48:49
金華科協 incentive-icons
金華科協
金華市科協傳播科學知識新平臺
2030文章數 286關注度
往期回顧 全部

科技要聞

小鵬汽車MPV車型改款上市,35.98萬起

頭條要聞

中國不理他特朗普破防了 稱中國為"敵對貿易國家"

頭條要聞

中國不理他特朗普破防了 稱中國為"敵對貿易國家"

體育要聞

惡性循環!錫伯杜的壓榨哲學是對是錯?

娛樂要聞

娛樂圈模范夫妻塌房?私生活曝光!

財經要聞

李強:以更大力度促進消費擴大內需

汽車要聞

19.99萬起 廣汽本田P7能在新能源分一杯羹?

態度原創

時尚
手機
健康
家居
藝術

春天穿“韓系少女風”的你,美到離譜!

手機要聞

直屏黨狂喜!華為Mate80全系將采用直屏+超窄邊框?

在中國,到底哪些人在吃“偉哥”?

家居要聞

現代本真 展現歸零心態

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 江永县| 柳林县| 青海省| 南丰县| 广安市| 施秉县| 铜陵市| 五原县| 舟曲县| 温州市| 利津县| 天水市| 张掖市| 东港市| 全南县| 三门县| 永济市| 东乡族自治县| 阳春市| 临湘市| 奉新县| 北安市| 冀州市| 安图县| 昌江| 榆林市| 佛冈县| 涞源县| 金川县| 通江县| 徐州市| 双流县| 枝江市| 赤峰市| 驻马店市| 阳原县| 沙坪坝区| 巴林左旗| 大足县| 界首市| 清丰县|