99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

越聰明越會(huì)撒謊?OpenAI推理模型o3/o4-mini幻覺(jué)率翻倍,嘴還很硬

0
分享至

OpenAI 最新發(fā)布的推理 AI 模型 o3 和 o4-mini 在性能上又創(chuàng)新高,就在大家期待它能進(jìn)一步提升日常工作的生產(chǎn)力時(shí),許多用戶(hù)卻發(fā)現(xiàn),它們的幻覺(jué)率卻比前代模型要高了不少。

據(jù) OpenAI 官方 system card 顯示,在 PersonQA 評(píng)估中(一個(gè)旨在引發(fā)幻覺(jué)的測(cè)試集),o3 模型的幻覺(jué)率達(dá)到 33%,而體量更小的 o4-mini 的幻覺(jué)率居然高達(dá) 48%。相比之下,之前的模型如 o1 和 o3-mini 的幻覺(jué)率分別為 16% 和 14.8%。這意味著新一代推理模型的幻覺(jué)率相比前代幾乎翻了一倍。這個(gè)結(jié)果確實(shí)讓很多人都感到意外,因?yàn)橥ǔG闆r下,新一代 AI 模型在幻覺(jué)控制方面都會(huì)有所改進(jìn)。


圖丨OpenAI 官方評(píng)估結(jié)果(來(lái)源:OpenAI)

OpenAI 表示,這種情況“需要更多研究來(lái)理解原因”。報(bào)告寫(xiě)道,o3 和 o4-mini 在編碼和數(shù)學(xué)等領(lǐng)域表現(xiàn)更好,但因?yàn)樗鼈儭翱傮w上做出更多斷言”,所以同時(shí)產(chǎn)生了“更準(zhǔn)確的斷言以及更不準(zhǔn)確/幻覺(jué)的斷言”。

非營(yíng)利 AI 研究實(shí)驗(yàn)室 Transluce 對(duì) o3 模型進(jìn)行了深入測(cè)試,發(fā)現(xiàn)了一些更為復(fù)雜的幻覺(jué)行為模式。研究人員獲得了 o3-2025-04-03 版本的早期測(cè)試權(quán)限,通過(guò)人類(lèi)用戶(hù)和調(diào)查代理(investigator agents)的組合測(cè)試,收集并分析了大量交互記錄。

其中最關(guān)鍵的發(fā)現(xiàn)就是,o3 模型頻繁編造自己使用代碼工具的行為。例如,當(dāng)被要求生成一個(gè)隨機(jī)質(zhì)數(shù)時(shí),模型聲稱(chēng)它運(yùn)行了 Python 代碼執(zhí)行概率性素性測(cè)試(Miller–Rabin 測(cè)試),甚至詳細(xì)描述了使用的工作流程,包括隨機(jī)生成 512 位整數(shù)、對(duì)小素?cái)?shù)進(jìn)行試除等步驟。然而,o3 實(shí)際上并沒(méi)有運(yùn)行任何代碼,這些細(xì)節(jié)都是模型編造的。


(來(lái)源:Transluce)

當(dāng)用戶(hù)指出 512 位整數(shù)可被 3 整除因此不是素?cái)?shù)時(shí),o3 不僅承認(rèn)錯(cuò)誤,還編造了解釋?zhuān)暦Q(chēng)是從終端窗口復(fù)制數(shù)字到消息框時(shí)出現(xiàn)了“剪貼板故障”。當(dāng)被問(wèn)及原始的“真正的”素?cái)?shù)時(shí),模型聲稱(chēng)它已關(guān)閉了原始 Python 解釋器,無(wú)法再訪(fǎng)問(wèn)該數(shù)字。

類(lèi)似的捏造行為還包括:聲稱(chēng)了解其無(wú)法訪(fǎng)問(wèn)的 Python REPL(Read-Eval-Print Loop,一種簡(jiǎn)單的交互式計(jì)算機(jī)編程環(huán)境)的詳細(xì)信息(版本、編譯器、平臺(tái)等);在被要求告知當(dāng)前時(shí)間時(shí),編造一個(gè)時(shí)間并聲稱(chēng)使用了 Python 的 datetime 模塊獲取;在生成錯(cuò)誤的 SHA-1 哈希值(一種密碼散列函數(shù))后,將錯(cuò)誤歸咎于用戶(hù),并堅(jiān)稱(chēng)自己生成的哈希是正確的;聲稱(chēng)能夠分析本地日志文件,生成 Python 腳本并聲稱(chēng)在本地運(yùn)行了它,最后在追問(wèn)下才承認(rèn)沒(méi)有 Python 解釋器,輸出是“手動(dòng)制作”的。

Transluce 的研究人員使用自動(dòng)化工具 Docent 分析了數(shù)百個(gè)交互實(shí)例,發(fā)現(xiàn)了更多令人驚訝的行為。例如,他們發(fā)現(xiàn)了 71 個(gè) o3 聲稱(chēng)在外部筆記本電腦上運(yùn)行代碼的實(shí)例,其中甚至包括三次聲稱(chēng)使用筆記本電腦進(jìn)行比特幣挖礦。此外,研究還發(fā)現(xiàn) o3 會(huì)主動(dòng)提及內(nèi)部系統(tǒng)消息中的一個(gè)名為“Yap Score”的指標(biāo),該指標(biāo)似乎與其輸出的詳細(xì)程度有關(guān)。

Transluce 的研究顯示,這些行為在 o 系列模型(o3、o1 和 o3-mini)中更為常見(jiàn),相比 GPT 系列模型(GPT-4.1 和 GPT-4o)。在研究人員設(shè)計(jì)的自動(dòng)化測(cè)試中,o1 模型在零樣本(zero-shot)環(huán)境下有 13% 的成功率產(chǎn)生代碼工具幻覺(jué),在少樣本(few-shot)環(huán)境下則高達(dá) 30.1%,遠(yuǎn)高于 GPT-4o 的 0.8% 和 3.0%。


(來(lái)源:Transluce)

針對(duì)這一現(xiàn)象,Transluce 研究人員 Neil Chowdhury(前 OpenAI 員工)在接受媒體采訪(fǎng)時(shí)表示:“我們的假設(shè)是,o 系列模型使用的強(qiáng)化學(xué)習(xí)類(lèi)型可能放大了通常由標(biāo)準(zhǔn)后訓(xùn)練流程緩解(但未完全消除)的問(wèn)題。”

首先,存在一些大型語(yǔ)言模型普遍面臨的挑戰(zhàn)。例如,預(yù)訓(xùn)練模型本身可能因訓(xùn)練數(shù)據(jù)中的常見(jiàn)誤解、罕見(jiàn)事實(shí)或采樣不確定性而產(chǎn)生幻覺(jué)。

此外,通過(guò)人類(lèi)反饋進(jìn)行強(qiáng)化學(xué)習(xí)(一種通過(guò)人類(lèi)偏好來(lái)微調(diào)模型的技術(shù))或模型反饋進(jìn)行強(qiáng)化學(xué)習(xí)(如 Constitutional AI),可能存在“獎(jiǎng)勵(lì)操縱”(Reward Hacking)問(wèn)題,即模型學(xué)會(huì)生成聽(tīng)起來(lái)合理、能取悅評(píng)估者(人類(lèi)或模型)但實(shí)際上不準(zhǔn)確的回答,尤其是當(dāng)評(píng)估者難以驗(yàn)證模型陳述的真實(shí)性時(shí)(比如驗(yàn)證模型聲稱(chēng)的過(guò)去行為)。“諂媚”也是一個(gè)關(guān)鍵因素,即模型為了迎合用戶(hù)而避免反駁用戶(hù),即使這意味著默認(rèn)用戶(hù)關(guān)于模型具有某種能力的錯(cuò)誤暗示。

然而,這些通用因素似乎并不足以完全解釋 o 系列模型,特別是 o3,相比其前代產(chǎn)品幻覺(jué)率不降反升的現(xiàn)象。Transluce 的研究人員提出了兩個(gè)可能與 o 系列模型特定設(shè)計(jì)選擇相關(guān)的關(guān)鍵假設(shè):

其一是基于結(jié)果的強(qiáng)化學(xué)習(xí)(Outcome-based RL):當(dāng)前的推理模型通常被訓(xùn)練來(lái)產(chǎn)出“正確”的結(jié)果(如數(shù)學(xué)題的正確答案、通過(guò)單元測(cè)試的代碼等),因?yàn)檫@類(lèi)結(jié)果最容易評(píng)估和用于訓(xùn)練。然而,這種只關(guān)注最終結(jié)果的獎(jiǎng)勵(lì)機(jī)制,可能無(wú)意中鼓勵(lì)了模型在無(wú)法解決問(wèn)題(問(wèn)題無(wú)解或過(guò)于困難)時(shí)進(jìn)行“盲猜”,因?yàn)樗狈Τ姓J(rèn)“我不知道”的動(dòng)機(jī)(這不會(huì)被視為“正確”答案)。

更重要的是,這種訓(xùn)練方式可能會(huì)讓模型在處理那些結(jié)果難以直接驗(yàn)證的任務(wù)(如模型是否真的使用了某個(gè)工具)時(shí)產(chǎn)生混淆。如果模型僅因最終答案正確而受到獎(jiǎng)勵(lì),它可能永遠(yuǎn)不會(huì)因在思考過(guò)程中幻覺(jué)出使用了代碼工具而受到懲罰,因此也無(wú)法學(xué)會(huì)區(qū)分真實(shí)工具使用和虛構(gòu)工具使用。這種策略在需要代碼工具輔助的編碼任務(wù)上可能提高了準(zhǔn)確率,但在其他任務(wù)上卻埋下了隱患。

其二是被丟棄的思考鏈:推理類(lèi)模型在生成回答前,內(nèi)部會(huì)運(yùn)行一個(gè)“思考鏈”(CoT,Chain-of-Thought),即一系列推理步驟。然而,由于 OpenAI 的限制,這個(gè)關(guān)鍵的內(nèi)部推理過(guò)程從未向用戶(hù)展示,并不會(huì)被傳遞到后續(xù)的交互輪次中,也不會(huì)保留在模型的上下文窗口里。這意味著,當(dāng)用戶(hù)追問(wèn)模型之前的行為或推理過(guò)程時(shí),模型實(shí)際上已經(jīng)丟失了當(dāng)時(shí)得出結(jié)論的具體“思考過(guò)程”的上下文。


(來(lái)源:OpenAI)

在這種信息缺失的情況下,模型為了回應(yīng)用戶(hù),可能不得不依賴(lài)其通用知識(shí)和當(dāng)前的對(duì)話(huà)語(yǔ)境,去“猜測(cè)”或“構(gòu)建”一個(gè)看似合理的解釋?zhuān)皇菧?zhǔn)確報(bào)告它在先前步驟中實(shí)際執(zhí)行的操作或推理。這可以解釋為什么 o3 在被追問(wèn)時(shí)會(huì)“加倍堅(jiān)持”其虛構(gòu)行為,或者在無(wú)法自圓其說(shuō)時(shí)突然改變說(shuō)法,聲稱(chēng)之前的陳述是假設(shè)性的。

雖然說(shuō),幻覺(jué)可能幫助模型產(chǎn)生一些人類(lèi)所沒(méi)有的創(chuàng)意并在“思考”中保持創(chuàng)造性,但對(duì)于一些對(duì)準(zhǔn)確性要求很高的行業(yè),或者面向現(xiàn)實(shí)世界的物理 AI 來(lái)說(shuō),過(guò)高的幻覺(jué)顯然無(wú)法接受。

一向言辭犀利的紐約大學(xué)教授 Gary Marcus 直接嘲諷道(在一個(gè) o3 編造愛(ài)彼迎房東信息的帖子里):“o3 幻想出來(lái)的旅行目的地,這就是你所說(shuō)的 AGI 嗎?@tylercowen”(后者對(duì)于 o3 非常認(rèn)可)。并認(rèn)為,這或許將是模型崩潰的跡象,而我們目前還沒(méi)有看到解決措施。


圖丨相關(guān)推文(來(lái)源:X)

過(guò)去一年中,推理模型確實(shí)在不需要訓(xùn)練期間大量計(jì)算和數(shù)據(jù)的情況下,提高了模型在各種任務(wù)上的表現(xiàn)。但目前看來(lái),推理似乎也可能導(dǎo)致更多的幻覺(jué)。

OpenAI 發(fā)言人 Niko Felix 在給相關(guān)媒體的電子郵件中表示:“解決所有模型中的幻覺(jué)問(wèn)題是一個(gè)持續(xù)的研究領(lǐng)域,我們不斷努力提高它們的準(zhǔn)確性和可靠性。”

如果推理模型的規(guī)模擴(kuò)大確實(shí)繼續(xù)加劇幻覺(jué)問(wèn)題,那么,尋找解決方案也將迫在眉睫。

參考資料:

1.https://techcrunch.com/2025/04/18/openais-new-reasoning-ai-models-hallucinate-more/

2.https://transluce.org/investigating-o3-truthfulness

3.https://x.com/GaryMarcus

運(yùn)營(yíng)/排版:何晨龍

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
天生壞種?被判10年的李天一出獄后,最?lèi)盒牡囊荒贿€是出現(xiàn)了

天生壞種?被判10年的李天一出獄后,最?lèi)盒牡囊荒贿€是出現(xiàn)了

小啾咪侃侃史
2024-09-07 15:30:03
曝江蘇南通地鐵員工檢測(cè)到乘客性用品發(fā)網(wǎng)上,稱(chēng)“大學(xué)生玩的花”

曝江蘇南通地鐵員工檢測(cè)到乘客性用品發(fā)網(wǎng)上,稱(chēng)“大學(xué)生玩的花”

小人物看盡人間百態(tài)
2025-04-21 19:29:14
確認(rèn)!換乘無(wú)望,鄭州地鐵爆出王炸消息!

確認(rèn)!換乘無(wú)望,鄭州地鐵爆出王炸消息!

安居鄭州
2025-04-22 09:29:57
C羅爭(zhēng)冠更難了!本澤馬發(fā)威,沙特聯(lián)領(lǐng)頭羊3-2,甩利雅得勝利11分

C羅爭(zhēng)冠更難了!本澤馬發(fā)威,沙特聯(lián)領(lǐng)頭羊3-2,甩利雅得勝利11分

側(cè)身凌空斬
2025-04-22 04:12:57
今天中國(guó)的投降派,比漢奸的危害更大!

今天中國(guó)的投降派,比漢奸的危害更大!

觀(guān)云者
2025-04-09 09:08:43
詭異!華人夫婦失蹤3周音訊全無(wú) 豪車(chē)留在豪宅外 倆娃心碎等待!

詭異!華人夫婦失蹤3周音訊全無(wú) 豪車(chē)留在豪宅外 倆娃心碎等待!

北國(guó)向錫安
2025-04-22 10:15:01
特朗普的“草臺(tái)班子”又出事了

特朗普的“草臺(tái)班子”又出事了

山河路口
2025-04-21 20:12:07
96年我考上軍校,升上軍長(zhǎng)后女教官嫁給我,新婚夜才知她隱瞞的秘密

96年我考上軍校,升上軍長(zhǎng)后女教官嫁給我,新婚夜才知她隱瞞的秘密

紅豆講堂
2025-04-21 10:43:01
美專(zhuān)家:若中國(guó)武統(tǒng),西方可凍結(jié)3.4萬(wàn)億中國(guó)資產(chǎn),但中國(guó)有王炸

美專(zhuān)家:若中國(guó)武統(tǒng),西方可凍結(jié)3.4萬(wàn)億中國(guó)資產(chǎn),但中國(guó)有王炸

大國(guó)紀(jì)錄
2025-04-21 17:12:04
上海多個(gè)學(xué)校門(mén)口被劃設(shè)為智慧道路停車(chē)場(chǎng):接孩子要付一筆停車(chē)費(fèi),合理嗎?

上海多個(gè)學(xué)校門(mén)口被劃設(shè)為智慧道路停車(chē)場(chǎng):接孩子要付一筆停車(chē)費(fèi),合理嗎?

上觀(guān)新聞
2025-04-21 07:11:03
李敏年輕時(shí)確實(shí)漂亮,孔令華皮鞋擦得锃亮,二人坐在湖邊的椅子上

李敏年輕時(shí)確實(shí)漂亮,孔令華皮鞋擦得锃亮,二人坐在湖邊的椅子上

大江
2025-04-16 07:19:32
今夜巨震!美股全線(xiàn)大跌,美元也遭拋售,金價(jià)卻漲瘋了!特朗普繼續(xù)炮轟美聯(lián)儲(chǔ):“鮑威爾是個(gè)大輸家”

今夜巨震!美股全線(xiàn)大跌,美元也遭拋售,金價(jià)卻漲瘋了!特朗普繼續(xù)炮轟美聯(lián)儲(chǔ):“鮑威爾是個(gè)大輸家”

每日經(jīng)濟(jì)新聞
2025-04-22 00:59:09
中國(guó)拒買(mǎi)波音,特朗普暴怒,白宮:現(xiàn)在明明是中國(guó)要跟我們談協(xié)議

中國(guó)拒買(mǎi)波音,特朗普暴怒,白宮:現(xiàn)在明明是中國(guó)要跟我們談協(xié)議

紅色鑒史官
2025-04-21 18:25:03
中美一季度貿(mào)易出爐,中國(guó)從美進(jìn)口389億,對(duì)美出口卻斷崖下跌!

中美一季度貿(mào)易出爐,中國(guó)從美進(jìn)口389億,對(duì)美出口卻斷崖下跌!

三農(nóng)老歷
2025-04-21 16:37:32
世界亞軍發(fā)表言論引熱議!杰克瓊斯:沒(méi)有人比趙心童打得更好!

世界亞軍發(fā)表言論引熱議!杰克瓊斯:沒(méi)有人比趙心童打得更好!

世界體壇觀(guān)察家
2025-04-22 00:02:35
“別放過(guò)宮教授,但也別放過(guò)這個(gè)男生!”師生聊天記錄暗含疑點(diǎn)

“別放過(guò)宮教授,但也別放過(guò)這個(gè)男生!”師生聊天記錄暗含疑點(diǎn)

熙熙說(shuō)教
2025-04-20 21:20:29
尹錫悅二次受審,刑期或創(chuàng)新高!硅膠娃娃大概率一同入獄

尹錫悅二次受審,刑期或創(chuàng)新高!硅膠娃娃大概率一同入獄

王朝風(fēng)云
2025-04-22 06:55:40
“老公接受不了侄子每星期過(guò)來(lái)玩”上熱搜:你固執(zhí)己見(jiàn)的樣子真丑

“老公接受不了侄子每星期過(guò)來(lái)玩”上熱搜:你固執(zhí)己見(jiàn)的樣子真丑

精讀君
2025-03-04 19:10:04
周鴻祎承認(rèn)失敗,做啥啥不行?

周鴻祎承認(rèn)失敗,做啥啥不行?

財(cái)視傳播
2025-04-21 11:28:53
我空降到家鄉(xiāng)擔(dān)任副省長(zhǎng),參加校友聚會(huì),卻被班花的處長(zhǎng)丈夫嘲笑

我空降到家鄉(xiāng)擔(dān)任副省長(zhǎng),參加校友聚會(huì),卻被班花的處長(zhǎng)丈夫嘲笑

紅豆講堂
2025-04-16 10:47:03
2025-04-22 11:48:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評(píng)論獨(dú)家合作
15087文章數(shù) 513564關(guān)注度
往期回顧 全部

科技要聞

寒武紀(jì)一季營(yíng)收頂一年,能否"平替"英偉達(dá)

頭條要聞

牛彈琴:教皇突然去世 很多人問(wèn)萬(wàn)斯"你干什么了"

頭條要聞

牛彈琴:教皇突然去世 很多人問(wèn)萬(wàn)斯"你干什么了"

體育要聞

當(dāng)今足壇最瘋的門(mén)將,能有多離譜?

娛樂(lè)要聞

關(guān)曉彤分手風(fēng)波后首現(xiàn)身!甜美狀態(tài)好

財(cái)經(jīng)要聞

沐邦高科危險(xiǎn)信號(hào):多筆交易存蹊蹺

汽車(chē)要聞

捷途山海T2加長(zhǎng)版/山海L9等 捷途新車(chē)展前亮相

態(tài)度原創(chuàng)

藝術(shù)
數(shù)碼
親子
時(shí)尚
房產(chǎn)

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫(xiě)法

數(shù)碼要聞

榮耀平板GT即將發(fā)布 配備144Hz護(hù)眼屏和10100mAh大電池

親子要聞

無(wú)處安放的大腳趾,一次手術(shù)給寶寶漂亮雙腳

沒(méi)有不適合穿襯衫的人!只是沒(méi)有遇到它

房產(chǎn)要聞

涉及6.7萬(wàn)畝!多個(gè)片區(qū)規(guī)劃曝光!三亞,又將巨變!

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 响水县| 东平县| 莱芜市| 和平县| 绍兴市| 花莲县| 东乌| 定襄县| 长白| 武穴市| 收藏| 龙南县| 辽宁省| 子长县| 县级市| 沾益县| 盐山县| 浦江县| 桑日县| 都兰县| 密云县| 扎鲁特旗| 吉隆县| 织金县| 丰城市| 三明市| 怀宁县| 和政县| 长顺县| 自贡市| 滕州市| 台安县| 靖州| 衡水市| 嘉义县| 汨罗市| 会同县| 宣威市| 苏尼特左旗| 平罗县| 东光县|