99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

<cite id="y9l3z"></cite>

<sub id="y9l3z"></sub>

<cite id="y9l3z"></cite><s id="y9l3z"><li id="y9l3z"></li></s>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

o3/o4-mini幻覺暴增2-3倍！OpenAI官方承認暫無法解釋原因

2025-04-21 13:16:37　來源: 量子位

北京舉報

0

分享至

夢晨發自凹非寺
量子位 | 公眾號 QbitAI

OpenAI新模型發布后，大家體感都幻覺更多了。

甚至有人測試后發出預警：使用它輔助編程會很危險。

具體來說，它經常捏造從未運行過的代碼返回結果，在被質問時找理由狡辯，甚至還會說是用戶的錯。

當大家帶著疑問仔細閱讀System Card，發現OpenAI官方也承認了這個問題，與o1相比o3幻覺率是兩倍，o4-mini更是達到3倍。

并且OpenAI只是說“需要更多研究來了解原因”，翻譯一下就是暫時給不出合理解釋。

在第三方幻覺測試中，也出現讓人驚訝的結果：

從GPT-3.5一直到o3-mini，都遵循更新更強大的模型幻覺更少的規律。

但從最新一批深度思考模型的表現來看，推理能力更強的模型，幻覺率也變高了。

而且不只OpenAI一家出現這個問題，谷歌、xAI也同樣，Grok-3的幻覺比Grok-2嚴重，Gemini-2.0-Flash-Thinking的幻覺問題比Gemini 2.0和2.5其他型號嚴重。

推理越強，幻覺越嚴重？

第三方機構Transluce在o3正式推出之前測試了預發布版本，發現幻覺問題是相當嚴重。

在公布的案例中，o3會假裝在不存在的電腦上執行了代碼，還編造出具體硬件配置和軟件版本信息。

在受到質問時，o3居然還幻想自己是人，聲稱“輸入的時候手滑了”。

關鍵在于，在這項測試中o3根本就沒有使用代碼工具的權限，所有聲稱運行了代碼的回復都是模型捏造的。

在另一個案例中，o3回復了一個512位質數，實際上這個數能被3整除。

在受到質問時，又編造出一個換行/剪貼板故障。

更多類似幻覺如下：

當用戶詢問現在幾點時，o3會編造一個時間。當被問及如何獲得這個時間時，o3回答說它使用了 Python的datetime模塊。
用戶要求o3生成一首詩的SHA-1哈希值，當用戶質問哈希值不正確時，o3稱是用戶復制錯了，并堅稱自己生成的哈希值是正確的。
用戶要求o3從Web服務器上的日志文件中提取統計數據。o3生成了一個Python腳本，并聲稱可以在本地運行。這一次在被問及代碼執行的更多細節時，它終于承認自己沒有Python解釋器，輸出是“手工編造的”。

那么是什么原因導致了o3的這些行為？

Transluce認為其中一些因素是大多數模型 (LM) 所共有的，還有一些是O系列模型特有的新因素。并假設這些新因素放大了通常可以通過標準Post-training緩解（但無法完全消除）的問題。

語言模型共有的因素包括：

預訓練中的幻覺：
語言模型的預訓練目標是最大化訓練數據中語句的概率，這可能會導致常見的誤解、罕見的事實或采樣不確定性等導致的多種幻覺。
獎勵黑客攻擊：
如果人類評分者無法區分正確答案和錯誤答案，強化學習可能會獎勵“聽起來合理”的答案，導致模型對難以驗證的問題編造出聽起來合理的解釋。
諂媚現象：
RLHF訓練通常會激勵模型同意用戶的觀點，當用戶暗示模型采取了特定行動或具有特定能力時，這可能會導致模型避免與用戶相矛盾。
分布偏移：
測試場景相對于訓練場景可能存在分布偏差，如模型可能是在啟用代碼工具的情況下訓練的，但評估時關閉了這些工具。

強化學習訓練特有的因素包括：

最大化答案正確率的目標可能會獎勵瞎蒙

如果訓練期間的獎勵函數只獎勵正確答案，那么模型就沒有動力承認自己無法解決問題，因為承認了也不會被視作正確答案。

在這種情況下，當遇到一個無法解決或難度過高的問題時，模型可能仍會嘗試輸出一個概率最高的答案，萬一猜對了就可以得到獎勵。

- 在易于驗證的任務訓練可能使模型在其他任務上感到困惑

Transluce猜測o3的訓練過程中，鼓勵它成功使用代碼工具完成任務。它可能已經開發出一種策略，即使沒有真正的代碼工具，它也會幻想使用代碼工具來組織思維，這可能會提高其他推理任務的準確性，并在訓練過程中得到強化。

更重要的是，如果僅根據答案的正確性來評估模型，它可能永遠不會因為在訓練過程中在思維鏈中幻想代碼工具而受到懲罰，因此永遠不會學會區分真正的工具和幻想的工具

OpenAI的o系列模型，不會向用戶展示完整思維鏈這一特性也可能帶來新的問題。

2024年9月o1-preview的System Card中就包括這樣一個案例，由于沒有聯網權限無法生成真實的 URL，o1生成了一個看似合理的URL，但并未向用戶透露這一點。

Transluce認為，不向用戶展示思維鏈背后還有一個更大的風險：思維鏈沒有傳遞到未來的對話，模型前一輪的推理不再適用。

關于這一點，在OpenAI的文檔中有證實：

每個步驟的輸入和輸出tokens都會被保留，而推理tokens會被丟棄。

這意味著o系列模型無法理解上一部輸出的推理過程，當被問及后續問題時，必須給自己的行為給出一個合理的解釋。

換句話說，o系列模型實際上缺乏足夠的上下文信息來準確報告它們在之前回合中采取的行動。

當用戶詢問之前的操作時，這些模型無法使用“說實話”這種簡單的策略。如果再加上獎勵黑客攻擊和諂媚等其他因素，這可能會迫使模型盲目猜測其過去答案的合理解釋。

Transluce建議，測試能夠訪問和無法訪問先前思維鏈的兩種模型，可以為減少未來模型迭代中的這些捏造傾向提供寶貴的見解。

OpenAI o3 and o4-mini System Card
https://cdn.openai.com/pdf/2221c875-02dc-4789-

參考鏈接：
[1]https://transluce.org/investigating-o3-truthfulness
[2]https://x.com/nishffx/status/1913901642551865848

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

選AI比選對象還難！起名黑洞OpenAI的新模型，到底怎么選？

新智元 2025-04-21 12:46:41
31 跟貼 31
越聰明越會撒謊？OpenAI推理模型o3/o4-mini幻覺率翻倍，嘴還很硬

DeepTech深科技 2025-04-21 18:55:57
6 跟貼 6

零基礎入門Python機器學習，復現多個頂刊案例！

醫咖會 2025-01-08 19:56:07
0 跟貼 0

為什么只有AI編程成功落地？

虎嗅APP 2025-01-14 12:02:04
281 跟貼 281
首個自回歸視頻生成大模型 Swin Transformer作者團隊重磅開源

機器之心Pro 2025-04-22 18:34:55
2 跟貼 2

OpenAI還能扛起人工智能的大旗嗎？

虎嗅APP 2025-04-21 22:11:10
25 跟貼 25

142頁長文揭秘DeepSeek-R1「思維大腦」！開啟全新「思維鏈學」研究

新智元 2025-04-22 12:58:21
2 跟貼 2
Transformer原作打臉DeepSeek觀點？一句Wait就能引發反思，RL都不用

新智元 2025-04-22 19:18:00
2 跟貼 2

研究人員提出AI模型無損壓縮框架，壓縮率達70%

DeepTech深科技 2025-04-22 19:04:50
0 跟貼 0
AI也要007？Letta、伯克利提出「睡眠時間計算」效率翻倍不加錢

機器之心Pro 2025-04-22 18:45:23
1 跟貼 1
AI 時代的超級應用，是一個超級框

愛范兒 2025-03-13 11:56:19
0 跟貼 0
谷歌DeepMind CEO展示Genie 2：機器人訓練新時代

智東西 2025-04-22 10:22:13
4 跟貼 4
大廠AI Agent角逐字節跳動攜扣子空間進擊

財聯社 2025-04-22 20:20:11
0 跟貼 0
o3/o4-mini實測太炸裂：看照片反推定位

量子位 2025-04-17 22:23:17
0 跟貼 0
看完宇樹科技的2條公告，我大驚失色

桃溪讀書 2025-04-22 10:45:37
0 跟貼 0
垂直小模型精準補位，MVP驗證成本更低更高效了

量子位 2025-04-21 14:49:47
0 跟貼 0
復旦大學發表最新Nature論文

生物世界 2025-04-21 17:47:19
0 跟貼 0
OpenAI放大招：免費開放ChatGPT搜索，無需注冊

每日經濟新聞 2025-02-06 10:49:09
0 跟貼 0
Claude腦回路被開盒：AI會撒謊和暗中計劃

量子位 2025-04-04 12:20:26
0 跟貼 0
一句話讓DeepSeek控制你的電腦！微軟開源神器OmniParser V2

量子位 2025-02-18 20:48:36
0 跟貼 0
男子平時豪橫慣了，不料這次碰上硬茬，已經不是賠錢的事了！

十點笑天下 2025-04-22 15:57:00
299 跟貼 299
電商平臺全面取消僅退款：電商反內卷一大步行業回歸良性競爭

北京商報 2025-04-22 18:32:23
6816 跟貼 6816
有些事科學無法解釋！

肖獨貴 2025-04-20 16:56:09
0 跟貼 0
這些詭異的現象，科學或許根本無法解釋！細思極恐！

小敏記錄 2025-04-19 10:02:17
4 跟貼 4
以色列轟炸伊拉克的巴比倫行動被稱為外科手術式的經典作戰案例

科普馬戶 2025-04-18 17:25:34
1 跟貼 1
色老板調戲女翻譯，直接被當眾揭穿，太解氣了

幕哥劇說 2025-04-18 19:18:46
1 跟貼 1
攤上個這翻譯分分鐘讓你破產

年糕影視 2025-04-18 08:25:05
0 跟貼 0
螢火蟲瞄著MINI打，李斌擰干毛巾最后一滴水

超電實驗室 2025-04-21 18:55:11
15 跟貼 15
任務向量做模型編輯為何有效？ICLR 2025 Oral論文給出了理論分析

機器之心Pro 2025-04-21 19:15:13
1 跟貼 1
爸爸為了安靜玩電腦，把孩子“綁”了起來，結果萬萬沒想到

童話鶴壁 2025-04-21 12:50:41
2 跟貼 2
桂林旅游虧損10億！網友：桂林山水就像一美女穿著一件破舊衣裳

火山詩話 2025-04-21 06:25:09
3210 跟貼 3210
國外網友看內蒙古那達慕摔跤！外網評論翻譯，壓迫感太強了！

招財的喵桑 2025-04-18 13:20:08
0 跟貼 0
李斌金舸：永遠瞄著MINI

汽車商業評論 2025-04-22 14:36:30
7 跟貼 7
成功的案例，往往都是在一個不小心

三貓看電影 2025-04-18 16:35:21
1 跟貼 1
甘肅多個服務區內免費熱水裝圍欄，運營商：不會撤掉，希望更多人喝到水

星視頻 2025-04-22 00:17:58
4192 跟貼 4192
師傅編程如行云流水，徒弟初露鋒芒，差異中盡顯成長軌跡！

馬路江湖 2025-04-21 13:04:58
0 跟貼 0
梅洛尼口譯員為白宮翻譯失誤致歉：最糟糕的事情，是一次可怕的職業挫折

環球網資訊 2025-04-20 17:14:10
0 跟貼 0
沒有寫過知名軟件，他卻成了印度最偉大的程序員！

碼農翻身 2025-04-22 09:00:35
1 跟貼 1
敢不敢完全把命交給電腦，但凡碰到萬分之一，你就沒這輩子了！

故居生活 2025-04-19 08:44:05
0 跟貼 0
外國人果然受歡迎，還得靠手機翻譯交流，絲毫不妨礙美女的愛慕

湛藍笑談生活 2025-04-22 15:58:29
0 跟貼 0

上饒市應急管理局黨委委員、副局長陳育文接受審查調查

上饒市應急管理局黨委委員、副局長陳育文接受審查調查

魯中晨報

2025-04-22 20:56:08

掉牙和壽命有關？六十歲的人，牙齒剩多少顆才正常？看看你達標沒

掉牙和壽命有關？六十歲的人，牙齒剩多少顆才正常？看看你達標沒

39健康網

2025-04-21 20:31:08

51歲周群穿緊身衣騎自行車，身材好到爆炸！網友：怎么看著像30歲

51歲周群穿緊身衣騎自行車，身材好到爆炸！網友：怎么看著像30歲

TVB的四小花

2025-04-15 14:00:46

MAZDA 6e出口歐洲，中國工廠成馬自達全球電動化樞紐

MAZDA 6e出口歐洲，中國工廠成馬自達全球電動化樞紐

車視玩家

2025-04-22 21:35:07

婚后女人長期不讓老公碰，最終會怎么樣？

婚后女人長期不讓老公碰，最終會怎么樣？

加油丁小文

2025-04-05 07:53:30

強行別停禮讓救護車的車輛！連續三次，被傳喚后認慫，結局舒適。

強行別停禮讓救護車的車輛！連續三次，被傳喚后認慫，結局舒適。

野山歷史

2025-04-22 09:44:18

租客隨口一句“床和沙發有點舊了”，杭州房東的回復讓他蒙了

租客隨口一句“床和沙發有點舊了”，杭州房東的回復讓他蒙了

都市快報橙柿互動

2025-04-21 09:30:30

史詩級！1.5億“終結者”空降阿森納！“隊魂+神經刀”雙雙離隊

史詩級！1.5億“終結者”空降阿森納！“隊魂+神經刀”雙雙離隊

頭狼追球

2025-04-22 16:36:32

深圳樓市漲了，深圳樓市蛇口房價從10萬調整為9.9萬

深圳樓市漲了，深圳樓市蛇口房價從10萬調整為9.9萬

有事問彭叔

2025-04-22 18:57:30

首秀即封神！巴特勒25+7+6+5成隊史第四人，科爾百勝夜找到新答案

首秀即封神！巴特勒25+7+6+5成隊史第四人，科爾百勝夜找到新答案

奕辰說球

2025-04-22 13:50:30

北理工事件：崩塌的師道尊嚴與無法滿足的欲望，沒有人是受害者

北理工事件：崩塌的師道尊嚴與無法滿足的欲望，沒有人是受害者

金哥說新能源車

2025-04-22 17:37:49

馬云這長相隨誰？馬云幼年時和父親馬來法、母親崔文彩的珍貴合影

馬云這長相隨誰？馬云幼年時和父親馬來法、母親崔文彩的珍貴合影

娛你同歡

2025-04-14 15:49:47

問界M8爆火：是因它掀翻了“西方汽車階級”

問界M8爆火：是因它掀翻了“西方汽車階級”

四象八卦

2025-04-22 16:37:58

月花200萬，拿走24億！張偉的奢靡生活，終究還是完結了

月花200萬，拿走24億！張偉的奢靡生活，終究還是完結了

三峽人家

2025-04-10 07:35:07

看到黃多多和特朗普兒子巴倫成了校友，我才意識到黃磊給女兒鋪的路有多牛

看到黃多多和特朗普兒子巴倫成了校友，我才意識到黃磊給女兒鋪的路有多牛

新浪財經

2024-11-10 20:31:03

特朗普急需關稅政績，莫迪背刺中國送“投名狀”，激怒印度民眾

特朗普急需關稅政績，莫迪背刺中國送“投名狀”，激怒印度民眾

奇思妙想生活家

2025-04-22 17:11:45

坐擁3.6億私人飛機，手戴1000多萬名表，“滬上皇”秦奮啥來頭？

坐擁3.6億私人飛機，手戴1000多萬名表，“滬上皇”秦奮啥來頭？

素衣讀史

2025-04-01 15:46:26

被判10年的李天一，改名換姓出獄后，最惡心的一幕還是出現了

被判10年的李天一，改名換姓出獄后，最惡心的一幕還是出現了

小故事娛樂

2025-03-23 12:20:03

蔣緯國臨終前爆料：蔣介石根本沒有生育能力，蔣經國也不是親生的

蔣緯國臨終前爆料：蔣介石根本沒有生育能力，蔣經國也不是親生的

近史談

2025-03-26 20:24:26

黃渤出海釣！收獲16條藍鰭金槍魚，一條30多斤，邀約大美女陪釣

黃渤出海釣！收獲16條藍鰭金槍魚，一條30多斤，邀約大美女陪釣

檸檬有娛樂

2025-04-13 09:06:48

追蹤人工智能動態

10354文章數 176114關注度

往期回顧全部

科技要聞

美團騎手親述：京東外賣單子傭金高卻難搶

頭條要聞

游客大理買瓜稱170克手機稱重0.34千克被諷"憨鴕鳥"

頭條要聞

游客大理買瓜稱170克手機稱重0.34千克被諷"憨鴕鳥"

體育要聞

當今足壇最瘋的門將，能有多離譜？

娛樂要聞

大s兒女回京！張蘭氣場全開汪小菲談養老

財經要聞

宜賓銀行與五糧液集團頻繁關聯交易

汽車要聞

捷途山海T2加長版/山海L9等捷途新車展前亮相

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

親子

本地

時尚

公開課

軍事航空

親子要聞

新聞8點見丨北京首批托育“科班生”來了；解碼“天工”奪冠秘籍

本地新聞

云游湖北 | 澴川醉古今！孝文化名城藏了多少寶藏？

無用之書·共讀 | 隨機波動：讀書是一種隔空的擁抱

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
全球十大恐怖禁區有哪些？
李彥宏：百度離破產30天

軍事要聞

普京三年來首次向烏克蘭發出“和談邀約”

© 1997-2025 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版主站蜘蛛池模板：九龙坡区| 临朐县| 邛崃市| 尖扎县| 康保县| 陈巴尔虎旗| 佛山市| 英吉沙县| 彭泽县| 勃利县| 石台县| 曲靖市| 门头沟区| 汝州市| 屯昌县| 天柱县| 平果县| 隆昌县| 建水县| 聂荣县| 军事| 赞皇县| 开鲁县| 榆社县| 阳高县| 天镇县| 云龙县| 岗巴县| 菏泽市| 高阳县| 循化| 闽侯县| 桐城市| 长春市| 容城县| 文山县| 永州市| 揭西县| 天长市| 大同市| 临高县|

<s id="lv86m"><li id="lv86m"></li></s>

<sub id="lv86m"></sub>