品玩4月21日訊,據techCrunch 報道,OPenAI 最近推出的 o3 和 o4-mini 模型被曝存在嚴重的幻覺問題。
根據 OpenAI 的內部測試,o3 和 o4-mini比該公司之前的推理模型(o1、o1-mini 和 o3-mini)以及 OpenAI 傳統的 “非推理 ”模型(如 GPT-4o)更容易產生幻覺。OpenAI 在其關于 o3 和 o4-mini 的技術報告中寫道,“需要進行更多的研究”,以了解為什么隨著推理模型的擴大,幻覺會越來越嚴重。
OpenAI 發現,o3 在回答 PersonQA 中 33% 的問題時產生了幻覺,而 PersonQA 是公司內部衡量模型對人的認知準確性的基準。這大約是OpenAI之前的推理模型o1和o3-mini出現幻覺率的兩倍,o1和o3-mini的幻覺率分別為16%和14.8%。O4-mini在PersonQA上的表現更糟--48%的時間出現幻覺。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.