99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

GPT-5前菜!OpenAI最強模型o3上手:到底強在哪?

0
分享至

最近 OpenAI 的活確實有點多。在 3 月底推出 GPT-4o 原生圖像生成再度火遍全球后,北京時間 4 月 15 日凌晨,OpenAI 又推出了全新 GPT-4.1 系列模型,替代舊款的 GPT-4 模型。

而就在今天(4 月 17 日)凌晨,OpenAI 如約繼續推出了兩款全新的 o 系列推理模型——o3、o4-mini,替代此前的 o1 和 o3-mini。更重要的是,o3、o4-mini 不僅擁有了更強大的推理能力,支持將圖像直接納入「思考過程」,還是首次能夠獨立使用全部 ChatGPT 工具的推理模型,被官方稱為:

「我們(OpenAI)迄今為止發布的最智能的模型,代表了 ChatGPT 能力的一次飛躍。」

飛不飛躍我們先按下不談,但有一點實在讓人在意。OpenAI CEO 山姆·奧爾特曼(Sam Altman)今年 2 月就在 X 平臺公開披露內部的模型路線圖,指出 GPT-4.5(Orion)將是「OpenAI 最后一個非推理(思維鏈)模型」,還說之后的 GPT-5 將整合 GPT 系列和 o 系列模型:

「不再將 o3 作為獨立模型推出。」



圖/ X

但現在來看,山姆·奧爾特曼當時的承諾似乎一個都沒有兌現,OpenAI 不僅發布了新的 GPT-4.1 系列非推理模型,還獨立推出了 o3 推理模型。那還有一直活在傳聞的 GPT-5,我們真的能在今年夏天看到嗎?

OpenAI 又發一波模型,o3是最特別的一個

GPT-4.1 系列、o3、o4-mini 發布之前,關于 OpenAI 太多模型的吐槽其實就已經甚囂塵上,不僅是普通 ChatGPT 用戶,也包括很多開發者,也認為 OpenAI 的模型陣容讓人「選擇困難」。

好在,雖然過去兩天 OpenAI 又連發了好幾個新模型,但至少也同步砍掉了一些「舊模型」。在 GPT-4.1 正式推出后,OpenAI 就預告將于 4 月 30 日在 ChatGPT 全面下線 GPT-4 模型,同時還將在 API 中(面向開發者)棄用 GPT-4.5 預覽版。

作為通用基座模型,GPT-4.1 實際分為了旗艦版、mini 版、nano 版,支持高達百萬級 tokens 上下文,在性能、成本和速度上全面優于目前最主力的 GPT-4o 系列模型,但目前僅面向開發者上線 API。

但如果說 GPT-4.1 代表了 OpenAI 的現在,o3 和 o4-mini,可能就代表了 OpenAI 的未來。作為 OpenAI 探索推理模型技術路線的最新成果,o3 和 o4-mini 率先在推理鏈(chain-of-thought)中真正納入圖像理解能力。



圖/ OpenAI

簡單來說,它不僅能識別信息,還能把這些視覺輸入納入思維過程,成為完整邏輯鏈的一部分。不同于 GPT-4o 這類多模態模型,GPT-4o 雖然能「看圖」,但更多是為了給出自然語言響應,而 o3、o4-mini 的圖像處理是為了解決問題——它是推理的一環。

與此同時,作為官方認證的最強模型——o3,還是第一個調用 ChatGPT 全部工具的推理模型,包括搜索網絡、Python、圖像生成、代碼解釋器、文件讀取等。并且在與 o1 相同的延遲和成本下,o3 在 ChatGPT 中實現了更高的性能。

但實際表現如何,還是上手體驗才有結果。

OpenAI「最強推理模型」上手:名副其實

對于推理模型而言,推理能力自然是重中之重,先來一道倫理推理題,非常考驗模型的推理能力,我們也對比了 DeepSeek-R1 以及 Gemini-2.5-Pro 兩大頂尖模型。

但在揭曉回答之前,o3 最驚艷的就是思考過程推導的嚴謹和流暢,相比之下,DeepSeek-R1 的思考過程就顯得相當冗長和重復,思考非常久,最終的回答卻很難令人滿意。



圖/雷科技

在 DeepSeek-R1 的回答中,實際只回答了「憤怒的原因」,而沒有回答出「崩潰的原因」。在 Gemini-2.5-Pro 的回答中,雖然更進一步推理出了「女兒撒謊」這個因素,但也很難導致「父親崩潰」。



圖/雷科技

o3 則相當完美地抓出「色盲」的關鍵判斷,進一步根據生物遺傳知識推導出最終的解釋。這里還要一提的是,其實 DeepSeek-R1 在思考過程中也提到了「色盲」這個點,但并沒有認為有效的推導。

此外,o3 以及 o4-mini 的一大突破在于將視覺能力納入思維鏈之中,相比之前阿里推出的視覺推理模型 QVQ-Max 更進了一步。

你可以上傳一張機場照片,它會識別出航站樓建筑、乘客流線和標識系統,再結合你的問題完成空間動線的規劃或問題診斷。這種「圖像不是輸入素材,而是參與推理的變量」的設計,也是過去 o 系列推理模型所不具備的。

更重要的是,它可以根據圖像實時思考分析策略。

比如最近 AI 行業非常關鍵的一件事,就是支付寶在前幾天聯合魔搭社區剛剛上線了支付 MCP Server 讓 AI 智能體打通了「變現」的支付環節。我就拿一段演示視頻發送給 o3,詢問「視頻里展示技術的關鍵之處」,甚至沒有告訴它任何背景信息。



圖/雷科技

而在實際測試中,o3 會提取不同時間的關鍵幀理解視頻,再結合自身分析推理和聯網能力,明確定位到了支付寶「支付 ?MCP?Server」的,并且結合信息分析了支付寶「支付 ?MCP?Server」的關鍵意義。

不僅如此,在一段關于短視頻優化的測試中,o3 被要求分析后臺數據并結合視頻分鏡做優化策略,輸出的內容不僅覆蓋「3 秒留人、節奏剪輯、文案鉤子」等核心策略,還匹配了具體視覺節奏建議。



圖/雷科技

這點來看,o3 很像一個有一定審美和經驗的「專業創作者助手」,能針對實際的視頻內容,而不是「簡單套模板」的自動化建議。

而從這些測試也能看出,o3 懂得什么時候該分析、什么時候該搜索、什么時候該調用工具、什么時候該總結。而這種「主動思維+執行鏈條」,正是當下大模型集體演進的一個重要方向。

所以,它真的是 OpenAI 迄今為止最智能的模型嗎?從目前的體驗來看,確實稱得上名副其實,甚至在不同推理模型的對比也是表現最強的。

用完 o3 最大的感受,你會覺得它在真正理解任務——而不只是理解你的意圖。在思考過程中能夠明顯看到這一點,同時還有 o3 在視覺理解、工具調用以及強大的推理能力。

也正因為如此,用完 o3 后,那些關于 GPT-5 的想象也變得更具體了。

山姆·奧爾特曼明確說過,GPT-5 會整合 GPT 系列與 o 系列,而按照最新透露出的消息,GPT-5 的推出時間基本鎖定在今年夏天。按照時間來看,GPT-4.1/GPT-4.5 和 o3/o4-mini 很可能就是最后一代「獨立」模型,也是被「整合」的主力。

如果兩者真的融合,那會不會是一個既能讀百萬 tokens,又能跨模態行動,還能自主調度工具進行思維鏈的大一統模型?無論如何,這確實是未來幾個月 AI 行業最值得期待的懸念之一。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
深圳樓市,光明房價有點恐怖。。

深圳樓市,光明房價有點恐怖。。

樓市諸葛
2025-04-22 07:35:03
7輪僅1勝!熱刺1-2遭森林賽季雙殺 森林終結英超2連敗&升第3

7輪僅1勝!熱刺1-2遭森林賽季雙殺 森林終結英超2連敗&升第3

直播吧
2025-04-22 05:05:23
問界M8解決了多少問界M7車主的痛點?難怪老車主總感覺腰有點疼

問界M8解決了多少問界M7車主的痛點?難怪老車主總感覺腰有點疼

車有梗
2025-04-22 06:10:25
“2天只睡6小時,還是沒調劑成功”,男孩在高鐵站睡著引人心疼

“2天只睡6小時,還是沒調劑成功”,男孩在高鐵站睡著引人心疼

熙熙說教
2025-04-13 21:26:24
北京大爺地鐵罵人,全網破防!兒子發聲,父親以后會注意的!

北京大爺地鐵罵人,全網破防!兒子發聲,父親以后會注意的!

騎著蝸牛追導彈85
2025-04-21 13:35:39
10年前,那個為救白血病弟弟,狠心打掉腹中雙胎的女子,結局怎樣

10年前,那個為救白血病弟弟,狠心打掉腹中雙胎的女子,結局怎樣

墜入二次元的海洋
2025-04-20 13:15:25
大跳水!最高下跌超60%!

大跳水!最高下跌超60%!

天津生活通
2025-04-22 10:21:58
痛心!河北一男一女,在車里活活被燒死,遇難者鄰居發聲!

痛心!河北一男一女,在車里活活被燒死,遇難者鄰居發聲!

魔都姐姐雜談
2025-04-21 12:56:47
微信更新,又有 4 個新變化!

微信更新,又有 4 個新變化!

全是技能
2025-04-21 11:51:42
老同學問我退休金多少,我謊稱2200,誰知第二天接到8個電話

老同學問我退休金多少,我謊稱2200,誰知第二天接到8個電話

詭譎怪談
2025-04-17 10:49:24
俄導彈炸翻烏政府大樓,致35死117傷!朝鮮重大突破,烏剩一條路

俄導彈炸翻烏政府大樓,致35死117傷!朝鮮重大突破,烏剩一條路

紓瑤
2025-04-18 17:11:33
江青秘書坦言:有件事得感謝江青,不管怎樣,得實事求是

江青秘書坦言:有件事得感謝江青,不管怎樣,得實事求是

新語話史
2025-04-17 23:23:42
6499元起!全球首款“V單”手機發布,這配置太狠了

6499元起!全球首款“V單”手機發布,這配置太狠了

雷科技
2025-04-22 00:00:35
中方發出警告,誰敢出賣中國利益,換取美國關稅豁免,必重拳反制

中方發出警告,誰敢出賣中國利益,換取美國關稅豁免,必重拳反制

深析古今
2025-04-21 16:17:06
郭晶晶全家在懸空寺,入住1266元豪華民宿,霍震霆一臉嚴肅太嚇人

郭晶晶全家在懸空寺,入住1266元豪華民宿,霍震霆一臉嚴肅太嚇人

阿褲趣聞君
2025-04-21 14:25:09
《歌手2025》終于定檔!8位頂級唱將云集,我最期待43歲的他

《歌手2025》終于定檔!8位頂級唱將云集,我最期待43歲的他

涵豆說娛
2025-04-21 20:42:22
謝媽變身小迷妹,對標千萬網紅電商公司,謝媽商業帝國即將崛起

謝媽變身小迷妹,對標千萬網紅電商公司,謝媽商業帝國即將崛起

趣文說娛
2025-04-22 09:11:28
時隔42年,某體育學院同寢室6畢業生再相逢!一組照片讓網友熱議

時隔42年,某體育學院同寢室6畢業生再相逢!一組照片讓網友熱議

火山詩話
2025-04-21 06:43:01
甲亢哥剛回美國又想重游中國,后悔沒去紹興直播,透露鹵鵝哥即將去美國

甲亢哥剛回美國又想重游中國,后悔沒去紹興直播,透露鹵鵝哥即將去美國

陳意小可愛
2025-04-22 09:43:35
定居美國10余年,78歲卻回國“撈金”,她憑啥被稱“人民藝術家”

定居美國10余年,78歲卻回國“撈金”,她憑啥被稱“人民藝術家”

夢史
2025-04-01 11:59:20
2025-04-22 11:39:00
雷科技 incentive-icons
雷科技
專注AI硬科技
32925文章數 810776關注度
往期回顧 全部

科技要聞

寒武紀一季營收頂一年,能否"平替"英偉達

頭條要聞

牛彈琴:教皇突然去世 很多人問萬斯"你干什么了"

頭條要聞

牛彈琴:教皇突然去世 很多人問萬斯"你干什么了"

體育要聞

當今足壇最瘋的門將,能有多離譜?

娛樂要聞

關曉彤分手風波后首現身!甜美狀態好

財經要聞

沐邦高科危險信號:多筆交易存蹊蹺

汽車要聞

捷途山海T2加長版/山海L9等 捷途新車展前亮相

態度原創

家居
手機
親子
公開課
軍事航空

家居要聞

動靜結合 休閑娛樂并存

手機要聞

榮耀GT Pro即將推出 瞬時觸控采樣率高達2700Hz

親子要聞

無處安放的大腳趾,一次手術給寶寶漂亮雙腳

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

普京:復活節停火期限結束后 軍事行動已經恢復

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 靖安县| 荥阳市| 南乐县| 饶平县| 芮城县| 遂平县| 东光县| 临汾市| 邓州市| 夏邑县| 鄂州市| 宁津县| 盐边县| 桃源县| 长春市| 桦甸市| 富源县| 四会市| 云梦县| 屏东县| 新沂市| 准格尔旗| 庆元县| 临猗县| 璧山县| 通山县| 观塘区| 内江市| 上杭县| 五大连池市| 岳西县| 昌黎县| 文昌市| 玉田县| 固镇县| 乐业县| 洮南市| 许昌县| 丹巴县| 高邮市| 高雄县|