99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

OpenAI深夜發布滿血o3和o4mini: 兩個沒想到

0
分享至


OpenAI剛剛宣布推出其最新的o系列模型:o3和o4-mini,與以往模型不同,o3和o4-mini被設計為真正的AI系統,模型甚至能連續調用超過600次工具來完成一項艱巨任務,它們在理解和導航大型代碼庫(比如OpenAI自己的代碼庫)方面,超越了人類工程師,極大地提高了開發效率

這次發布會我有兩個沒想到:一是沒想到o系列模型變成了一個融合的模型,另外一個是引入圖像推理“Thinking with Images”,下面第一時間給大家劃個重點

全面工具訪問與推理能力

o3和o4-mini最顯著的特點是首次實現了對ChatGPT內所有工具的智能使用和組合能力。它們可以搜索網絡、分析上傳的文件、處理視覺輸入、生成圖像,并且能夠智能地判斷何時以及如何使用這些工具來解決復雜問題。這些模型經過專門訓練,能夠在大約一分鐘內提供詳細且經過深思熟慮的答案,以適當的輸出格式解決多方面的問題

o3,o4mini性能

OpenAI o3是目前最強大的推理模型,在編程、數學、科學、視覺感知等領域推動了技術邊界。它在包括Codeforces、SWE-bench和MMMU在內的多項基準測試中創下新的記錄。在由外部專家進行的評估中,o3在解決困難的現實世界任務時比OpenAI o1減少了20%的重大錯誤,特別是在編程、商業咨詢和創意構思方面表現出色。早期測試者強調了它作為思維伙伴的分析嚴謹性,以及在生物學、數學和工程背景下生成和批判性評估新假設的能力


OpenAI o4-mini是一個針對快速、高效推理而優化的小型模型。盡管規模較小,但它在數學、編碼和視覺任務方面表現出色。在2025年AIME數學競賽中,當獲得Python解釋器訪問權限時,o4-mini的得分高達99.5%,實際上已經飽和了這個基準測試。在專家評估中,它也在非STEM任務和數據科學等領域超越了前身o3-mini。由于其高效性,o4-mini支持比o3更高的使用限制,使其成為需要推理能力的高容量、高吞吐量應用的理想選擇



圖像推理能力的突破

o3和o4-mini首次能夠將圖像直接整合到思維鏈中,它們不僅能看到圖像,還能通過圖像進行思考。這解鎖了融合視覺和文本推理的新型問題解決方式,在多模態基準測試中表現出色。用戶可以上傳白板照片、教科書圖表或手繪草圖,模型能夠解釋它們——即使圖像模糊、顛倒或質量低下。借助工具使用能力,模型可以實時操作圖像,作為推理過程的一部分進行旋轉、縮放或轉換

負責圖像推理的華裔研究員Jiahui Yu解釋圖像推理(“Thinking with Images”)的重要性:


自最初的 o 系列發布以來,“圖像思考”一直是我們在感知領域的核心戰略之一。我們悄然發布了 o1 vision,作為對這一戰略的驚鴻一瞥——如今,o3 和 o4-mini 的問世則以臻于完善的姿態將其變為現實,多模態技術對于 OpenAI 實現 AGI 的愿景至關重要
朝向主動式工具使用

OpenAI o3和o4-mini可以完全訪問ChatGPT內的工具,以及通過API中的函數調用訪問用戶自定義工具。它們經過訓練,能夠推理如何解決問題,選擇何時以及如何使用工具,以快速產生詳細且經過深思熟慮的答案。例如,用戶可能會問:"今年夏季加利福尼亞的能源使用情況與去年相比如何?"模型可以搜索網絡獲取公用事業數據,編寫Python代碼建立預測模型,生成圖表或圖像,并解釋預測背后的關鍵因素,將多個工具調用鏈接在一起

One More Thing... 開源Codex CLI!

發布會最后還帶來一個驚喜,OpenAI推出了Codex CLI——一個連接模型與用戶本地計算機環境的輕量級命令行接口

它直接在用戶的計算機上工作,旨在最大限度地發揮像o3和o4-mini這樣的模型的推理能力,未來還將支持GPT-4.1等其他API模型。用戶可以通過向模型傳遞屏幕截圖或低保真草圖,結合本地代碼訪問,從命令行獲得多模態推理的好處

發布會現場演示環節開發人員利用Codex CLI工具展示了一個非常酷炫的實時攝像頭ASCII藝術,讓模型直接讀取電腦攝像頭畫面,實時生成酷炫的ASCII動態畫面


開源地址:

https://github.com/openai/codex

最后

從今天開始,ChatGPT Plus、Pro和Team用戶將在模型選擇器中看到o3、o4-mini和o4-mini-high,取代o1、o3-mini和o3-mini-high。ChatGPT Enterprise和Edu用戶將在一周內獲得訪問權限。免費用戶可以在提交查詢前選擇"Think"來嘗試o4-mini。所有計劃的速率限制與先前的模型集保持不變

OpenAI預計將在幾周內發布具有完整工具支持的OpenAI o3-pro。目前,Pro用戶仍可以訪問o1-pro

成本:


o3和o4-mini今天也通過Chat Completions API和Responses API向開發者提供。Responses API支持推理摘要,能夠在函數調用周圍保留推理標記以獲得更好的性能,并將很快支持模型推理中的內置工具,如網絡搜索、文件搜索和代碼解釋器。

個人感覺今天的更新反映了OpenAI模型的發展方向:將o系列的專業推理能力與GPT系列更自然的對話能力和工具使用能力融合。通過統一這些優勢,未來的模型將支持無縫、自然的對話,同時提供主動工具使用和高級問題解決能力

參考:

https://openai.com/index/introducing-o3-and-o4-mini/

?星標AI寒武紀,好內容不錯過?

用你的在看告訴我~

求贊

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
銀河L6穩的不只是銷量,還有29100剛度車身+E型懸掛

銀河L6穩的不只是銷量,還有29100剛度車身+E型懸掛

名車點評
2025-04-27 13:07:47
金杯銀杯不如車主口碑!6萬級王者讓我花小錢辦大事

金杯銀杯不如車主口碑!6萬級王者讓我花小錢辦大事

環球車聞
2025-04-28 17:43:37
2.9L油+2000km續航!銀河L6 EM-i引爆上海車展

2.9L油+2000km續航!銀河L6 EM-i引爆上海車展

車榜網
2025-04-28 12:54:03
“高潮針”打過的都說好?提高G點敏感度2倍,手指一彎就想尿

“高潮針”打過的都說好?提高G點敏感度2倍,手指一彎就想尿

社會醬
2025-04-28 16:29:35
吉利爆改車展規則!銀河戰艦竟把黃浦江搬進展廳?

吉利爆改車展規則!銀河戰艦竟把黃浦江搬進展廳?

汽車新文報道
2025-04-28 18:50:05
海底24小時+鋼針穿刺,L6神盾電池讓2萬家庭閉眼沖

海底24小時+鋼針穿刺,L6神盾電池讓2萬家庭閉眼沖

環球車聞
2025-04-27 13:06:44
脊背發涼!女婿找上海岳母資助換房,意外識破大案!人均損失超百萬

脊背發涼!女婿找上海岳母資助換房,意外識破大案!人均損失超百萬

瀟湘晨報
2025-04-29 11:29:05
顛覆燃油車!吉利銀河L6 EM-i一箱油橫跨三省,銷量爆表

顛覆燃油車!吉利銀河L6 EM-i一箱油橫跨三省,銷量爆表

車觀察
2025-04-27 13:06:26
“這是逼中國放棄美債,特朗普搬起石頭砸自己的腳”

“這是逼中國放棄美債,特朗普搬起石頭砸自己的腳”

觀察者網
2025-04-29 14:45:55
協和醫院董襲螢真是個天之驕女,新華社報道過的精英,經濟轉醫學

協和醫院董襲螢真是個天之驕女,新華社報道過的精英,經濟轉醫學

阿鳧愛吐槽
2025-04-29 14:51:04
沃爾瑪通知中國供應商恢復出貨

沃爾瑪通知中國供應商恢復出貨

財聯社
2025-04-29 16:12:04
顛覆燃油車!吉利銀河L6 EM-i一箱油橫跨三省,銷量爆表

顛覆燃油車!吉利銀河L6 EM-i一箱油橫跨三省,銷量爆表

車榜網
2025-04-27 13:06:33
肖飛事件,麻醉醫生連續發文:壓這么久還是沒壓住,醫院不該隱身

肖飛事件,麻醉醫生連續發文:壓這么久還是沒壓住,醫院不該隱身

明月聊史
2025-04-29 12:38:11
6萬A級家轎,竟也能享受B級車的待遇

6萬A級家轎,竟也能享受B級車的待遇

汽車資訊評
2025-04-28 17:42:33
SHEIN聲稱自己非中國企業,支持美國關稅政策

SHEIN聲稱自己非中國企業,支持美國關稅政策

略大參考
2025-04-29 10:23:45
吉利銀河戰艦硬核亮相!AI四驅+金磚電池,把安全刻進DNA的SUV來了

吉利銀河戰艦硬核亮相!AI四驅+金磚電池,把安全刻進DNA的SUV來了

車榜網
2025-04-27 16:10:34
46.5%熱效+15000km保養,L6混動賬本讓2萬人驚了

46.5%熱效+15000km保養,L6混動賬本讓2萬人驚了

汽車品牌網
2025-04-27 13:08:55
中方發布《不跪!》視頻傳遞何種信息?外交部回應

中方發布《不跪!》視頻傳遞何種信息?外交部回應

澎湃新聞
2025-04-29 15:36:26
唐山市委原常委李麗,收受私營企業主、領導干部等28人所送禮品、禮金、消費卡

唐山市委原常委李麗,收受私營企業主、領導干部等28人所送禮品、禮金、消費卡

魯中晨報
2025-04-28 18:56:11
海底24小時+鋼針穿刺,L6神盾電池讓2萬家庭閉眼沖

海底24小時+鋼針穿刺,L6神盾電池讓2萬家庭閉眼沖

汽車知識報
2025-04-27 13:06:52
2025-04-29 16:56:49
AI寒武紀 incentive-icons
AI寒武紀
專注于人工智能,科技領域
653文章數 259關注度
往期回顧 全部

科技要聞

Qwen3登頂開源榜 阿里稱大模型是十年長跑

頭條要聞

印巴再度交火 外交部回應是否計劃"介入調解"

頭條要聞

印巴再度交火 外交部回應是否計劃"介入調解"

體育要聞

勇士火箭雷霆太陽,你們是怎么失去他的?

娛樂要聞

甜馨簽樂華出道惹爭議 維護爸媽被質疑

財經要聞

特朗普執政百日下的美元危機

汽車要聞

年輕or傳統?上汽奧迪A5L與一汽奧迪A5L有什么不同?

態度原創

教育
家居
游戲
旅游
時尚

教育要聞

全面解析英語高頻詞all的八大核心用法

家居要聞

雅奢氛圍 營造品質生活

《百日戰紀》好玩嗎?小高直接在小紅書評論區自夸

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

年齡從來不是美的枷鎖,掌握這3大穿搭技巧,40+美出圈

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 库伦旗| 水城县| 宣威市| 木兰县| 鹤壁市| 临西县| 锡林浩特市| 福鼎市| 秭归县| 焦作市| 镇赉县| 溧阳市| 丰城市| 青浦区| 浠水县| 永修县| 青川县| 潢川县| 福清市| 崇礼县| 关岭| 漾濞| 师宗县| 宁乡县| 公主岭市| 涟水县| 南皮县| 绥芬河市| 平泉县| 泸溪县| 永康市| 凯里市| 信丰县| 鲁甸县| 博兴县| 长寿区| 昆山市| 屯昌县| 浦东新区| 台江县| 繁峙县|