99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

OpenAI并未讓DeepSeek驚出一身冷汗

0
分享至


出品 | 虎嗅科技組

作者 | 房曉楠

編輯 | 苗正卿

頭圖 | 視覺中國

“OpenAI的創新好像到瓶頸期了。”一位業界人士這樣說道。

今日凌晨,預熱了很久的OpenAI o3模型完整版終于面世,且與以往直播“擠牙膏”式的依次、慢吞發布方式不同的是,這次o3和o4-mini是同時發布。

在OpenAI官方的陳述中,o3和o4-mini的亮點主要在于可以組合調用ChatGPT中的各個工具,像是網絡搜索、Python、圖像分析、文件解釋和圖像生成等。這可以看作是OpenAI開始后發補足自身在Agent能力上的探索。

其中,o3作為推理模型,在編程、數學、科學、視覺感知等多個維度的基準測試中都刷新了紀錄。比如在Codeforces、SWE-bench、MMMU基準測試中,視覺任務準確率高達87.5%,而MathVista達到75.4%。

其實分數、榜單,這些都是常規操作。相較于以往,這次的最大不同在于,o3和o4-mini將上傳的圖像直接集中到思維鏈中,這就意味著,圖像不僅僅是被看到,還能被用來作為思考過程中的一部分。

從OpenAI團隊成員、中科大校友Jiahui Yu發布的帖文來看,“用圖像思考”應該是OpenAI去年9月發布o系列模型以來,就在研發計劃中,之前還悄悄推出了o1 Vision并進行了初步預覽,但并沒有取得很好的效果,也沒有引起關注,直到這次在o3和o4-mini上實現了這一能力。

根據外部專家評估,o3作為o1系列模型的繼任者,其在復雜問題上的錯誤率要比后者低20%,適合在生物學、數學和工程領域的復雜問題查詢。

針對這一點,國外一位醫學博士在測評后發帖表示,這一點確實有很大進步,當他向o3來提問一些頗具挑戰性的臨床或醫學問題時,回答精準、全面,符合對一位該領域真正專家的期望。

對于那些想親自測評、體驗的用戶來說,OpenAI官方已經表示,目前ChatGPT的Plus、Pro會員以及Team用戶,即日起就可以直接體驗o3、o4-mini,以及o4-mini-high,而之前的o1、o3-mini和o3-mini-high已默默退出舞臺。這一操作也被有些網友戲稱為“內部賽馬”,新的產品出來后,之前的通通讓路。

到目前為止,之前預告要發布的GPT?4.1全家桶系列、o3、o4-mini模型就已經全部亮相展示了。據Sam Altman表示,o3和o4-mini可能是ChatGPT在GPT-5發布之前的最后獨立AI推理模型了,期間大概率是不會再有其他新款模型出來了,另外他也說了,預計將在幾周內將o3-pro升級到專業版。

在OpenAI官方的宣傳口徑中,o3和o4-mini是OpenAI所有模型中最為強大、智能的模型,一些開發者、用戶在使用時,也感受到了進步。但是,創新能力似乎并沒有達到預期。

“OpenAI的步調已經不再挺胸闊步了,更不知所措。”在看完OpenAI這次發布的新品后,一位業內人士這樣感嘆道。

雖然o3、o4-mini模型作為新產品,效果不錯,但相較于OpenAI以往的激進和高舉旗幟式前進,如今在創新上面呈現出明顯的心有余而力不足。

其實前兩天在GPT4.1系列套餐發布后,不少業內人士就向虎嗅表示,“暫時還沒看到有什么特別亮眼的突破。”“對o3期待值沒有那么高。”

或者這種“失望”要來得更早一點。

去年12月,o3在OpenAI的系列直播尾聲亮相,Sam Altman稱其為“一個非常、非常聰明的模型”,完全將O1甩在身后,更是在ARC-AGI測試這一旨在評估AI系統適應新任務和展示流動智力能力的測試中,獲得87.5%的成績,也是首次超越人類平均水平(85%),令業界感到震驚,被認為是在通往AGI的道路上迎來了新突破。但在業界開發者看來,似乎并不是這樣。

“這就好比高考成績不能代表工作業務能力。”一位開源領域人士銳評道。而且,如今的行業趨勢已經進入到對數據高要求、對Agent全適配方向中,這就意味著私有化和混合模型推理為主的時代到來了。但是OpenAI對于開源的態度,眾所周知。

尤其是在年初,當DeepSeek-R1憑借著超低的訓練成本和性能媲美o1精彩亮相時,無疑是給了OpenAI一記響亮的耳光,而DeepSeek的全方位、無死角開源,像是又給了OpenAI再一記更響亮的耳光。

之后,這兩記耳光不僅打得OpenAI黯然失色,還亂了它的陣腳和節奏,模型命名混亂、功能創新不足、嘗試開源但態度曖昧不明,再加上內部人員高頻流失,等等,無疑正在讓它慢慢失去競爭優勢,再不復一年之前被視為通往AGI的正確的、領先的道路引領者角色……

而官方也說了,此次發布的GPT4.1系列、o3,以及o4-mini是GPT-5正式發布前的最后一次模型發布了,也被視為GPT-5時刻的關鍵一步,可以理解為是GPT-5的前菜,主打“量大管飽”。但是,在技術的攀登道路上,量變能夠引起質變并非唯一真理,更何況,這個量還遠遠不足。

“GPT-5應該是多個GPT4.1組成的吧。”一位業內人士這樣戲謔道,一直傳GPT-5或將在5月發布,到底OpenAI還能不能重回巔峰,只有到時候揭曉了。

本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4248481.html?f=wyxwapp

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
一覺醒來,中國斯諾克1勝2負!00后德比創紀錄,周躍龍被轟5破百

一覺醒來,中國斯諾克1勝2負!00后德比創紀錄,周躍龍被轟5破百

劉姚堯的文字城堡
2025-04-24 06:32:29
女人真是被激素控制的生物嗎?網友:本人六十歲每月不低于五十次

女人真是被激素控制的生物嗎?網友:本人六十歲每月不低于五十次

娛樂圈人物大賞
2025-04-22 00:15:07
阿斯報:赫羅納或成為本世紀第五支參加歐冠卻聯賽降級的球隊

阿斯報:赫羅納或成為本世紀第五支參加歐冠卻聯賽降級的球隊

雷速體育
2025-04-24 13:45:03
小米su7男友曝光聊天記錄! 內容揪心又冷漠,原來一切都有跡可循

小米su7男友曝光聊天記錄! 內容揪心又冷漠,原來一切都有跡可循

天行艦
2025-04-25 00:06:34
“曬太陽補鈣”錯了?醫生強調:過了65歲,補鈣要盡量做到這2點

“曬太陽補鈣”錯了?醫生強調:過了65歲,補鈣要盡量做到這2點

艾米手工作品
2025-04-19 03:33:53
查索夫亞爾失守!全城守軍被殲,司令部全員投降,防線崩潰

查索夫亞爾失守!全城守軍被殲,司令部全員投降,防線崩潰

憶丹傾城
2024-11-30 18:44:24
導彈兵王王忠心,兩次退伍被召回,妻子笑他:只長胡子,不長職務

導彈兵王王忠心,兩次退伍被召回,妻子笑他:只長胡子,不長職務

以絕望揮劍
2025-04-23 19:31:28
史無前例,特朗普對4國揮出重拳,不到48小時,王毅接到兩通電話

史無前例,特朗普對4國揮出重拳,不到48小時,王毅接到兩通電話

愛意隨風起呀
2025-04-25 03:34:01
隨著尤文0-1爆冷,拉齊奧2-0,佛羅倫薩2-1,意甲最新積分榜出爐

隨著尤文0-1爆冷,拉齊奧2-0,佛羅倫薩2-1,意甲最新積分榜出爐

球場沒跑道
2025-04-24 09:48:29
正式退役,約基奇和利拉德的前隊友在NBA征戰11個賽季后宣布退役

正式退役,約基奇和利拉德的前隊友在NBA征戰11個賽季后宣布退役

好火子
2025-04-25 05:13:15
員工在公司猝死?猿輔導相關人士稱正與家屬溝通 公司武漢地區仍在招人,招聘信息強調“雙休”

員工在公司猝死?猿輔導相關人士稱正與家屬溝通 公司武漢地區仍在招人,招聘信息強調“雙休”

每日經濟新聞
2025-04-25 01:05:07
三觀炸裂!奧運冠軍公開炮轟76歲恩師:披著羊皮的狼,逼我吃藥!

三觀炸裂!奧運冠軍公開炮轟76歲恩師:披著羊皮的狼,逼我吃藥!

拳擊時空
2025-03-25 06:48:33
非必要不做CT!近百萬人數據,每多做一次CT,患這種癌風險高43%

非必要不做CT!近百萬人數據,每多做一次CT,患這種癌風險高43%

歷史阿務
2025-01-14 12:35:18
劉國梁卸任24小時,市體育局官宣樊振東歸隊喜訊,球迷們拍手叫好

劉國梁卸任24小時,市體育局官宣樊振東歸隊喜訊,球迷們拍手叫好

二哥聊球
2025-04-24 16:16:16
中國展示非核氫彈,是一場別有用心的烏龍,連美國人也許都被騙了

中國展示非核氫彈,是一場別有用心的烏龍,連美國人也許都被騙了

君明觀世界
2025-04-25 01:05:07
追隨蔣介石6年的郝柏村晚年稱:蔣最大錯誤,就是接受雅爾塔協定

追隨蔣介石6年的郝柏村晚年稱:蔣最大錯誤,就是接受雅爾塔協定

我是斌哥哥
2024-04-06 10:46:20
丈夫不愿同房,我實在忍不了去找公公訴苦,他的一個動作讓我愣了

丈夫不愿同房,我實在忍不了去找公公訴苦,他的一個動作讓我愣了

紅豆講堂
2025-04-23 10:55:06
特朗普剛要對中國下重手,卻在大連造船廠內,發現不同尋常的一幕

特朗普剛要對中國下重手,卻在大連造船廠內,發現不同尋常的一幕

章幃戶外
2025-04-24 19:33:10
當今貶值最嚴重的是:剩女、大學生和門面

當今貶值最嚴重的是:剩女、大學生和門面

小宇宙雙色球
2025-04-22 11:06:46
中青報:農村老人自殺現象,已經到了觸目驚心的地步!

中青報:農村老人自殺現象,已經到了觸目驚心的地步!

尚曦讀史
2024-11-23 21:35:02
2025-04-25 05:51:00
虎嗅APP incentive-icons
虎嗅APP
個性化商業資訊與觀點交流平臺
23991文章數 686072關注度
往期回顧 全部

科技要聞

3.99萬"白菜價",人形機器人半馬亞軍爆單

頭條要聞

太空全家福來了 神十九、神二十航天員拍下天宮合影

頭條要聞

太空全家福來了 神十九、神二十航天員拍下天宮合影

體育要聞

拒當黑八倒霉蛋!廣廈又站到了遼寧面前

娛樂要聞

黃曉明生二胎!葉柯產女住上海高級醫院

財經要聞

特朗普考慮對華關稅分級方案

汽車要聞

純電CLA L及Vision V概念車 奔馳這次玩大了

態度原創

家居
旅游
親子
本地
房產

家居要聞

開放空間 滿足功能需求

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

親子要聞

“懷孕同事想讓我每天幫她打飯”上熱搜:遠離你身邊的巨嬰思維者

本地新聞

云游湖北 | 漢川文旅新體驗:千年陶藝邂逅湖光

房產要聞

灣區最美徒步掀起打卡潮!這座世界莊園,解鎖當代美好生活新密碼!

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 镇安县| 侯马市| 涟源市| 崇明县| 长沙市| 安吉县| 威远县| 天长市| 类乌齐县| 托克托县| 漳浦县| 册亨县| 镇康县| 镇宁| 泰来县| 三门峡市| 海南省| 定兴县| 峨边| 徐闻县| 翁源县| 津市市| 恩施市| 平顶山市| 沙坪坝区| 台山市| 池州市| 蓬莱市| 利辛县| SHOW| 宕昌县| 江油市| 来凤县| 凉城县| 都安| 宜川县| 平江县| 宁城县| 鹤庆县| 桂东县| 海宁市|