99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

OpenAI并未讓DeepSeek驚出一身冷汗

0
分享至


出品 | 虎嗅科技組

作者 | 房曉楠

編輯 | 苗正卿

頭圖 | 視覺中國

“OpenAI的創新好像到瓶頸期了。”一位業界人士這樣說道。

今日凌晨,預熱了很久的OpenAI o3模型完整版終于面世,且與以往直播“擠牙膏”式的依次、慢吞發布方式不同的是,這次o3和o4-mini是同時發布。

在OpenAI官方的陳述中,o3和o4-mini的亮點主要在于可以組合調用ChatGPT中的各個工具,像是網絡搜索、Python、圖像分析、文件解釋和圖像生成等。這可以看作是OpenAI開始后發補足自身在Agent能力上的探索。

其中,o3作為推理模型,在編程、數學、科學、視覺感知等多個維度的基準測試中都刷新了紀錄。比如在Codeforces、SWE-bench、MMMU基準測試中,視覺任務準確率高達87.5%,而MathVista達到75.4%。

其實分數、榜單,這些都是常規操作。相較于以往,這次的最大不同在于,o3和o4-mini將上傳的圖像直接集中到思維鏈中,這就意味著,圖像不僅僅是被看到,還能被用來作為思考過程中的一部分。

從OpenAI團隊成員、中科大校友Jiahui Yu發布的帖文來看,“用圖像思考”應該是OpenAI去年9月發布o系列模型以來,就在研發計劃中,之前還悄悄推出了o1 Vision并進行了初步預覽,但并沒有取得很好的效果,也沒有引起關注,直到這次在o3和o4-mini上實現了這一能力。

根據外部專家評估,o3作為o1系列模型的繼任者,其在復雜問題上的錯誤率要比后者低20%,適合在生物學、數學和工程領域的復雜問題查詢。

針對這一點,國外一位醫學博士在測評后發帖表示,這一點確實有很大進步,當他向o3來提問一些頗具挑戰性的臨床或醫學問題時,回答精準、全面,符合對一位該領域真正專家的期望。

對于那些想親自測評、體驗的用戶來說,OpenAI官方已經表示,目前ChatGPT的Plus、Pro會員以及Team用戶,即日起就可以直接體驗o3、o4-mini,以及o4-mini-high,而之前的o1、o3-mini和o3-mini-high已默默退出舞臺。這一操作也被有些網友戲稱為“內部賽馬”,新的產品出來后,之前的通通讓路。

到目前為止,之前預告要發布的GPT?4.1全家桶系列、o3、o4-mini模型就已經全部亮相展示了。據Sam Altman表示,o3和o4-mini可能是ChatGPT在GPT-5發布之前的最后獨立AI推理模型了,期間大概率是不會再有其他新款模型出來了,另外他也說了,預計將在幾周內將o3-pro升級到專業版。

在OpenAI官方的宣傳口徑中,o3和o4-mini是OpenAI所有模型中最為強大、智能的模型,一些開發者、用戶在使用時,也感受到了進步。但是,創新能力似乎并沒有達到預期。

“OpenAI的步調已經不再挺胸闊步了,更不知所措。”在看完OpenAI這次發布的新品后,一位業內人士這樣感嘆道。

雖然o3、o4-mini模型作為新產品,效果不錯,但相較于OpenAI以往的激進和高舉旗幟式前進,如今在創新上面呈現出明顯的心有余而力不足。

其實前兩天在GPT4.1系列套餐發布后,不少業內人士就向虎嗅表示,“暫時還沒看到有什么特別亮眼的突破。”“對o3期待值沒有那么高。”

或者這種“失望”要來得更早一點。

去年12月,o3在OpenAI的系列直播尾聲亮相,Sam Altman稱其為“一個非常、非常聰明的模型”,完全將O1甩在身后,更是在ARC-AGI測試這一旨在評估AI系統適應新任務和展示流動智力能力的測試中,獲得87.5%的成績,也是首次超越人類平均水平(85%),令業界感到震驚,被認為是在通往AGI的道路上迎來了新突破。但在業界開發者看來,似乎并不是這樣。

“這就好比高考成績不能代表工作業務能力。”一位開源領域人士銳評道。而且,如今的行業趨勢已經進入到對數據高要求、對Agent全適配方向中,這就意味著私有化和混合模型推理為主的時代到來了。但是OpenAI對于開源的態度,眾所周知。

尤其是在年初,當DeepSeek-R1憑借著超低的訓練成本和性能媲美o1精彩亮相時,無疑是給了OpenAI一記響亮的耳光,而DeepSeek的全方位、無死角開源,像是又給了OpenAI再一記更響亮的耳光。

之后,這兩記耳光不僅打得OpenAI黯然失色,還亂了它的陣腳和節奏,模型命名混亂、功能創新不足、嘗試開源但態度曖昧不明,再加上內部人員高頻流失,等等,無疑正在讓它慢慢失去競爭優勢,再不復一年之前被視為通往AGI的正確的、領先的道路引領者角色……

而官方也說了,此次發布的GPT4.1系列、o3,以及o4-mini是GPT-5正式發布前的最后一次模型發布了,也被視為GPT-5時刻的關鍵一步,可以理解為是GPT-5的前菜,主打“量大管飽”。但是,在技術的攀登道路上,量變能夠引起質變并非唯一真理,更何況,這個量還遠遠不足。

“GPT-5應該是多個GPT4.1組成的吧。”一位業內人士這樣戲謔道,一直傳GPT-5或將在5月發布,到底OpenAI還能不能重回巔峰,只有到時候揭曉了。

本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4248481.html?f=wyxwapp

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
影響隋唐兩朝歷史的“鮮卑族”,是今天的哪個民族?你絕對想不到

影響隋唐兩朝歷史的“鮮卑族”,是今天的哪個民族?你絕對想不到

掌青說歷史
2025-04-18 09:24:06
女人都是表面正經,只要你膽子大,沒有什么女人拿不下

女人都是表面正經,只要你膽子大,沒有什么女人拿不下

人間故事集
2023-11-18 21:47:38
妻子每月給岳母8000,我選擇離婚,岳母提出要求,她哭求我復婚

妻子每月給岳母8000,我選擇離婚,岳母提出要求,她哭求我復婚

燦爛夏天
2025-04-13 17:13:28
圖片報:拜仁9人位置穩固 于帕續約停滯&金玟哉科曼磁卡等都可走

圖片報:拜仁9人位置穩固 于帕續約停滯&金玟哉科曼磁卡等都可走

直播吧
2025-04-23 10:28:57
慘烈!2人傷退,1人拼到抽筋,吳驍單臂立功,廣廈險勝晉級四強

慘烈!2人傷退,1人拼到抽筋,吳驍單臂立功,廣廈險勝晉級四強

格斗一點通
2025-04-24 01:44:23
當澤連斯基離開白宮時,記者大聲質問,你為什么要對總統如此不敬

當澤連斯基離開白宮時,記者大聲質問,你為什么要對總統如此不敬

叒女紫121
2025-03-01 17:26:30
好消息:山東省這條城際鐵路正在編制可研報告!正線長100公里

好消息:山東省這條城際鐵路正在編制可研報告!正線長100公里

南粵橘城
2025-04-22 18:58:38
男子誤跟妻子閨蜜發生關系,想停止卻被示意繼續,引發一場悲劇…

男子誤跟妻子閨蜜發生關系,想停止卻被示意繼續,引發一場悲劇…

極品小牛肉
2024-02-06 16:30:30
沒人按得住向佐了!丟人丟到新加坡,絲毫不介意被網友嘲諷陽顛風

沒人按得住向佐了!丟人丟到新加坡,絲毫不介意被網友嘲諷陽顛風

聯友說娛
2025-04-21 13:49:43
突襲白宮!馬斯克深夜拋出“震撼彈”:特朗普會聽我的

突襲白宮!馬斯克深夜拋出“震撼彈”:特朗普會聽我的

智觀科技
2025-04-23 10:14:13
臺灣統一方式可能出人意料:77年前毛主席的奇謀,是最佳解決方案

臺灣統一方式可能出人意料:77年前毛主席的奇謀,是最佳解決方案

國學聚焦
2025-04-11 11:01:12
董明珠炮轟小米汽車!燒死人你們看到了吧?上海車展雷軍隱身

董明珠炮轟小米汽車!燒死人你們看到了吧?上海車展雷軍隱身

牛斯克
2025-04-23 21:52:33
盟友們為何不拉特朗普一把? 韓媒:已收到中國的警告,后果很嚴重

盟友們為何不拉特朗普一把? 韓媒:已收到中國的警告,后果很嚴重

阿紿聊社會
2025-04-24 00:07:41
驚天烏龍!中國“氫彈試爆”真相曝光,港媒標題黨翻車現場!

驚天烏龍!中國“氫彈試爆”真相曝光,港媒標題黨翻車現場!

頭條爆料007
2025-04-23 08:53:23
和女人日久生情的好方法:多聊這三個話題!

和女人日久生情的好方法:多聊這三個話題!

別人家的七七
2025-03-25 18:08:31
發動機還是美國造,算什么自主創新?C919大飛機的出現被改寫了

發動機還是美國造,算什么自主創新?C919大飛機的出現被改寫了

Hi秒懂科普
2025-04-10 11:33:06
伊萬離隊后在新東家表現漸入佳境!已直接對他委以重任,值得期待

伊萬離隊后在新東家表現漸入佳境!已直接對他委以重任,值得期待

我就愛說足球
2025-04-23 10:33:14
真仙人跳?小女友多次要求夏普“爹地”:綁起來 虐待我

真仙人跳?小女友多次要求夏普“爹地”:綁起來 虐待我

直播吧
2025-04-23 16:06:13
美軍已算好,只要開打,中國一次造50艘航母,美國還有明白人

美軍已算好,只要開打,中國一次造50艘航母,美國還有明白人

文雅筆墨
2025-03-25 19:08:00
李健被質疑缺錢了,老粉吐槽其演唱會割韭菜,1280元看個十字架!

李健被質疑缺錢了,老粉吐槽其演唱會割韭菜,1280元看個十字架!

古希臘掌管月桂的神
2025-04-23 11:28:53
2025-04-24 04:59:00
虎嗅APP incentive-icons
虎嗅APP
個性化商業資訊與觀點交流平臺
23978文章數 686065關注度
往期回顧 全部

科技要聞

馬斯克:中國用戶對FSD"最為苛刻"

頭條要聞

黃金巨震 商家:金條斷貨需預訂鎖價 工廠正連夜趕貨

頭條要聞

黃金巨震 商家:金條斷貨需預訂鎖價 工廠正連夜趕貨

體育要聞

金牌和金子,劉國梁改變國乒的這些年

娛樂要聞

于和偉領銜,央視諜戰劇要有天花板了

財經要聞

董明珠放話"海歸有間諜" 打工人破防了

汽車要聞

以經緯敘事 奇瑞瑞虎新旗艦SUV瑞虎9L快評

態度原創

本地
親子
時尚
手機
公開課

本地新聞

云游湖北 | 澴川醉古今!孝文化名城藏了多少寶藏?

親子要聞

【關注】成都代孕公司哪里有代孕機構|GTR

80年前的爆款包,今年春夏又火了

手機要聞

全球最薄折疊屏!OPPO Find N5單月銷量超2024年所有安卓大折疊同期表現

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 灌阳县| 兰溪市| 德州市| 乐昌市| 阿坝县| 四川省| 当涂县| 榆社县| 普宁市| 蚌埠市| 蒙山县| 木里| 瓦房店市| 资源县| 隆回县| 垫江县| 都江堰市| 古浪县| 华亭县| 吉隆县| 陆良县| 六盘水市| 大安市| 武邑县| 嘉善县| 沧州市| 玉屏| 泸溪县| 尉氏县| 赤峰市| 阜新| 剑河县| 汝南县| 尤溪县| 石首市| 巴里| 北安市| 轮台县| 林州市| 贵德县| 沁水县|