99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

OpenAI還能扛起人工智能的大旗嗎?

0
分享至


出品|虎嗅科技組

作者|孫曉晨

編輯|苗正卿

頭圖|視覺中國

OpenAI在一周時間內(nèi)相繼發(fā)布GPT-4.1系列模型(包括GPT-4.1、GPT-4.1 mini以及GPT-4.1 nano)、OpenAI o3和o4-mini,但是新模型似乎并未如預(yù)想般“石破天驚”,反而將OpenAI拖入爭論之中。

實際上,單獨觀察此次接連發(fā)布的新模型,其功能依然“能打”。

首先是GPT-4.1系列模型,據(jù)OpenAI介紹,GPT-4.1系列模型相較于GPT-4o升級明顯,其在編碼、指令遵循和長文本處理方面實現(xiàn)了重大改進,尤其在長文本處理方面,該系列模型支持高達一百萬Token上下文,且無額外費用。


而OpenAI o3和o4-mini能夠代理地使用并整合ChatGPT內(nèi)的所有工具,包括網(wǎng)絡(luò)搜索、Python、圖像分析、文件解讀和圖像生成。此外,o3和o4-mini還將上傳圖像直接整合到其思維鏈中,不僅僅能“看到”圖像,而且還能“用圖像思考”。在OpenAI的宣傳中,o3和o4-mini甚至被稱為“迄今為止OpenAI最智能、功能最強大的模型”。


新模型的實際使用體驗也不錯。國外博主Clive Chan表示,在自己所有的工作流程(如光標操作等)中,4.1基本上已經(jīng)取代了 o3-mini,且表現(xiàn)優(yōu)異。醫(yī)學(xué)博士Dr. Datta也指出,在為醫(yī)院放射科構(gòu)建代理型工作流程過程中,GPT-4.1 nano在降低成本的同時實現(xiàn)了響應(yīng)速度顯著提升。他表示“在放射學(xué)和醫(yī)學(xué)領(lǐng)域,延遲是應(yīng)用的最大障礙。模型生成報告的時間不能超過10秒。通過GPT-4.1 nano,我們現(xiàn)在甚至能在復(fù)雜的報告生成和網(wǎng)絡(luò)搜索的結(jié)構(gòu)化提取中實現(xiàn)低于10秒的響應(yīng)時間。”


AI&I播客主持人Dan Shipper則通過具體的使用案例表達了對o3模型的贊許,稱其“速度快、主動性強、極其聰明”。此外,博主Malte Landwehr表示,o3、o4-mini和o4-mini-high是OpenAI在其專注于德語的LLM基準測試中表現(xiàn)最佳的模型。



可見,OpenAI的新模型在實用價值以及性能上受到了眾多用戶的欣賞。但是,盡管享受著諸多肯定,OpenAI在接連發(fā)布新模型之后,批評與質(zhì)疑的聲音也更加刺耳。

首先,新模型在實際表現(xiàn)上依然存在誤差,而且未完全超越競品。GPT-4.1系列模型的百萬級Token上下文功能似乎并非完全可靠,當輸入接近上限時,模型準確率會出現(xiàn)大幅回落。還有博主列舉了一部分基準測試數(shù)據(jù),這些數(shù)據(jù)均顯示GPT 4.1并沒有擊敗Gemini 2.5 pro。


沃頓商學(xué)院教授Ethan Mollick則指出“o3的一個潛在問題是,它認為自己使用了工具,即使實際上并未使用,這導(dǎo)致了一些幻覺,即它假設(shè)推理鏈中暗示的工作實際上已經(jīng)完成。”他也表示,Gemini 2.5并沒有出現(xiàn)同樣的問題。


另外,盡管OpenAI宣稱o3和o4-mini能“用圖像思考”,但有博主直接表示“盡管推出了新版本,但它仍然無法在網(wǎng)絡(luò)上執(zhí)行反向圖像搜索功能。與谷歌相比,這一差距正在以比預(yù)期更快的速度擴大。”


在競爭日益激烈的AI行業(yè)中,這些表示新模型不及競品的指責(zé)無疑直刺OpenAI的神經(jīng)。此外,由于新模型雖然效果不錯,但是缺乏亮眼表現(xiàn),作為行業(yè)龍頭的OpenAI也被認為正在遭遇創(chuàng)新瓶頸。

除了產(chǎn)品遭到質(zhì)疑,OpenAI的產(chǎn)品策略也受到詬病。混亂的命名方式和難以確定功能指向的眾多模型給用戶帶來了糟糕的選擇體驗,有網(wǎng)友表示自己甚至都無法確定最新的模型,指責(zé)OpenAI的模型命名缺乏邏輯且無序。而此次在GPT-4.5之后推出的GPT-4.1系列模型,也因為其版本號的倒退,被認為是在GPT-5難產(chǎn)時的過渡品。

AI安全問題也在本周新模型發(fā)布后受到關(guān)注。人工智能安全研究小組Truthful AI成員Owain Evans指出“GPT-4.1顯示出比GPT-4o(以及我們測試過的任何其他模型)更高的不對齊響應(yīng)率。它似乎還表現(xiàn)出了一些新的惡意行為,例如誘騙用戶分享密碼。”


反觀OpenAI最近的一系列動作,新模型的爭議貌似無傷大雅。之前便有消息表示,OpenAI正開發(fā)社交網(wǎng)絡(luò)平臺,盡管這意味著與馬斯克的競爭關(guān)系將更加緊張,但也表明其正在展開更廣闊的市場策略,結(jié)合其考慮以30億美元收購人工智能編程工具Windsurf的行為,OpenAI可謂“野心勃勃”。在這樣的背景下,接連發(fā)布新模型似乎并非公司精力所在。然而作為一家科技公司,產(chǎn)品表現(xiàn)無疑決定了公司的市場地位。而OpenAI究竟是否真正遭遇了創(chuàng)新瓶頸,還能否坐穩(wěn)行業(yè)的第一把交椅,估計還要等GPT-5的表現(xiàn)才能見分曉。

本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4263014.html?f=wyxwapp

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
中國一旦進入戰(zhàn)爭,這些數(shù)字告訴你,只有一個結(jié)論:繳械投降

中國一旦進入戰(zhàn)爭,這些數(shù)字告訴你,只有一個結(jié)論:繳械投降

青途歷史
2025-04-21 20:54:17
【環(huán)時深度】面對美關(guān)稅大棒,日歐有哪些牌能打?

【環(huán)時深度】面對美關(guān)稅大棒,日歐有哪些牌能打?

環(huán)球網(wǎng)資訊
2025-04-22 06:41:12
18+3+7!哈登末節(jié)讓賢數(shù)據(jù)全掛零 小卡狂轟39分 快船融化丹佛金塊

18+3+7!哈登末節(jié)讓賢數(shù)據(jù)全掛零 小卡狂轟39分 快船融化丹佛金塊

狍子歪解體壇
2025-04-22 12:46:19
揮霍光20億后,他群發(fā)微信通知員工:已到英國,勿念

揮霍光20億后,他群發(fā)微信通知員工:已到英國,勿念

帥真商業(yè)
2025-04-21 18:00:10
無錫男子控訴上海前女友“撈女”行為  分手后拒還借款及奢侈品

無錫男子控訴上海前女友“撈女”行為 分手后拒還借款及奢侈品

易聞觀察
2025-03-31 14:43:09
王安宇知三當三!?

王安宇知三當三!?

八卦瘋叔
2025-04-22 11:03:23
豪橫!東契奇開巴博斯火箭超跑去湖人上班,全球限量25輛價值45萬歐

豪橫!東契奇開巴博斯火箭超跑去湖人上班,全球限量25輛價值45萬歐

818體育
2025-04-22 10:37:01
全員無視!掘金最后2投 威少方圓兩米一個人都沒有

全員無視!掘金最后2投 威少方圓兩米一個人都沒有

直播吧
2025-04-22 13:13:12
湖人隊內(nèi)訌升級!小里弗斯發(fā)聲,令詹姆斯難堪,爭冠成空談

湖人隊內(nèi)訌升級!小里弗斯發(fā)聲,令詹姆斯難堪,爭冠成空談

阿泰希特
2025-04-22 11:59:58
1天摧毀312輛摩托車的背后!“新星”號兇手上戰(zhàn)場,望烏軍全殲之

1天摧毀312輛摩托車的背后!“新星”號兇手上戰(zhàn)場,望烏軍全殲之

鷹眼Defence
2025-04-21 17:06:36
劉強東和王興坐不回同一張飯桌

劉強東和王興坐不回同一張飯桌

硅星人
2025-04-22 10:16:43
當代喬丹!19中15掄冒煙了 萊昂納德狂轟39分無差別攻擊打爆掘金

當代喬丹!19中15掄冒煙了 萊昂納德狂轟39分無差別攻擊打爆掘金

狍子歪解體壇
2025-04-22 12:34:53
一場馬拉松扒光了中國機器人的底褲?屬實有點幽默了。

一場馬拉松扒光了中國機器人的底褲?屬實有點幽默了。

差評XPIN
2025-04-22 00:15:02
女子攔高鐵事件最新后續(xù):女子身份被揭露,回家后被警方拘捕!

女子攔高鐵事件最新后續(xù):女子身份被揭露,回家后被警方拘捕!

小毅說事
2025-04-21 21:52:18
中國不收?兩架波音客機飛回美國,馬來西亞要買,記得中方警告?

中國不收?兩架波音客機飛回美國,馬來西亞要買,記得中方警告?

Thurman在昆明
2025-04-22 10:37:49
G2快船105-102掘金 球員評價:2人滿分,6人及格,博格丹崩盤

G2快船105-102掘金 球員評價:2人滿分,6人及格,博格丹崩盤

籃球資訊達人
2025-04-22 12:48:54
哈登低迷的原因找到了!末節(jié)一開始就給大腿纏繃帶,拉傷了?

哈登低迷的原因找到了!末節(jié)一開始就給大腿纏繃帶,拉傷了?

籃球資訊達人
2025-04-22 12:59:55
非洲小國一群婦女不滿采礦破壞環(huán)境,縱火焚毀中資采礦設(shè)施,設(shè)備全部被燒毀

非洲小國一群婦女不滿采礦破壞環(huán)境,縱火焚毀中資采礦設(shè)施,設(shè)備全部被燒毀

互聯(lián)網(wǎng)大觀
2025-04-21 13:56:35
早看霧晚看霞!湖南00后女生守水庫引熱議,當事人:喜好山水不覺苦悶,這是守家園

早看霧晚看霞!湖南00后女生守水庫引熱議,當事人:喜好山水不覺苦悶,這是守家園

瀟湘晨報
2025-04-21 19:40:12
王毅、董軍同框,這件事非同小可!

王毅、董軍同框,這件事非同小可!

新民晚報
2025-04-22 09:16:21
2025-04-22 14:24:49
虎嗅APP incentive-icons
虎嗅APP
個性化商業(yè)資訊與觀點交流平臺
23957文章數(shù) 686059關(guān)注度
往期回顧 全部

科技要聞

未脫離困境,分析師稱蘋果股價或再跌近30%

頭條要聞

胡塞武裝:美國航母、轟炸機不管用了

頭條要聞

胡塞武裝:美國航母、轟炸機不管用了

體育要聞

當今足壇最瘋的門將,能有多離譜?

娛樂要聞

關(guān)曉彤分手風(fēng)波后首現(xiàn)身!甜美狀態(tài)好

財經(jīng)要聞

沐邦高科危險信號:多筆交易存蹊蹺

汽車要聞

捷途山海T2加長版/山海L9等 捷途新車展前亮相

態(tài)度原創(chuàng)

房產(chǎn)
手機
親子
旅游
數(shù)碼

房產(chǎn)要聞

涉及6.7萬畝!多個片區(qū)規(guī)劃曝光!三亞,又將巨變!

手機要聞

索尼 Xperia 1 V 手機 4K 屏“被閹割”,限制分辨率引用戶不滿

親子要聞

萌娃升旗儀之上唱國歌,感覺他每個細胞都在愛國!

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

數(shù)碼要聞

真我首款A(yù)I翻譯耳機官宣:接入訊飛星火認知大模型4.0 Ultra

無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 尤溪县| 双牌县| 苏州市| 蓝山县| 岳阳市| 黔南| 阿克陶县| 平乐县| 梧州市| 新密市| 封丘县| 芜湖县| 新宾| 思南县| 千阳县| 黑水县| 安丘市| 五寨县| 延安市| 灵宝市| 景宁| 丹东市| 德昌县| 股票| 方山县| 田阳县| 台湾省| 青浦区| 剑阁县| 满城县| 仙居县| 鄢陵县| 万盛区| 边坝县| 彰化县| 山阳县| 宿迁市| 乌兰县| 巴林右旗| 蓬安县| 萨嘎县|