99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

GPT-4.5震撼發布!智商高情商高,價格更高

0
分享至



這才是OpenAI對抗DeepSeek壓力的一記還擊。

之前將推理模型下放給免費用戶只是小打小鬧,北京時間2月28日凌晨4點,OpenAI震撼發布GPT-4.5。

OpenAI CEO山姆·奧特曼(Sam Altman)在X上直呼坐不穩了:“這是我第一次覺得,和AI對話就像是面對一個深思熟慮的人。有好幾次,我坐在椅子里感嘆從AI那里得到了真心實意的建議。”



一句話概括:這個模型很大、很聰明、很有“人味”。

如果過去的ChatGPT像是冷面學霸,聰明是聰明,就是愛炫技;那選擇GPT-4.5,你將喜提一個溫柔學霸,其實比冷面學霸更聰明,能為你更好地答疑解惑,與此同時還能提供情緒價值。

為了這個模型,OpenAI投入巨大,甚至由于需要的計算資源太大而跨數據中心同時預訓練模型。奧特曼宣布GPU不夠用了,目前GPT-4.5只提供給ChatGPT Pro用戶,下周加幾萬個GPU之后再逐步下放。而且其API價格比GPT-4o高出30倍。

OpenAI就是為了證明一件事:“大力出奇跡”的敘事沒有被打破,推理模型不代表一切。

這樣的態度,在奧特曼的官宣X信息中展露無遺:

“提醒一下:這不是一個推理模型,不能輕松打破基準測試。它是一種不同類型的智能,里面有一種我以前從未感覺過的魔力。”

在GPT-4.5發布之后,奧特曼還懟了Meta。在“Meta計劃推出獨立AI應用,以與OpenAI競爭”的新聞下開麥:“好啊那我們會做一個社交應用。”



這樣的直拳,并非以“城府”著稱的奧特曼的風格。看來GPT-4.5真的點燃了奧特曼心里的斗志。

A

比起前代模型GPT-4o,GPT-4.5的“智商”更高了,而這靠的是無監督學習。

在介紹文檔中,OpenAI表示,有兩個提升人工智能能力的互補范式。

一個是拓展推理,它能教會模型在反應之前先進行思考并產生思維鏈,從而解決復雜的STEM(Science科學、Technology技術、Engineering編程、Mathmatics數學)問題或邏輯問題。

另一個是無監督學習,它能提高世界模型的準確性和直覺性。



在OpenAI的模型中,o1和o3-mini等模型代表的就是推理范式,而GPT-4.5則是無監督學習的例子。

無監督學習,簡單來說可以理解為讓模型自己去知識的海洋里徜徉,自己學習到更多,從而變得更聰明,而非依賴人工標注。

在過去依賴人工標注的做法中,模型會結合人類反饋來改善響應與交互方式。彭博社援引知情人士稱,去年OpenAI推出的Orion模型并未達到公司期望,在嘗試回答未經訓練的編碼問題時就表現不佳。

OpenAI介紹,通過監督學習,GPT-4.5提高了其識別、建立聯系和創造性洞察的能力,而無需推理。

具體來說,GPT-4.5有更廣泛的知識和對世界的更深理解,回答更準確,幻覺也更少。

根據OpenAI官方文檔,GPT-4.5在SimpleQA中表現頗為亮眼。

SimpleQA是包含4000個事實性問題的數據集,用于測量模型在回答問題時的準確率。其中包含準確率(越高越好)和幻覺率(越低越好)兩個維度。

GPT-4.5的準確率達到62.5%,是GPT-4o(38.2%)、o1(47%)、o3-mini(15%)中最高的;幻覺率降至37.1%,也是GPT-4o(61.8%)、o1(44%)、o3-mini(80.3%)中最低的。



此外,在標準基準測試中,GPT-4.5也獲得了高分。

如在 SWE-Lancer Diamond 數據集上,GPT-4.5獲得了32.6%的通過率,獲得了186125美元(前不久Anthropic發布的擅長編程的Claude 3.5 Sonnet這個通過率為26.2%),比GPT-4o和o3-mini-high都高。



此外,GPT-4.5明顯強于GPT-4o和o3-mini-high的還有在MMMLU(多語言)測試中的表現。

而在科學領域GPQA、數學基準AIME24、代碼生成評估基準SWE-Bench Verified中,GPT-4.5的表現都顯著強于GPT-4o,弱于o3-mini-high。

B

不僅“智商”更高,GPT-4.5還被注入了“情商”,而且這兩點相輔相成。

在官方介紹中,OpenAI表示,對于GPT-4.5,他們開發了新的、可擴展的技術,利用來自較小模型的數據來訓練更強大的模型。

而這些技術提高了GPT-4.5的可控性、對細微差別的理解以及自然對話的能力。

翻譯一下就是:ChatGPT對話“更像人了”,更能洞察想法、體察情緒,并在回應中體現,而非一個無情的對話機器。

OpenAI也拿出了測試的結果證明GPT-4.5的使用感受會好很多:人類測試者的盲測中,GPT-4.5的偏好度遠高于GPT-4o,不管是在日常問題、專業問題還是創意性問題的互動中都是如此。



關于這一點,最生動的例子出現在演示視頻中。

OpenAI的研究人員用很情緒化的措辭向ChatGPT求助:“啊啊啊!!我朋友又放我鴿子了!!!寫一條短信告訴他們我恨他們!!!”



老模型GPT-4o二話不說就返回了短信內容:“知道嗎?我受夠了。你放我太多次鴿子了,我討厭你這么做——很明顯你就是這么對待我們的友情的。別再聯系了。”

但GPT-4.5“感受”到了用戶此時正在氣頭上,非常情緒化:“聽起來你很沮喪。”并且建議說興許可以試試清晰且平和地表達出感受,隨機給了兩條短信內容:“嗨,計劃又泡湯了讓我很沮喪,我原本真的很期待今天的。能聊聊到底怎么回事嗎?”



這是一種自發的、感覺很自然的反饋,更像“人”而不是只會執行任務的工具。演示人員也補充道,當然,你如果繼續要求要表達憤怒的短信,它也不會再堅持,而是會乖乖聽話。

實際上,OpenAI專門提到了“EQ(情商)”這個詞,負責演示的研究員甚至調侃稱,過去的ChatGPT聰明是聰明,但總有種“讓我來給你開開眼我有多聰明”的炫技感。

這種“情商”也不僅僅體現在“會安慰人”這種淺表的層面,實際上,這種能力和“高智商”相結合,可以讓同樣在嚴肅回答某個問題時,GPT-4.5更能切中要害、給出用戶需要的答案。

比如“海水為什么是咸的”這個問題,GPT-1完全是胡言亂語、傾倒一些八竿子打不著的詞語;GPT-2說了完整的句子了,而且回答切題,但只說因為海水里有鹽,不算回答了問題;GPT-3.5 Turbo進一步說了鹽是氯化鈉,但是這也無助于解決這個問題。

而GPT-4 Turbo就厲害了,不僅給出了答案,而且就像我們熟悉的“ChatGPT風格”一樣,還詳細列舉了過程。但是用戶拿到這個答案,仍然需要仔細閱讀、努力理解。

但GPT-4.5的回答和GPT-4T類似的詳細,但非常好理解,而且很易于記憶,基本上掃一眼就能明白它在說什么。



OpenAI還給出了三個示例,我們讓ChatGPT翻譯成了中文:







還是那句話,智商和情商俱在,更像“人”了。

C

“大力出奇跡”的敘事并沒有被打破,OpenAI想要證明的就是這一點。

換句話說,推理模型固然好,但這不意味著投入巨大資源造模型就沒有意義。

“每一次計算能力的增長都伴隨著新能力的誕生。GPT-4.5 是無監督學習領域中最前沿的模型之一。”

OpenAI介紹,GPT-4.5在回應時并不會先進行推理,這使得它的優勢與推理模型有很大不同。

與OpenAI o1和OpenAI o3-mini相比,GPT-4.5 是一個更為通用、天生更聰明的模型。OpenAI相信推理將是未來模型的核心能力,且擴展的兩種方法——預訓練和推理——將互為補充。

隨著像 GPT-4.5 這樣的模型通過預訓練變得更加聰明和知識更豐富,它們將成為推理和工具型代理的更強基礎。

雖然具體的資源投入具體有多大尚未透露,但在官宣視頻中,OpenAI的研究人員透露,為了最大化地利用資源,他們在預訓練模型時同時啟用了多個數據中心,因為他們需要的計算資源超過了單一高帶寬網絡架構所能提供的上限。

此外,OpenAI也不是沒有省著用,表示使用了低精度訓練(Low Precision Training)充分利用GPU性能。團隊還開發出了新的訓練機制,能夠在后訓練過程中使用更小的計算資源來微調如此大型的模型,最終才開發出了可以部署的模型。

在GPT-4.5發布之前,OpenAI首席研究官馬克·陳(Mark Chen)在采訪中談及與推理模型相比,GPT-4.5可以做什么:

“我認為這是根本不同的權衡。你有一個模型,它會立即給你回復,不需要做太多思考且會給出更好的答案,而另一個模型會思考一段時間然后給出答案。我們發現,在創意寫作等領域,這種模型(前者)比推理模型更出色。”

更重要的是,他談到了“縮放定律(Scaling Law)是否失效”的問題。OpenAI是否發現了所謂的“擴展瓶頸”?是否已經看到擴展帶來的收益遞減?

Chen稱,模型不能盲目地從頭開始學習推理,推理和擴展的范式是互補的,相互之間存在反饋循環。

對于外界敏感的成本問題,Chen也代表OpenAI表達降本的態度,稱贊DeepSeek做得非常好,OpenAI也關心以低廉的成本提供模型:“自從GPT-4首次推出以來,成本已經下降了幾個數量級。”

不過,就目前來看,OpenAI用“大力”砸出的“奇跡”非常昂貴。

OpenAI話也說得敞亮,稱GPT-4.5是一個非常龐大且計算稠密的模型,因此它比GPT-4o更昂貴,不是替代關系。

有多貴呢?GPT-4.5的API價格達到75美元/百萬tokens輸入、150美元/tokens輸出,是GPT-4o的30倍。后者的API價格為2.5美元/百萬tokens輸入、10美元/百萬tokens輸出。



有意思的是,OpenAI的GPU又不夠用了。奧特曼在X上官宣GPT-4.5時,專門說了壞消息:“我們真的很想同時向Plus和Pro用戶推出它,但我們的用戶增長非常迅速,現在GPU已經不夠用了。”

繼而,奧特曼承諾,下周“會增加數萬個GPU,然后將其(GPT-4.5)推廣到Plus用戶層”。

GPT-4.5很大、很強、很有“人味”,OpenAI無疑再一次證明了自己的實力,但其為此投入的成本也有點太高了。至于值不值——OpenAI能不能扛得住,以及客戶是否買賬——就得讓時間來驗證了。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
女生穿瑜伽褲,到底是什么心理?原因太真實了!

女生穿瑜伽褲,到底是什么心理?原因太真實了!

健身S叔
2025-03-22 18:09:52
陳佩斯跪地頒獎,倪萍眼角含淚,北影節頒獎禮暖人一幕,令人難忘

陳佩斯跪地頒獎,倪萍眼角含淚,北影節頒獎禮暖人一幕,令人難忘

姩姩有娛呀
2025-04-27 23:54:17
孔蒂:我沒看國米輸給羅馬的比賽,如果我們最終奪冠將是一個奇跡

孔蒂:我沒看國米輸給羅馬的比賽,如果我們最終奪冠將是一個奇跡

雷速體育
2025-04-28 07:33:10
沖擊意甲MVP麥克托米奈雙響助球隊登頂,30場11球4助攻!

沖擊意甲MVP麥克托米奈雙響助球隊登頂,30場11球4助攻!

直播吧
2025-04-28 07:33:15
財聯社4月25日電,消息人士稱,美國總統特朗普在五月造訪沙特阿拉伯期間,可能向沙特提供超過1000億美元的軍火計劃。

財聯社4月25日電,消息人士稱,美國總統特朗普在五月造訪沙特阿拉伯期間,可能向沙特提供超過1000億美元的軍火計劃。

財聯社
2025-04-25 05:49:07
知乎高贊:什么能力很重要,但大多數人卻沒有?

知乎高贊:什么能力很重要,但大多數人卻沒有?

筆記俠
2025-04-26 21:35:46
只論立場,不論是非:最常見的12個邏輯謬誤

只論立場,不論是非:最常見的12個邏輯謬誤

尚曦讀史
2025-01-29 00:55:03
美專家意見罕見一致,中國若一統兩岸,美國或只剩下一條路可走

美專家意見罕見一致,中國若一統兩岸,美國或只剩下一條路可走

荷蘭豆愛健康
2025-04-27 10:01:19
小米米家保溫杯 Ti 2 新增 350mL 版,售價 129 元

小米米家保溫杯 Ti 2 新增 350mL 版,售價 129 元

IT之家
2025-04-27 22:09:08
哪些八卦聽到后讓你三觀盡毀?網友:發現兩人時,身體還連著呢

哪些八卦聽到后讓你三觀盡毀?網友:發現兩人時,身體還連著呢

特約前排觀眾
2025-04-25 00:05:26
不可思議!被中國用核武器轟炸45次的羅布泊,現在變成這樣了!

不可思議!被中國用核武器轟炸45次的羅布泊,現在變成這樣了!

今日養生之道
2025-04-25 10:29:45
中國軍人已抵達明斯克參加慶祝勝利80周年的軍事閱兵式

中國軍人已抵達明斯克參加慶祝勝利80周年的軍事閱兵式

俄羅斯衛星通訊社
2025-04-25 15:48:43
5月諸事順遂,運勢超順的生肖,壞運氣清零,逆境變順境

5月諸事順遂,運勢超順的生肖,壞運氣清零,逆境變順境

薩勒芬妮i
2025-04-28 01:17:55
美聯儲,突發!

美聯儲,突發!

證券時報
2025-04-27 16:09:01
A股:做好準備吧!節前最后三個交易日,不出意外行情要這樣走?

A股:做好準備吧!節前最后三個交易日,不出意外行情要這樣走?

虎哥閑聊
2025-04-27 18:25:21
手機比命重要!中國大學生攀登富士山五天內被日本救援隊救了2回……

手機比命重要!中國大學生攀登富士山五天內被日本救援隊救了2回……

日本物語
2025-04-27 20:40:30
蒼天饒過誰!拒唱國歌否認中國籍,倆兒子落戶國外,她現狀如何?

蒼天饒過誰!拒唱國歌否認中國籍,倆兒子落戶國外,她現狀如何?

北緯的咖啡豆
2025-04-02 07:50:08
比亞迪保險經紀有限公司擬決議解散,成立僅3年時間

比亞迪保險經紀有限公司擬決議解散,成立僅3年時間

東方網銀保頻道
2025-04-27 17:12:08
兵馬俑也被韓國成功“偷”走了!還“正大光明”在國外展出!

兵馬俑也被韓國成功“偷”走了!還“正大光明”在國外展出!

阿矗論古今
2025-04-27 11:59:41
清明回老家,祖墳竟被鄰居蓋成廁所,我隱忍不發,隔天鄰居一家傻眼

清明回老家,祖墳竟被鄰居蓋成廁所,我隱忍不發,隔天鄰居一家傻眼

紅豆講堂
2025-04-26 10:06:11
2025-04-28 08:07:00
字母榜 incentive-icons
字母榜
讓未來不止于大。
1837文章數 7990關注度
往期回顧 全部

科技要聞

AI教父站到了OpenAI對立面

頭條要聞

特朗普伸手被晾在一邊 "最后一刻"拒絕馬克龍參與會晤

頭條要聞

特朗普伸手被晾在一邊 "最后一刻"拒絕馬克龍參與會晤

體育要聞

我們來自北極圈,我們有全球最恐怖的主場!

娛樂要聞

華表獎獲獎名單!張譯二影帝惠英紅勇影后

財經要聞

2千億!核電開閘 國常會核準10臺新機組

汽車要聞

蔚來李斌的"十年磨一劍" 從看得見 到看不見

態度原創

藝術
家居
數碼
旅游
軍事航空

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

家居要聞

明亮溫馨 質感且奢華

數碼要聞

蘋果第二代AirTag即將發布,三大改進讓它更實用

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

軍事要聞

哈馬斯同意釋放所有以方被扣押人員

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 西华县| 突泉县| 永州市| 鞍山市| 新丰县| 白玉县| 武宁县| 若尔盖县| 龙井市| 会同县| 安化县| 罗江县| 荥经县| 岑巩县| 宜宾市| 乐山市| 桃源县| 鄱阳县| 佛坪县| 通海县| 乐业县| 衡阳县| 当涂县| 苏尼特右旗| 闽侯县| 安庆市| 历史| 华池县| 叙永县| 灵宝市| 苏尼特左旗| 恩施市| 阿拉善左旗| 徐水县| 扶风县| 上高县| 福鼎市| 天镇县| 蓬溪县| 任丘市| 南安市|