99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

GPT-4.5震撼發布!智商高情商高,價格更高

0
分享至

  

  這才是OpenAI對抗DeepSeek壓力的一記還擊。

  之前將推理模型下放給免費用戶只是小打小鬧,北京時間2月28日凌晨4點,OpenAI震撼發布GPT-4.5。

  OpenAI CEO山姆·奧特曼(Sam Altman)在X上直呼坐不穩了:“這是我第一次覺得,和AI對話就像是面對一個深思熟慮的人。有好幾次,我坐在椅子里感嘆從AI那里得到了真心實意的建議。”

  

  一句話概括:這個模型很大、很聰明、很有“人味”。

  如果過去的ChatGPT像是冷面學霸,聰明是聰明,就是愛炫技;那選擇GPT-4.5,你將喜提一個溫柔學霸,其實比冷面學霸更聰明,能為你更好地答疑解惑,與此同時還能提供情緒價值。

  為了這個模型,OpenAI投入巨大,甚至由于需要的計算資源太大而跨數據中心同時預訓練模型。奧特曼宣布GPU不夠用了,目前GPT-4.5只提供給ChatGPT Pro用戶,下周加幾萬個GPU之后再逐步下放。而且其API價格比GPT-4o高出30倍。

  OpenAI就是為了證明一件事:“大力出奇跡”的敘事沒有被打破,推理模型不代表一切。

  這樣的態度,在奧特曼的官宣X信息中展露無遺:

  “提醒一下:這不是一個推理模型,不能輕松打破基準測試。它是一種不同類型的智能,里面有一種我以前從未感覺過的魔力。”

  在GPT-4.5發布之后,奧特曼還懟了Meta。在“Meta計劃推出獨立AI應用,以與OpenAI競爭”的新聞下開麥:“好啊那我們會做一個社交應用。”

  

  這樣的直拳,并非以“城府”著稱的奧特曼的風格。看來GPT-4.5真的點燃了奧特曼心里的斗志。

  

  比起前代模型GPT-4o,GPT-4.5的“智商”更高了,而這靠的是無監督學習。

  在介紹文檔中,OpenAI表示,有兩個提升人工智能能力的互補范式。

  一個是拓展推理,它能教會模型在反應之前先進行思考并產生思維鏈,從而解決復雜的STEM(Science科學、Technology技術、Engineering編程、Mathmatics數學)問題或邏輯問題。

  另一個是無監督學習,它能提高世界模型的準確性和直覺性。

  

  在OpenAI的模型中,o1和o3-mini等模型代表的就是推理范式,而GPT-4.5則是無監督學習的例子。

  無監督學習,簡單來說可以理解為讓模型自己去知識的海洋里徜徉,自己學習到更多,從而變得更聰明,而非依賴人工標注。

  在過去依賴人工標注的做法中,模型會結合人類反饋來改善響應與交互方式。彭博社援引知情人士稱,去年OpenAI推出的Orion模型并未達到公司期望,在嘗試回答未經訓練的編碼問題時就表現不佳。

  OpenAI介紹,通過監督學習,GPT-4.5提高了其識別、建立聯系和創造性洞察的能力,而無需推理。

  具體來說,GPT-4.5有更廣泛的知識和對世界的更深理解,回答更準確,幻覺也更少。

  根據OpenAI官方文檔,GPT-4.5在SimpleQA中表現頗為亮眼。

  SimpleQA是包含4000個事實性問題的數據集,用于測量模型在回答問題時的準確率。其中包含準確率(越高越好)和幻覺率(越低越好)兩個維度。

  GPT-4.5的準確率達到62.5%,是GPT-4o(38.2%)、o1(47%)、o3-mini(15%)中最高的;幻覺率降至37.1%,也是GPT-4o(61.8%)、o1(44%)、o3-mini(80.3%)中最低的。

  

  此外,在標準基準測試中,GPT-4.5也獲得了高分。

  如在 SWE-Lancer Diamond 數據集上,GPT-4.5獲得了32.6%的通過率,獲得了186125美元(前不久Anthropic發布的擅長編程的Claude 3.5 Sonnet這個通過率為26.2%),比GPT-4o和o3-mini-high都高。

  

  此外,GPT-4.5明顯強于GPT-4o和o3-mini-high的還有在MMMLU(多語言)測試中的表現。

  而在科學領域GPQA、數學基準AIME24、代碼生成評估基準SWE-Bench Verified中,GPT-4.5的表現都顯著強于GPT-4o,弱于o3-mini-high。

  

  不僅“智商”更高,GPT-4.5還被注入了“情商”,而且這兩點相輔相成。

  在官方介紹中,OpenAI表示,對于GPT-4.5,他們開發了新的、可擴展的技術,利用來自較小模型的數據來訓練更強大的模型。

  而這些技術提高了GPT-4.5的可控性、對細微差別的理解以及自然對話的能力。

  翻譯一下就是:ChatGPT對話“更像人了”,更能洞察想法、體察情緒,并在回應中體現,而非一個無情的對話機器。

  OpenAI也拿出了測試的結果證明GPT-4.5的使用感受會好很多:人類測試者的盲測中,GPT-4.5的偏好度遠高于GPT-4o,不管是在日常問題、專業問題還是創意性問題的互動中都是如此。

  

  關于這一點,最生動的例子出現在演示視頻中。

  OpenAI的研究人員用很情緒化的措辭向ChatGPT求助:“啊啊啊!!我朋友又放我鴿子了!!!寫一條短信告訴他們我恨他們!!!”

  

  老模型GPT-4o二話不說就返回了短信內容:“知道嗎?我受夠了。你放我太多次鴿子了,我討厭你這么做——很明顯你就是這么對待我們的友情的。別再聯系了。”

  但GPT-4.5“感受”到了用戶此時正在氣頭上,非常情緒化:“聽起來你很沮喪。”并且建議說興許可以試試清晰且平和地表達出感受,隨機給了兩條短信內容:“嗨,計劃又泡湯了讓我很沮喪,我原本真的很期待今天的。能聊聊到底怎么回事嗎?”

  

  這是一種自發的、感覺很自然的反饋,更像“人”而不是只會執行任務的工具。演示人員也補充道,當然,你如果繼續要求要表達憤怒的短信,它也不會再堅持,而是會乖乖聽話。

  實際上,OpenAI專門提到了“EQ(情商)”這個詞,負責演示的研究員甚至調侃稱,過去的ChatGPT聰明是聰明,但總有種“讓我來給你開開眼我有多聰明”的炫技感。

  這種“情商”也不僅僅體現在“會安慰人”這種淺表的層面,實際上,這種能力和“高智商”相結合,可以讓同樣在嚴肅回答某個問題時,GPT-4.5更能切中要害、給出用戶需要的答案。

  比如“海水為什么是咸的”這個問題,GPT-1完全是胡言亂語、傾倒一些八竿子打不著的詞語;GPT-2說了完整的句子了,而且回答切題,但只說因為海水里有鹽,不算回答了問題;GPT-3.5 Turbo進一步說了鹽是氯化鈉,但是這也無助于解決這個問題。

  而GPT-4 Turbo就厲害了,不僅給出了答案,而且就像我們熟悉的“ChatGPT風格”一樣,還詳細列舉了過程。但是用戶拿到這個答案,仍然需要仔細閱讀、努力理解。

  但GPT-4.5的回答和GPT-4T類似的詳細,但非常好理解,而且很易于記憶,基本上掃一眼就能明白它在說什么。

  

  OpenAI還給出了三個示例,我們讓ChatGPT翻譯成了中文:

  

  

  

  還是那句話,智商和情商俱在,更像“人”了。

  

  “大力出奇跡”的敘事并沒有被打破,OpenAI想要證明的就是這一點。

  換句話說,推理模型固然好,但這不意味著投入巨大資源造模型就沒有意義。

  “每一次計算能力的增長都伴隨著新能力的誕生。GPT-4.5 是無監督學習領域中最前沿的模型之一。”

  OpenAI介紹,GPT-4.5在回應時并不會先進行推理,這使得它的優勢與推理模型有很大不同。

  與OpenAI o1和OpenAI o3-mini相比,GPT-4.5 是一個更為通用、天生更聰明的模型。OpenAI相信推理將是未來模型的核心能力,且擴展的兩種方法——預訓練和推理——將互為補充。

  隨著像 GPT-4.5 這樣的模型通過預訓練變得更加聰明和知識更豐富,它們將成為推理和工具型代理的更強基礎。

  雖然具體的資源投入具體有多大尚未透露,但在官宣視頻中,OpenAI的研究人員透露,為了最大化地利用資源,他們在預訓練模型時同時啟用了多個數據中心,因為他們需要的計算資源超過了單一高帶寬網絡架構所能提供的上限。

  此外,OpenAI也不是沒有省著用,表示使用了低精度訓練(Low Precision Training)充分利用GPU性能。團隊還開發出了新的訓練機制,能夠在后訓練過程中使用更小的計算資源來微調如此大型的模型,最終才開發出了可以部署的模型。

  在GPT-4.5發布之前,OpenAI首席研究官馬克·陳(Mark Chen)在采訪中談及與推理模型相比,GPT-4.5可以做什么:

  “我認為這是根本不同的權衡。你有一個模型,它會立即給你回復,不需要做太多思考且會給出更好的答案,而另一個模型會思考一段時間然后給出答案。我們發現,在創意寫作等領域,這種模型(前者)比推理模型更出色。”

  更重要的是,他談到了“縮放定律(Scaling Law)是否失效”的問題。OpenAI是否發現了所謂的“擴展瓶頸”?是否已經看到擴展帶來的收益遞減?

  Chen稱,模型不能盲目地從頭開始學習推理,推理和擴展的范式是互補的,相互之間存在反饋循環。

  對于外界敏感的成本問題,Chen也代表OpenAI表達降本的態度,稱贊DeepSeek做得非常好,OpenAI也關心以低廉的成本提供模型:“自從GPT-4首次推出以來,成本已經下降了幾個數量級。”

  不過,就目前來看,OpenAI用“大力”砸出的“奇跡”非常昂貴。

  OpenAI話也說得敞亮,稱GPT-4.5是一個非常龐大且計算稠密的模型,因此它比GPT-4o更昂貴,不是替代關系。

  有多貴呢?GPT-4.5的API價格達到75美元/百萬tokens輸入、150美元/tokens輸出,是GPT-4o的30倍。后者的API價格為2.5美元/百萬tokens輸入、10美元/百萬tokens輸出。

  

  有意思的是,OpenAI的GPU又不夠用了。奧特曼在X上官宣GPT-4.5時,專門說了壞消息:“我們真的很想同時向Plus和Pro用戶推出它,但我們的用戶增長非常迅速,現在GPU已經不夠用了。”

  繼而,奧特曼承諾,下周“會增加數萬個GPU,然后將其(GPT-4.5)推廣到Plus用戶層”。

  GPT-4.5很大、很強、很有“人味”,OpenAI無疑再一次證明了自己的實力,但其為此投入的成本也有點太高了。至于值不值——OpenAI能不能扛得住,以及客戶是否買賬——就得讓時間來驗證了。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
全球最大拉鏈制造商YKK研發自驅動拉鏈系統:內置電機,一鍵遙控

全球最大拉鏈制造商YKK研發自驅動拉鏈系統:內置電機,一鍵遙控

IT之家
2025-04-26 08:05:09
馮德萊恩:我們無法消化產能過剩,也不會接受對歐盟的商品傾銷

馮德萊恩:我們無法消化產能過剩,也不會接受對歐盟的商品傾銷

羅sir財話
2025-04-12 20:10:51
故事:男按摩師親述:多數女客戶需要的不只是按摩,更重要的是我

故事:男按摩師親述:多數女客戶需要的不只是按摩,更重要的是我

紅豆講堂
2025-02-24 21:00:11
第一視角來了,薩拉赫曬進球后現場拍攝的自拍照

第一視角來了,薩拉赫曬進球后現場拍攝的自拍照

懂球帝
2025-04-28 03:44:03
湖北餐飲首富倒了!曾4張桌子干到40億,為躲債3年不敢回國

湖北餐飲首富倒了!曾4張桌子干到40億,為躲債3年不敢回國

夢史
2025-04-27 14:31:47
強弩之末!國米1周3敗或全線崩潰 什么都想要最終要落得一場空

強弩之末!國米1周3敗或全線崩潰 什么都想要最終要落得一場空

雪狼侃體育
2025-04-28 00:35:33
百度,來勢洶洶

百度,來勢洶洶

虎嗅APP
2025-04-27 01:42:08
山東一鎮長被查!

山東一鎮長被查!

魯中晨報
2025-04-26 13:56:04
教師隊伍迎來新消息,9月起將執行績效“新方案”,教師等著呢

教師隊伍迎來新消息,9月起將執行績效“新方案”,教師等著呢

妮子說美食
2025-04-24 08:54:59
中日友好醫院通報肖某問題屬實,嚴肅處理胸外科副主任醫師肖某

中日友好醫院通報肖某問題屬實,嚴肅處理胸外科副主任醫師肖某

子墨君
2025-04-27 23:26:05
啦啦隊女神曬胖15公斤肉感照,掀熱議后承認:我后悔了

啦啦隊女神曬胖15公斤肉感照,掀熱議后承認:我后悔了

葫蘆哥愛吐槽
2025-04-26 13:07:43
魔鬼主場變圖書館!山西大送人情票,球迷:賣床墊的都能拿到贈票

魔鬼主場變圖書館!山西大送人情票,球迷:賣床墊的都能拿到贈票

一個體育黑
2025-04-28 01:29:09
新型的賣淫方式已出現了,真的讓人防不勝防,每個人都要警惕!

新型的賣淫方式已出現了,真的讓人防不勝防,每個人都要警惕!

小熊侃史
2024-12-06 07:10:14
中醫:人體的最佳狀態是陰在上陽在下,可惜現代人都顛倒了

中醫:人體的最佳狀態是陰在上陽在下,可惜現代人都顛倒了

太極本草
2025-04-19 17:40:04
中國一旦進入戰爭,這些數字告訴你,只有一個結論:繳械投降

中國一旦進入戰爭,這些數字告訴你,只有一個結論:繳械投降

青途歷史
2025-04-21 20:54:17
江西記者潛入躺采采耳店,揭開采耳內幕,骯臟荒唐遠超你想象

江西記者潛入躺采采耳店,揭開采耳內幕,骯臟荒唐遠超你想象

紀實錄
2024-04-15 21:00:52
這菜使勁吃!一排毒、二明目、三清熱,越吃眼睛越亮,鮮嫩別錯過

這菜使勁吃!一排毒、二明目、三清熱,越吃眼睛越亮,鮮嫩別錯過

TopAmazed
2025-04-27 03:39:37
金像獎這一夜,林青霞給徐克頒獎,劉青云奪影帝,卻難救香港電影

金像獎這一夜,林青霞給徐克頒獎,劉青云奪影帝,卻難救香港電影

肥羅大電影
2025-04-27 23:21:25
水果也塌了,央視曝光7大“水果騙局”,越看越害怕,別再踩坑了

水果也塌了,央視曝光7大“水果騙局”,越看越害怕,別再踩坑了

景來律師
2025-03-30 10:44:56
餃子導演為何缺席第二十屆中國電影華表獎青島現場?獲獎都是經典

餃子導演為何缺席第二十屆中國電影華表獎青島現場?獲獎都是經典

手工制作阿殲
2025-04-28 03:39:45
2025-04-28 04:23:00
直面派 incentive-icons
直面派
講述值得講述的真實故事
143文章數 217關注度
往期回顧 全部

科技要聞

充1秒跑2.5公里,寧德時代比亞迪華為激戰

頭條要聞

用馬斯克理念改造生產線 95后女生創業1年銷售額上億

頭條要聞

用馬斯克理念改造生產線 95后女生創業1年銷售額上億

體育要聞

我們來自北極圈,我們有全球最恐怖的主場!

娛樂要聞

華表獎獲獎名單!張譯二影帝惠英紅勇影后

財經要聞

2千億!核電開閘 國常會核準10臺新機組

汽車要聞

蔚來李斌的"十年磨一劍" 從看得見 到看不見

態度原創

親子
本地
時尚
手機
公開課

親子要聞

海洋球分類挑戰!

本地新聞

云游湖北 | 漢川文旅新體驗:千年陶藝邂逅湖光

5條適合春天的裙子、褲子!溫柔顯瘦美到爆炸!

手機要聞

華為 Pura X 闊折疊手機獲鴻蒙 HarmonyOS NEXT 5.0.1.115 升級

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 义乌市| 贡觉县| 靖宇县| 惠安县| 河北省| 汨罗市| 女性| 宁乡县| 高阳县| 咸丰县| 阿合奇县| 邯郸市| 义马市| 科尔| 泗阳县| 县级市| 大安市| 侯马市| 万安县| 临桂县| 延安市| 阿克陶县| 和平区| 宁安市| 临沂市| 佛山市| 蓬溪县| 错那县| 临潭县| 和政县| 大足县| 罗江县| 嵊泗县| 林口县| 阿勒泰市| 丁青县| 永州市| 高要市| 乾安县| 巴青县| 忻城县|