99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

奧特曼首揭GPT-4.5內幕,一個bug搞崩10萬GPU!5人即可重訓GPT-4

0
分享至


新智元報道

編輯:編輯部 NYH

【新智元導讀】GPT-4.5比GPT-4聰明10倍!其背后的研發故事卻鮮為人知。奧特曼攜OpenAI團隊首次敞開心扉,分享了幕后細節。從海量算力引發的「基礎設施危機」,到「torch.sum bug」帶來的意外突破,團隊講述了在挑戰中實現智能飛躍。

GPT-4.5出世一個多月,鮮有人知其背后研發故事。

今天凌晨,奧特曼與三位核心研究員在線開啟播客對談,首次揭開了GPT-4.5從愿景到現實的史詩級突破。


早在兩年前,OpenAI團隊定下了一個大膽的目標,打造一款比GPT-4聰明10倍的模型。

這不僅意味著LLM性能提升,更是對計算、數據、協作的極限挑戰。


從左到右:奧特曼、Alex Paino、Amin Tootoonchian和Daniel Selsam

如今,OpenAI在2月底正式交卷,GPT-4.5情商堪稱所有模型最強的,并再次Scaling無監督學習的邊界。

這款「超級模型」究竟如何創造智能奇跡,全部濃縮在了這45分鐘的圓桌對談中。

一些精彩亮點:

  • GPT-4.5比GPT-4聰明10倍,研發用時2年,擁有上一代不具備的微妙「魔力」

  • 訓練GPT-4.5為OpenAI提供了寶貴的技術經驗;現只需要大約5名員工,就可以從頭開始訓練GPT-4

  • 算力基礎設施和大規模GPU擴展帶來的小概率問題會捅出大亂子

  • 數據效率成為關鍵瓶頸,OpenAI下一個主要研究前沿是提高數據效率

  • 「torch.sum bug」等趣事推動模型性能飛躍。

  • Scaling Law被驗證為可能長期有效的「宇宙規律」


GPT-4.5聰明10倍

奧特曼開篇說,通常他們開這種會都是為了發布新產品,不過這次打算換個玩法,聊聊GPT-4.5開發背后的故事。

GPT-4.5推出后,用戶對它的興趣特別大,這大大超出了研發團隊的預期。

他們首先從「一個巨型模型到底需要什么?」這個話題說起。

「一大堆人、一大把時間,還有海量的計算資源。」主要負責預訓練數據的Alex回答說。

Alex表示,他們光是準備階段就花了很多心思,至于正式的訓練,「本身就是個超級大的工程」。

在實際訓練中,研究團隊經常得做選擇:是推遲發布,等更多問題解決;還是早點上線,邊跑邊解決問題。

這是個平衡,不能讓整個訓練過程拖得太久。

他們謙虛地認為,對于效率更高的算法及以如何更好地利用現有數據,他們還只是「略知皮毛」。

在不久之前,我們還在受限于算力。但從GPT-4.5開始,我們更多地是處在一個受限于數據的環境里了。

他們說這是一個顛覆性的進展,「整個世界對此還沒有充分認識到。」

兩年前著手開發GPT-4.5時,他們的目標是比GPT-4聰明10倍。

現在,他們覺得自己達到了這個目標——至少在投入的有效算力下,GPT-4.5實現了比GPT-4聰明10倍的效果。

預訓練的兩個難題

不過,實際的訓練時間還是比預想的要長不少。

這里面主要有兩個問題。

一個是從1萬個GPU增加到10萬個GPU,問題會變得多得多。

尤其是一些提前沒預料到的小概率問題,在大規模計算時會捅出大亂子。

最容易出問題的就是算力基礎設施,由于他們的數據量實在是太大了,有些問題連硬件制造商都沒遇見過。

網絡架構、單個加速器,這些都會出問題。「我們的工作就是盡量把這些變量的波動降到最低。」

另一個問題是探索前沿科技這件事本身就很難。

在訓練GPT-4.5時,OpenAI投入了幾百人的努力,耗費了大量的時間,幾乎是all in。

但如果他們現在重新訓練一個GPT-4水平的模型,大概只需要5到10個人就可以搞定。

專注于數據效率和算法的Dan說,「我覺得做任何新東西都難。但是當你知道別人已經做成過某件事,難度就會大大降低」。

「因為最難的部分是下定決心去做一件事。知道某件事是可行的,簡直就像開了掛,瞬間就容易多了。」

Dan接著表示,如果想要將訓練規模再擴大10倍甚至是100倍,數據就會成為瓶頸,這時候就需要一些算法上的創新,讓模型能用更多的算力從同樣的數據里學到更多東西。

torch.sum bug趣事

研究團隊在GPT-4.5的訓練中,發現了一些特別有趣的事情。

比如,在訓練過程中不斷地優化機器學習算法,做出一些調整。

尤其是團隊解決了一些關鍵問題后,他們看到了模型性能的大幅提升。

那一刻,整個團隊的能量都不一樣了,大家都特別興奮,動力滿滿,要把最后階段沖刺完成。


「那一刻真的很震撼。這對團隊士氣的提升,真的特別美妙。」

現場OpenAI的首席系統架構師Amin Chian分享了一個「torch.sum bug」趣事。

在訓練過程中遇到bug是常事,通常是找一下到底是硬件故障、數據損壞,還是機器學習相關的Bug。

但在訓練GPT-4.5時,有一次好幾個問題一直都沒有解決。

大家沒辦法就在一起討論研究這些問題到底是由不同的Bug引起的,還是同一個Bug導致的。

他們圍著桌子投票。結果呢?后來確定的那個Bug在當時得票最少!

就是個簡單的「torch.sum」Bug,來自上游的PyTorch庫,大家都覺得太不可思議了。

所有的問題都被這一行代碼給解決了,真的特別有趣。

為了慶祝,他們還把Slack頻道從「多Bug理論」改成了「單Bug理論」,那場面可熱鬧了。

這個Bug的觸發頻率特別低,可能每100步、1000步才出一次問題,特別容易被忽略。

但他們有條紀律,在訓練過程中不能容忍這種問題出現。

整個過程就是一個堅持不放棄的故事。



壓縮即智能

幾十年來,深度學習的核心一直是提升算力效率。而且,每一次小的改進,都能帶來顯著的疊加效應。

世界上各地不同的人發現一個提升10%效率的技巧,另一個提出提升20%的優化,這些看似微小的進步累積起來,就能徹底改變模型的表現。

過去,因算力受限,數據效率的研究顯得并不劃算。但如今,數據效率每一次突破都將可能成為AI發展的臨界點。

因此,現在就去預測AI會有瓶頸,有點不明智。

他們還認為更好的預訓練和無監督學習能全面提升模型的智能,幫助模型更好地泛化,這一點跟現在模型的推理能力很是互補。

預訓練本質上是在壓縮數據。壓縮數據意味著發現不同事物之間的聯系、類比和抽象。而推理則針對某個具體問題,需要一種謹慎思考的技巧。

這種謹慎思考能解鎖很多不同領域的問題,但預訓練在跨領域壓縮數據時,學到的是一種更抽象的東西。

為什么無監督學習會有效?研究員們的答案是「壓縮」。

可以說,理想的智能形態就是所謂的「所羅門諾夫歸納」(Solomonov induction)。

簡單來說,模型更傾向于簡潔的解釋。與此同時,它嚴格遵循貝葉斯原理,把所有可能性都記住,隨時根據新信息更新自己的回答。

而他們現在做的預訓練——或者說理解預訓練的一個視角——就是在做這種「壓縮」。

試圖找到一個最短的程序(或者模型),來解釋所有的數據,以此作為對理想智能的一種近似。

Scaling Law是宇宙法則

在播客的最后,奧特曼表示,訓練GPT-4.5的整個過程,花了無數的人力、時間和金錢,其實可以看成是一場實驗。

一場驗證Scaling Law是不是還成立的實驗。

結果他們發現,Scaling Law不僅有效,而且還可能會持續很長時間。


奧特曼說他接受Scaling Law就像接受量子力學一樣,還不明白為什么Scaling Law會是一種宇宙的規律。

對此Dan試著解釋說,模型數據壓縮得越多,智能就越高,這個有很強的哲學依據。

他自己比較喜歡的一個解釋是,世界上數據的「關鍵概念」是稀疏的,符合冪律分布(power law)。

比如,第100個重要的概念,可能在每100個文檔里只出現一次。

也就是說數據有很強的「長尾效應」。

所以現實是,如果你想抓到「尾巴」里下一個重要的東西,可能得把算力和數據量翻個十倍。

而這個尾巴還很長,可以一直挖下去。

參考資料:

https://x.com/sama/status/1910363434241450171

https://www.youtube.com/watch?v=6nJZopACRuQ

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
趙本山長子趙鐵蛋因病去世,女兒成網紅,上億家產花落誰家?

趙本山長子趙鐵蛋因病去世,女兒成網紅,上億家產花落誰家?

三公子娛樂丫
2025-04-10 15:15:03
好看嗎?耐克官方發布國足2025年新款主場球衣,一睹為快!

好看嗎?耐克官方發布國足2025年新款主場球衣,一睹為快!

直播吧
2025-04-12 19:00:25
朱茵女兒罕見露面!13歲身高才1米5,顏值不如媽,和黃貫中長太像

朱茵女兒罕見露面!13歲身高才1米5,顏值不如媽,和黃貫中長太像

明月聊史
2025-04-11 10:29:25
強勢回歸!消失3年的“水貨國腳”徹底爆發:中甲4場進2球!

強勢回歸!消失3年的“水貨國腳”徹底爆發:中甲4場進2球!

邱澤云
2025-04-13 22:41:13
70歲離異老太慘死,法醫檢測體內男性DNA,竟與老太自己高度吻合

70歲離異老太慘死,法醫檢測體內男性DNA,竟與老太自己高度吻合

蘇大強專欄
2024-03-27 22:12:23
28歲網紅鄭世杰去世,死因曝光,留4個孩子,提前寫好墓穴生活

28歲網紅鄭世杰去世,死因曝光,留4個孩子,提前寫好墓穴生活

古希臘掌管松餅的神
2025-04-12 15:36:07
擁有460萬粉絲,3個月閃婚學生舅舅的網紅周老師,如今怎么樣了

擁有460萬粉絲,3個月閃婚學生舅舅的網紅周老師,如今怎么樣了

凌晨一點的貓
2025-04-09 14:52:54
英超最新積分榜!利物浦2-1絕殺,切爾西2-2爆冷,熱刺2-4慘敗

英超最新積分榜!利物浦2-1絕殺,切爾西2-2爆冷,熱刺2-4慘敗

萬花筒體育球球
2025-04-14 00:29:27
最高法為何再次強調嚴格界定“老賴”范圍

最高法為何再次強調嚴格界定“老賴”范圍

澎湃新聞
2025-04-13 09:22:03
國服《魔獸世界》上線逆天新功能:一鍵刷新賬號數據,卡頓拜拜,黑手滾蛋!

國服《魔獸世界》上線逆天新功能:一鍵刷新賬號數據,卡頓拜拜,黑手滾蛋!

一起玩魔獸硬核哥
2025-04-13 20:59:59
導彈擊中市中心,烏克蘭傷亡上百人,議員曝烏軍排隊領獎被團滅

導彈擊中市中心,烏克蘭傷亡上百人,議員曝烏軍排隊領獎被團滅

書中自有顏如玉
2025-04-14 00:53:38
美國為何又決定繼續援助烏克蘭?主要有三個原因:

美國為何又決定繼續援助烏克蘭?主要有三個原因:

風華講史
2025-03-08 10:54:36
鎮遠市委書記下鄉,遭三名基層干部和兩名交警打罵,防暴隊出動

鎮遠市委書記下鄉,遭三名基層干部和兩名交警打罵,防暴隊出動

喬生桂
2024-02-09 22:43:06
人活多久,看喝酒就知道?壽命短的人,喝酒一般有這4個特征

人活多久,看喝酒就知道?壽命短的人,喝酒一般有這4個特征

河山銳新聞
2025-04-09 08:43:06
菲律賓和廣東同為1億多人口,菲律賓創造3.3萬億,廣東是多少?

菲律賓和廣東同為1億多人口,菲律賓創造3.3萬億,廣東是多少?

跳跳歷史
2025-03-05 14:32:05
廣東宏遠26歲新援遭杜鋒棄用,和徐杰親如兄弟,前女友是芭蕾女神

廣東宏遠26歲新援遭杜鋒棄用,和徐杰親如兄弟,前女友是芭蕾女神

陳意小可愛
2025-04-13 05:40:02
解決臺灣問題有了新手段?不用解放軍出馬,美已預感到大事不妙

解決臺灣問題有了新手段?不用解放軍出馬,美已預感到大事不妙

車馬點兵V
2025-03-27 12:08:48
亞布塞萊:還沒考慮自由球員的問題 感謝76人給我重返NBA的機會

亞布塞萊:還沒考慮自由球員的問題 感謝76人給我重返NBA的機會

直播吧
2025-04-14 04:04:01
五大聯賽現任連續執教同一球隊時間最長的十大主帥:第一名17.5年

五大聯賽現任連續執教同一球隊時間最長的十大主帥:第一名17.5年

仰臥撐FTUer
2025-04-13 19:31:02
打響第一槍!“臺獨”李延賀被抓,竟然還是大陸人

打響第一槍!“臺獨”李延賀被抓,竟然還是大陸人

靚仔情感
2025-04-11 15:04:51
2025-04-14 04:31:00
新智元 incentive-icons
新智元
AI產業主平臺領航智能+時代
12522文章數 66012關注度
往期回顧 全部

科技要聞

特朗普政府豁免消費電子等產品的對等關稅

頭條要聞

特朗普"180度大轉彎" 首次"對中國商品實施重大豁免"

頭條要聞

特朗普"180度大轉彎" 首次"對中國商品實施重大豁免"

體育要聞

那個抱起全紅嬋的英國女孩

娛樂要聞

倪虹潔給陳德容上了一課,贏得漂亮!

財經要聞

美方豁免部分產品對等關稅 商務部回應

汽車要聞

審美和深層次豪華 阿維塔06都辦到了

態度原創

時尚
教育
游戲
公開課
軍事航空

今年春夏最實用的穿衣法則,照著搭就很時髦!

教育要聞

“一手好牌打得稀爛”,女兒中山大學畢業變水碩,母親仍不悔悟

《黑神話》制作人馮驥發文薦書!玩家猜測DLC!

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

多視角看殲-16與運油-20精準對接

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 徐闻县| 徐州市| 璧山县| 太康县| 晋江市| 贡觉县| 德庆县| 西乌| 疏勒县| 伽师县| 大安市| 青铜峡市| 林西县| 上虞市| 富源县| 罗源县| 临沂市| 浮山县| 淄博市| 远安县| 时尚| 迭部县| 咸丰县| 丰城市| 当阳市| 门源| 瑞安市| 阜康市| 张家界市| 张家口市| 马鞍山市| 闽清县| 宁阳县| 临安市| 米林县| 宣威市| 罗江县| 韶山市| 神木县| 辉南县| 商丘市|