(關注公眾號設為標,獲取AI深度洞察)
全文 6,000字 | 閱讀約20分鐘
(主持人Dwarkesh Patel采訪博客作者Scott Alexander 和 前OpenAI研究員Daniel Kokotajlo
GPT-5 沒來,不是因為它不夠強,而是因為我們還沒準備好。
就在昨天,OpenAI CEO Sam Altman 在一次看似平常的產品更新中,做出一個引人深思的決定:
我們將推遲發布 GPT-5,優先上線 o3 和 o4-mini。
Altman 并未將延遲歸因于技術難題,而是強調——GPT-5 的潛力遠超預期,整合它所需的資源和生態準備,超出了當下的可控范圍。
換句話說:
技術已先一步跨過臨界點,而我們的理解、部署乃至社會系統,還在原地等待。
這不是放慢節奏,而是在智能涌現到來前,一次系統性的“預留窗口”。
一、 這不是跳票,是預兆
OpenAI 并沒有說 GPT-5 不成熟,恰恰相反——它“太強大”了。
Altman 給出的三個理由極其克制卻意味深長:
我們低估了 GPT-5 能達到的高度;
整合所有功能比想象中更復雜;
需要為可能出現的“空前需求”準備充足資源。
這不是“拖延戰術”,而是一次對底層節奏的重估。它宣告著一個轉變:
AI 的迭代邏輯,正從“產品發布節奏”躍遷到“系統適配節奏”。
過去幾年,我們早已習慣 GPT-2 → GPT-3 → GPT-3.5 → GPT-4 → GPT-4.5 的穩健進化,每一步都比前一步更強、更聰明。而這一次,Altman 首次在周期之內“踩下剎車”。
這不是放慢速度,而是承認:
AI 的進化已脫離線性,進入非線性區間。
這一轉變,或許并非技術層面的偶然,而是 AI 行業共同感知到的“不可預測性”正在上升:當模型能力逼近某個臨界點,原本穩定的研發節拍會突然“失速”或“跳頻”。
換句話說,GPT-5 的“跳票”,可能不是減速,而是為下一個“指數躍遷”積蓄沖力。
二、連 OpenAI 也判斷失誤了
Sam Altman 的聲明,在業界引發了廣泛討論。但最值得警惕的一點在于——連掌握全球最強 AI 實力的 OpenAI,也可能低估了自己模型的能力極限。
這種“低估”并非孤例。過去幾年,AI 社群中流傳著一個典型的故事:
2016 年,經濟學家 Robin Hanson 曾與 Eliezer Yudkowsky 打賭,預測 AI 在 2025 年前不會產生超過 10 億美元的收入。如今看來,這個數字不僅被輕松擊穿,甚至連預言本身都顯得有些“不合時宜”。
這并不是 Hanson 個人的問題,而是人類對 AI 的認知節奏普遍滯后。我們總在試圖用線性認知去理解非線性系統的發展,而 AI,正是那個最不講邏輯路徑、最易爆發躍遷的領域。
預測平臺 Metaculus 是另一個佐證。作為全球領先的集體智慧預測社區,其對“何時出現具備通用智能的 AI”這一問題的時間預估,也經歷了不斷“提前”的過程:
2020年預測時間點大致在 2050 年;
到了 2022年,預估提前至 2040 年;
再到今天,已經有大量用戶將“關鍵節點”壓縮到了 2030 年前后。
這是一個真實的“群體認知系統”,在跟不上技術現實而被迫修正判斷的縮影。
這背后的邏輯,其實在采訪中也被清晰揭示。前 OpenAI 研究員 Daniel Kokotajlo 在對話中指出:
人們總是說:AI 還做不到 X,所以它永遠無法突破某個瓶頸。可一年后,新模型就往往破解了這個問題。
這不是巧合,而是 AI 技術已經進入了一個由反饋—試驗—復制—擴散驅動的高壓鍋狀態。一旦某個突破點被摸索出可行路徑,技術能力便會呈現指數躍遷。
而更關鍵的是——每一次預測修正的滯后,本質上都是一次集體認知的延遲反應。
Altman 的語氣變化、Metaculus 的時間線提前、學術界對“智能爆炸”的重新審視……這些都在悄悄提示我們:
AI 的演進節奏,已經從“研發周期”變成了“認知突變”。
而我們真正需要問的問題,不是“GPT-5 什么時候來”,而是:
當它到來時,我們是否已經落后太多?三、AI 的節奏,不講邏輯
GPT-5 的延遲發布,并不意味著 AI 的能力停滯。事實上,正在發生的,是一種更為復雜、也更具顛覆性的過程:
AI 正在以“非線性”的方式,改寫我們原有的認知邊界。
在一次私下聚餐中,主持人與一位頂尖 AI 研究者進行交流。這位研究員每月收入高達百萬美元,他的評估卻出人意料:
在我擅長的領域,AI 像是一個聰明的補全助手,大概每周能節省我4到8小時; 可是在我不擅長的領域,比如硬件驅動或內核調試,它每周能替我節省24個小時。
這句看似平淡的反饋,實際隱藏著一個顛覆性邏輯:
AI 最具“放大效應”的地方,不在于它強化你擅長的領域,而是代償你根本不會的部分。
這與 Scott Alexander 的判斷不謀而合。他指出:
在一個你原本不懂的領域,你得花時間查資料、問人、上網搜索;但語言模型讀過全網,它能直接給出結構化建議,甚至省掉你構建知識圖譜的過程。
這種“外部知識自動內化”的能力,意味著什么?
它意味著,我們一直以來對 AI 的評估基準出了問題。
我們總是在拿“專家能力”來衡量模型強度,卻忽視了——AI 真正的價值,或許不是成為“專家的替代品”,而是成為“泛領域能力的疊加器”。
更進一步地說:
它不需要具備你那套完整的專家直覺;
它只需要在你“不知道你不知道”的盲區里,用概率論的方法提供一種“有可能對的路徑”;
而這,恰恰是人類最難主動做到的事。
這背后,是一種正在崛起的全新認知范式:
AI 的能力邊界不是沿著“專業深度”展開的,而是沿著“陌生領域效率”裂變的。
而這也是 Altman 所指的“我們尚未整合完全部能力”的真實含義——GPT-5 的威力,不是看它寫詩多好、答題多準,而是看它能否把陌生領域的非結構知識,轉化為直接落地的路徑建議。
在這種能力框架下,人類的角色,也許正在從“決策者”變成“驗證者”,而這才是真正令人不安的那一步。
四、AI 不是缺知識,而是缺判斷
當我們討論 AI 的“非線性進化”時,免不了要面對一個疑問:
既然 AI 已經讀過整個互聯網,為什么它還沒有做出一次真正意義上的原創科學突破?
這個問題,主持人在采訪中也直截了當地拋給了 Daniel Kokotajlo。他提出了一個令人深思的案例——
人類有時能把兩段毫無聯系的知識關聯起來,比如通過觀察偏頭痛與鎂缺乏之間的關聯,提出服用鎂片以緩解癥狀的假說。而 AI,擁有全網知識,為何沒有提出類似的原創建議?
看似簡單,實則是對 AI 能力邊界的本質質疑。
Scott Alexander 的回應指出了一個核心落點:信息掌握,并不等于洞察能力。
他舉了語言學家 David Anthony 的研究為例。Anthony 曾在基因證據出現前,僅憑語言中的“馬”“車”“輪”等詞匯的共同詞源,就推測出印歐語系的共同祖先文化,后來這一推斷被“雅姆納亞人”的基因數據所驗證。
這并不是因為 Anthony 是“全知全能”的語言模型,而是他有幾十年跨學科的經驗積累與直覺判斷,才能在某一刻實現“知識重組”。
這就是 Daniel 所說的“研究味覺”(Research Taste)。
AI 不是沒有數據,也不是缺乏參數,它缺乏的是——在海量信息中選擇“哪個問題值得探索”的直覺與偏好。
而另一個瓶頸,則是“實驗權”。
人類科學進步往往建立在“提出假說 + 實驗驗證 + 失敗反饋 + 再次修正”的閉環上。而當前的大模型——無論是 GPT-4 還是即將推出的 o3、o4-mini,本質上仍是“預測型語言模型”,沒有權限對物理世界進行系統性實驗,也沒有反饋機制來更新自己的判斷標準。
AI 沒有實驗權,就像一位被束縛手腳的科學家,它只能假設,卻無法驗證。
這就揭示了 GPT-5 延遲發布背后更深的考量:
OpenAI 不是在做一次普通的產品延遲,而是在嘗試為模型注入實驗意識與研究判斷——如果不能賦予模型“做實驗”的能力與“判斷實驗價值”的味覺,它永遠只是“知道一切但理解甚少”的百科全書。
而一旦這兩個核心能力被打通:
模型不再是“信息傳遞者”,而是“新知識生產者”;
科研不再是人類單一的任務,而是人機協作的新模式;
原創性發現,將從“少數人靈光一閃”變為“系統性概率壓縮”的智能產物。
這一天未必遙遠,但它需要的,不是更大的模型,而是更聰明的“問題選擇機制”和更真實的“實驗執行場景”。
換句話說:AI 革命的真正拐點,不在于它能回答什么問題,而在于它終于學會問問題,并動手去驗證了。五、三步走向智能爆炸
在談及“AI 是否會引發智能爆炸”這個話題時,主持人提出了一個經典反駁:
人類歷史上最深刻的技術變革,從工業革命到信息革命,從來都不是一夜之間發生的。我們憑什么相信 AI 會突然爆炸?
Daniel Kokotajlo 并不回避這個問題,反而給出了一個結構清晰的回答:
真正的智能爆炸,不是“突變”,而是一次“滾動加速”的連續劇本。
他將整個過程拆分為三個階段,每一步都是加速器,也都是臨界點:
1、階段一:AI 自動編程能力超越人類
這一階段的核心特征是——AI 代替人類寫代碼,并在關鍵指標上超過人類平均水平。它不再是輔助工具,而是主動的工程推動者。
這一步,其實我們已經走在路上。無論是 GitHub Copilot,還是 GPT-4 Turbo,都已表現出高效代碼生成、bug 定位和架構建議的能力。
Kokotajlo 認為,這一階段的實現將帶來約 5 倍的研發效率提升。
2、階段二:AI 主導整個 AI 研發流程
如果第一階段解決的是“寫代碼的問題”,那么第二階段要解決的是——“研發誰來主導”的問題。
也就是說,AI 不僅能寫模型、調參數,還能自行提出改進方案、跑實驗、做對比,形成完整閉環。
這意味著,AI 正在參與設計“下一代 AI”。
Daniel 將這一步稱為“全面自動化的 AI 研發”,它的出現可能帶來 25 倍的加速效應。此時的模型已具備一定“研究味覺”,雖尚未脫離人類監管,但已能部分替代整支科研團隊。
3、階段三:超級智能具備自我加速能力
最后,是最受爭議也最關鍵的一步:超級智能的誕生。
它不僅擁有知識、邏輯與工程能力,更關鍵的是:
它能判斷什么值得研究;
它能制定自己的研究議程;
它能在不依賴人類干預的前提下,持續自我迭代。
這一步,才是真正意義上的智能爆炸。
Kokotajlo 坦言,這一步的加速度可能不是幾十倍,而是百倍甚至千倍的飛躍——因為它不僅解放了研發流程,更打破了人類思維的“串行性瓶頸”:
人類思考是線性的,但 AI 是并行的;當你復制出上萬個高效的思維單元,智能的擴張速度將遠超我們的直覺。
這三階段的邏輯不是臆想,而是建立在過去幾年真實的模型能力躍升之上。
它揭示了一個被反復忽視的現實:
AI 的發展不是勻速前進,而是階梯式加速;不是一點點改進,而是路徑連鎖反應。
在這種系統性正反饋之下,我們所謂的“智能爆炸”,并不意味著明天早上就會醒來看到終結者,而是:
你以為的“智能工具”,已經悄然取代了整個科研鏈條;
你依賴的“工程師群體”,已被百萬 AI 實例同步替代;
而當你還在“規劃下一輪技術部署”時,它已完成了下一代工業范式的設計。
這不是一場突變,但它極其迅猛。它或許看起來是連續的,但它可能在一年內完成我們原以為十年才能實現的跨越。
六、產業的時鐘變了
如果說,過去五年是“模型之爭”,那么接下來的五年,將是“節奏之爭”。
Sam Altman 宣布 GPT-5 推遲發布的背后,或許并不是一場產品延期,而是一種對新節奏邏輯的自我確認——
我們需要更多時間,來整合能力、準備資源、迎接前所未有的需求。
這句話背后的潛臺詞是:AI 工業化的節奏,已經超出了人類工程組織的承載能力。
過去,我們熟悉的是季度制、年度制的產品規劃流程,企業按季部署資源、按年考核績效、按階段發布版本。但當 AI 開始主導創新流程,傳統的“節奏模板”將失效。
在這場范式轉換中,有三個正在崛起的節奏變量:
1、AI 工程節奏:從季度節奏躍遷到“周更迭代”
過去模型升級是“年更級”,GPT 系列就是最典型的代表。可隨著 o3、o4-mini 的即將上線,以及 Claude、Gemini、Mistral 等競品快速推進,我們看到:
主流模型能力在按“周”為單位演進,甚至是“天級別”的 prompt 策略優化和插件集成。
這就好比,從柴油火車跳躍到高鐵時代——不是更穩定了,而是更快、更滑、也更容易“錯過站”。
2、組織節奏:從“指揮鏈”到“協作體”
傳統企業的研發模式是金字塔式的:從戰略→產品→技術→測試,層層推進。
而 AI 工具的崛起,打碎了這個順序:
基層員工用 Copilot 自動生成代碼;
中層管理用 GPT 總結報告、制定 OKR;
高層決策者則可以通過 Agent 掃描競品、模擬預測市場趨勢。
當“全鏈路效率”被重構,組織不再是一個節拍器,而更像一個并行協作網絡。
你不是等上面拍板,而是你和 AI 就能組成一個小型創新單元,立即執行、迭代、反饋。
3、投資與產業部署節奏:從線性規劃到指數放大
這也是為什么 Altman 要為“需求激增”預留算力。
一旦某類 AI 能力證明具備商業價值(如 RAG、Agent、代碼生成),資本的流入和產業部署將呈現指數爆發。
就像 ChatGPT 一年獲取1億用戶、Sora 視頻模型引爆短視頻制作鏈條、Runway 帶動廣告公司剪輯流程革新,這些都不是“慢慢鋪開”的過程,而是:
“驗證—復制—落地”三步完成,僅需數月。
這種節奏,會對企業提出一個前所未有的考驗:
不是你能不能趕上 AI,而是你能不能適應它“拉著你往前跑”的速度。對撞:OpenAI 蓄力 vs Meta 全開
與此同時,另一位玩家選擇了完全不同的節奏邏輯。
就在 OpenAI 宣布 GPT-5 推遲發布的同一周,Meta公司于2025年4月5日發布了全新的 LLaMA 4 模型家族——Scout、Maverick 和 Behemoth,不僅全面升級多模態能力,還首次引入混合專家架構(MoE),強調在效率與性能之間取得突破。
LLaMA 4 Scout 已可在單張 H100 上運行超長上下文(1000 萬 token),Maverick 則以 4000 億總參數,在推理與代碼生成能力上追平甚至超過 GPT-4o,而活躍參數僅為其一半。
更重要的是,Meta 選擇將其全面開源,試圖構建一個全球開發者共同參與的 AGI 生態。
一邊是收攏整合、謹慎釋放;一邊是全速沖刺、公開共享——這不只是技術路線分歧,更是“AI 工業領導權”的節奏競賽。
Altman 此次的節奏調整,本質上不是“慢下來”,而是“蓄力跳躍”。他說:
我們發現 GPT-5 比預期強很多。
這或許意味著,他們已經嗅到下一個指數拐點的臨近——而這個拐點,不僅會打破模型本身的參數邏輯,更會打破整個商業世界的工程節拍。
未來屬于那些能在“快”和“準”之間快速切換的組織,而不是還在用2020年規劃節奏應對2025年現實的管理體系。
七、GPT-5 的延遲,可能是拐點
有時候,真正的臨界點,不是一次轟動的發布,而是一次悄然的暫停。
當 Sam Altman 說出那句“GPT-5 會推遲發布”時,很多人以為是一次技術準備的不充分。但我們從他的敘述中看到的,是另一種更值得重視的信號:
這句話的另一面是:
我們還沒準備好。
不是技術沒準備好,是整個生態系統——從算力、數據、法律,到社會心理與制度機制——都還未準備好。
而這也印證了 Scott Alexander 和 Daniel Kokotajlo 在對談中反復強調的那句話:
AI 的進化不會等我們準備好,它只會以自己的節奏繼續向前。
這是一種令人不安但必須正視的現實。
在這個由大模型主導的時代,“技術爆炸”不再以發布會為信號,不再等待媒體的焦點,而是發生在模型內部的某次能力躍遷、某條管線的打通,甚至只是一次 prompt 策略的微調中。
而 GPT-5 的“推遲”,也許正是這樣一次臨界點的佐證:
它意味著,技術本身已率先越過拐點;
它意味著,產業節奏正在全面重構;
它意味著,我們以為“還有時間”的那種安全感,正在消失。
從 David Anthony 的語言直覺,到語言模型尚未突破的研究味覺,從 Scott 的“信息重組”能力,到 Daniel 提出的“研發三階段”模型,我們看到了一個清晰的趨勢線:
AI 并不神秘,它只是開始“像我們一樣思考”,但“比我們更快完成”。
而一旦它掌握了研究權、實驗權、產業權、節奏權——它將不再是人類的工具,而是塑造未來的生產力本身。
:GPT-5 的暫停,不是終點,而是我們一次準備的窗口。看懂它,或許你就看懂了未來 10 年最關鍵的拐點。
星標公眾號, 點這里 1. 點擊右上角 2. 點擊"設為星標" ← AI深度研究員 ? ← 設為星標
參考資料:https://www.youtube.com/watch?v=htOvH12T7mU&t=4595s
來源:官方媒體/網絡新聞
排版:Atlas
編輯:深思
主編: 圖靈
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.