OpenAI 內部模型曝光:編程能力躋身全球 Top50 程序員年底不再有人類對手
除了 o1 / o3,OpenAI 另一個尚未公開的內部推理模型曝光了。爆料者正是 CEO 阿爾特曼本人。
據他透露,與全球頂尖程序員相比,當前這一內部模型的編程能力已達 Top50,甚至今年年底將排名第一。
而且針對大家近來尤為關注的算力問題,他更是直言:
在內部,我們已經達到了 GPT 4.5,而達到 GPT 5.5 并不需要 100 倍以上的計算能力。
除此之外,也是在東京大學的這場對話活動中,阿爾特曼由 AI 對教育的影響引出了更多話題,包括 AI 時代需要何種人才,以及一系列對內部模型進展的爆料。
這場對話由東京大學的校長(Teruo Fujii)和執行副校長(Kaori Hayashi,女)主持,OpenAI 首席產品官 Kevin Weil陪同阿爾特曼參加。
期間,他們暢談了 AI 的應用和未來,并和學生進行了面對面問答。
以下為重點內容整理 & 摘錄。
內部模型已達 GPT 4.5,升級成 5.5 不再需要 100 倍算力升級
主持人簡短開場后,活動由學生提問開啟。
談及AI 對教育的影響以及未來這一領域的發展,阿爾特曼直言教育是 OpenAI 最關注的幾個領域之一。
目前已經能看到 ChatGPT 如何為學生提供各種輔助,未來類似 AI 工具只是改變了環境和部分人類習慣,對于人類來說可能是一種解放,不用過于擔心 AI 會改變一切。
另外,由于科學發現可能呈現 10~100 倍增速,由 AI 推動的生產力進步可能極大促進社會發展。
接下來副校長也提了一個問題,AI 時代需要怎樣的人才和技能?
對此阿爾特曼回應稱,顯然人類現在已經很難在數學、編程等具體任務中優于 AI,因此圍繞弄清楚人們需要什么,去培養個人的開創性視野、快速適應能力等也就更加重要。
Kevin 總結了一個更簡單的辦法,從現在開始將 AI 用起來,將之融入工作生活。一旦遇到新問題,嘗試用 AI 解決,以此逐漸跟上 AI 發展的步伐。
隨后,有學生提到了算力進化問題,如果擁有 100 倍計算能力,可以期望 GPT 具有哪些新特性?
阿爾特曼稱,GPT 系列代表了曾經的一個范式,專注預訓練部分,GPT 1、2、3、4 的每一次升級都大致意味著 100 倍算力升級,隨之也產生了更強的能力。
目前內部模型已經達到 GPT 4.5 水平,照舊范式推測,達到 GPT 5.5 也需要 100 倍算力升級。然而,隨著 o1 系列推理模型取得新突破,一種令人難以置信的新計算效率誕生了。
這也意味著類似升級不再需要 100 倍算力,通過強化學習等技術我們也能得到更強的模型能力。
之后阿爾特曼梳理了 OpenAI 在推理模型上取得的一系列進展,按網友總結下來就是:
編程能力上,o1 排名為 9800;僅過去幾個月,o3 將排名拉到第 175 位;如今一個內部模型在基準測試中排名約為 TOP50,而且年底就能直接登頂。
“我們希望朝著開源前進”
接下來,阿爾特曼談到了更多未來計劃。
o3 的發布已經為未來 6~12 個月的研究點明了方向,OpenAI 將盡可能推動小型、功能強大且速度極快的推理模型,同時也會繼續推進 GPT 6/7 等。
過程中,他著重 cue 到了 OpenAI 最近向 Pro 用戶推出的“深度研究”(Deep Research)功能,這是一個使用推理來綜合大量在線信息并為用戶完成多步驟研究任務的智能體,能幫助用戶進行深入、復雜的信息查詢與分析。
在他看來,OpenAI 一大重點也是發布更多此類智能體,而且夢想之一是搞一個編程智能體。
總之,今年的主線任務是,到年底能夠有一個模型,即便用戶問出非常難的問題,它也能在運行并思考幾小時后準確作答。
然后看點來了,基于中國 DeepSeek 選擇開源后廣受好評這一事實,有學生當面提問:
是否有計劃重新考慮開源?
阿爾特曼這次倒是很干脆,直接承認“我們將這樣做”,“我們希望朝著開源前進”。
但是(沒錯有一個但是),目前不知道開源什么,也不知道應該選擇什么時候開源。
在這之后,阿爾特曼又回答了對腦機接口、太空工程和 AI 機器人等前沿科技的看法。
雖然眾所周知他和馬斯克不對付,但他這次竟然直言:
“(像 Neuralink 這樣的)腦機接口公司是自己過去 6 個月見過的最有趣的!”
本文來自微信公眾號:量子位(ID:QbitAI),作者:一水,原標題《OpenAI 內部模型曝光!編程能力躋身全球 Top50 程序員,年底不再有人類對手》
為偉大思想而生!
AI+時代,互聯網思想(wanging0123),
第一必讀自媒體
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.