新智元報道
編輯:桃子 犀牛
【新智元導讀】代碼截圖泄露,滿血版o3、o4-mini鎖定下周!更勁爆的是,一款據稱是OpenAI的神秘模型一夜爆紅,每日處理高達260億token,是Claude用量4倍。奧特曼在TED放話:將推超強開源模型,直面DeepSeek挑戰。
近了,近了!
全網多個流出的代碼截圖顯示,滿血版o3、o4-mini,以及o4-mini high,有極大概率在下周發布。
不僅如此,在OpenRouter平臺上,一款神秘模型Optimus Alpha(ELO得分1387)直接霸榜,據稱就是o4-mini。
另一款Quasar模型也殺入競技場TOP 5,奧特曼對其亮眼的表現做出了回應
這款模型最大亮點在于,上下文長達100萬token,一舉超越了Claude 3.7 Sonnet。
更令人震驚的是,OpenRouter數據顯示,Optimus Alpha才上線沒幾天一夜爆紅,每日處理token數量高達260億。
另一邊,OpenAI正在為開源模型做準備,上周內部召開討論會,邀請了AI社區大佬提建議。
在TED最新對談中,奧特曼再次回應了DeepSeek,「我們正在開發一款強大且媲美頂尖LLM的開源模型」。
不論是o4系的發布,還是OpenAI開源模型登場,都足以讓AI圈興奮一段時間了。
o4系模型出世,直接霸榜?
大佬Matthew Berman從更多公開測試的蛛絲馬跡中,發現了神秘模型Optimus Alpha的一些亮點。
卓越的多文件協同處理能力
出眾的設計美學感知
對復雜系統的直覺式理解
閃電般的響應速度
自如切換抽象層級的能力
在Aider多語言編程方面,可與o3-mini-medium、Grok 3相媲美,拿下53%的分數。
創意寫作v3基準上,它甚至擊敗了Gemini 2.5 Pro,ELO得分1320.8。另外,在SQL的生成上,平均得分為0.830,其中80%為滿分。
可以明確的是,新模型專為編程和技術任務構建。在SQL查詢生成、Web開發和系統設計方面的性能,均超過了任何公開可用的工具。
比如,在Roo Code社區中,Optimus Alpha使用量已是Claude模型的4倍,深受廣大開發者歡迎。
在編碼測試中,Matthew給出一個簡單的指令——為我創建一個帶有功能購物車的電子商務網站。
Optimus Alpha便智能地設計出完整的UI界面,還制作出了「抽屜式購物車」,要知道大多數AI都會失敗。
再比如,一次性生成貪吃蛇游戲。
Optimus Alpha可以做到自定義漸變色用于貪吃蛇,深綠色的頭部可便于視覺區分。
而且,簡潔直觀的操控界面,完整的游戲機制,都印證了其編碼能力的強大。
最關鍵的是,代碼生成速度令人驚嘆,這體驗就像隨時召喚一位世界頂級工程師。
更強的o4系模型已預定,那么關于開源模型,OpenAI又有怎樣的規劃呢?
不如,一起看看TED大會上,奧特曼如何回應的AI開源競賽,以及關于當前爆火GPT-4o生圖、AI下一個突破、對就業創造力影響。
GPT-4o承包創意工作,人類怎么辦?
周五,奧特曼現身溫哥華TED大會現場,與TED負責人Chris Anderson進行了一場深入的對談。
對談一開始,Anderson用最近爆火的Sora生圖功能生成了一張圖片,圖片中奧特曼正向他分享著驚人的信息。
Anderson表示這圖畫的還不錯,至少是個B+。接著他又展示了一張圖片,這次他讓Sora描繪一下智能和意識的區別。
這張圖真的讓Anderson感到震驚了,因為這顯然不只是圖像的生成,它似乎理解了你想要什么。
對此奧特曼表示,這個圖像生成的功能是GPT-4o的一部分,包含里面的所有智能。
「這也是為什么它能做出這些讓人驚嘆的事情。」
面對如此智能的AI,Anderson不禁問奧特曼,「我的未來該怎么辦?」。
奧特曼說人們對此有兩種看法。一種是「天啊,它把我做的事全干了,我該咋辦?」。
而另一種是「每次技術革命都這樣」,新的工具能提升人的能力,讓人做的更多。
「所以適應起來應該不難。」
這時,Anderson突然冒出一句:「這會不會是個版權問題啊?」
觀眾哄堂大笑,現場還夾雜著掌聲。看來大家都對這個問題很感興趣。
奧特曼的回應是,如果藝術家愿意把自己的風格授權給別人用,那么可以為他們設計分成機制。
也就是說,未來不只是「版權」問題這么簡單了,「風格」也將會成為重要的車資產。
不過,真正棘手的,在海量的AI作品面前,要怎么區分「靈感借鑒」和「抄襲模仿」呢?
OpenAI將推最強開源LLM
Anderson問奧特曼,DeepSeek的出現有沒有讓你有點慌?
奧特曼認為開源很重要。就在昨晚,他們還在開會討論開源模型的參數和方向。
OpenAI正打算開源一款非常強大的模型,性能比現在所有的開源模型都要好。
奧特曼還強調了一下,雖然他們在開源方面行動的有點晚,但他們會做的很好。
雖然DeepSeek勢頭迅猛,但并沒有影響ChatGPT的增長速度。
「我從來沒見過任何一家公司有這種增長速度。ChatGPT的增長簡直瘋狂!」奧特曼表示。
根據上次公布的數據,OpenAI每周有5億的活躍用戶,而且還在飛速增長。
奧特曼還提到了新的「記憶」功能。模型會慢慢了解你,陪你走過人生的不同階段。
他希望OpenAI能繼續保持專注,做出這個領域里最頂尖的產品。
AI雙突破,2年研究半天搞定
奧特曼預計AI將在兩個方向上有重大的突破。
首先是在科學領域。
奧特曼說他相信科學發現是讓人們生活越來越好的最重要推動力。有了新發現,我們就能用更少的資源做更多的事,把「可能」的邊界往外推。
OpenAI最新的模型已經開始讓科學家們興奮了,他們的效率比以前高得多。
借助AI工具,很快會開始看到在對抗疾病方面的一些實質性進展。
至于物理學,奧特曼說可能需要更長時間,但很期待。
另一個重要方向是軟件開發。
奧特曼說未來幾個月,這個領域就會發生翻天覆地的變化。
他說一些工程師現在一個下午就能完成以前兩年才能做完的工作!
對于外界的一些傳聞,奧特曼說他們并沒有偷偷藏著有意識的模型,以及能自我改進的模型。
奧特曼還對他們模型的安全性很有信心。
「有人會說各種事情,但現在全球大概有10%的人正在使用我們的系統,我們對自己的安全記錄非常驕傲。」
他還透露,OpenAI已經準備好了一旦發現危險就迅速叫停的機制。
這就是一個不斷試錯的過程:把系統推向現實世界,在風險還相對可控的時候收集反饋,發現問題,然后解決。
ChatGPT不是AGI
奧特曼說ChatGPT還不能算是AGI,因為它還不能自己持續學習、提升。
它也沒辦法在自己不擅長的領域主動變強,自主地探索新科學、更新知識庫。
甚至還不能像人類一樣坐在電腦前完成各種知識型工作。
對于到底什么是AGI這個問題,奧特曼直接講了個笑話:「你把10個OpenAI的研究員關一個屋子里,讓他們定義AGI,估計能整出14個不同的答案。」
目前都沒有個統一的說法。
所以比起「AGI啥時候來」,更重要的是認識到我們正處在AI能力指數級增長的曲線上。
你可以說「這是我眼中的AGI」,別人可以說「超級智能在那兒」,但不管咋樣,我們都得面對這個超級厲害的系統帶來的好處,同時想辦法讓它安全。
整場近一小時對談中,奧特曼其他的一些精彩觀點:
要盯緊AI智能體的安全問題。
奧特曼分享成為父親對他個人產生了深遠的影響,他否認了AI會對他的孩子未來構成風險,但也承認有更大的責任去塑造一個對孩子有積極影響的世界。
奧特曼還描述了一個未來,AI將比他的孩子更聰明,但他認為這是一個好事。持續的創新、豐富的資源和智能AI將會無縫融入日常生活,未來一代人將會覺得當前人們又辛苦又落后。
參考資料:
https://x.com/TheMattBerman/status/1910813233008509191
https://www.youtube.com/watch?v=5MWT_doo68k
https://x.com/FutureJurvetson/status/1910820537783423078
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.