來源: 新智元
【導(dǎo)讀】o3-mini深夜降臨,OpenAI終于亮出了最新的底牌。在Reddit AMA問答中,奧特曼深刻懺悔在開源AI上,自己站錯了隊。他表示,內(nèi)部正在考慮開源策略,繼續(xù)研發(fā)模型,但OpenAI領(lǐng)先優(yōu)勢不會像以前那么大了。當(dāng)所有人還在驚嘆DeepSeek的驚人實力時,OpenAI終于坐不住了。
昨夜凌晨,o3-mini緊急上線,在數(shù)學(xué)代碼等基準(zhǔn)測試中刷新SOTA,重回王座。
最關(guān)鍵的是,免費用戶也可以體驗!
o3-mini實力可不是吹的,在「人類最后一次考試」中,o3-mini(high)直接在準(zhǔn)確率和校準(zhǔn)誤差(Calibration Error)均是最優(yōu)。
o3-mini上線幾小時后,OpenAI官方開啟了Reddit AMA大約1小時左右的在線問答。
奧特曼本人也上線,回答了網(wǎng)友們的一切問題。
主要精彩亮點有:
DeepSeek的確很優(yōu)秀,我們也會繼續(xù)研發(fā)更好的模型,但領(lǐng)先優(yōu)勢不會像以前那么大了
比起幾年前,我現(xiàn)在更傾向于認(rèn)為AI可能會出現(xiàn)快速突飛猛進
在開源權(quán)重AI模型這個問題上,我們站錯了隊
高級語音模式即將迎來更新,我們會直接稱它為GPT-5,而不是GPT-5o,目前還沒有具體的時間表。
除了奧特曼本人,首席研究官Mark Chen、首席產(chǎn)品官Kevin Weil、工程副總Srinivas Narayanan、API研究負(fù)責(zé)人Michelle Pokrass、研究負(fù)責(zé)人Hongyu Ren也一同在線,認(rèn)真回答了網(wǎng)友們所有問題。
接下來,讓我們一起看看他們都說了什么。
奧特曼深刻懺悔,在開源AI上站錯了隊
DeepSeek突然逆襲,或許是所有人都沒有想到的。
在AMA問答中,奧特曼本人也深深懺悔自己在開源AI上站錯了隊,不得不承認(rèn)DeepSeek的強大優(yōu)勢。
讓許多人驚嘆不已的是,奧特曼竟然說出,OpenAI領(lǐng)先優(yōu)勢不如以往。
以下所有,是我們匯總的奧特曼的經(jīng)典回答。
Q:讓我們來談?wù)劚局艿闹卮笤掝}:Deepseek。顯然這是一個非常令人印象深刻的模型,我也知道它可能是在其他LLM的輸出基礎(chǔ)上訓(xùn)練的。這會如何改變你們對未來模型的計劃?
奧特曼:它確實是一個非常好的模型!我們會開發(fā)出更好的模型,但我們不會像往年那樣保持那么大的領(lǐng)先優(yōu)勢了。
Q:你認(rèn)為遞歸式自我改進會是一個漸進的過程,還是一個突然起飛的過程?
奧特曼:我個人認(rèn)為,比起幾年前,我現(xiàn)在更傾向于認(rèn)為AI可能會出現(xiàn)快速突飛猛進。可能是時候就這個話題寫點東西了...
Q:我們能看到模型思考的所有token嗎?
奧特曼:是的,我們很快就會展示一個更有幫助、更詳細(xì)的版本。感謝R1提供的更新信息。
首席產(chǎn)品官Kevin Weil:我們正在努力展示比現(xiàn)在更多的內(nèi)容——這將很快實現(xiàn)。至于是否展示所有內(nèi)容還有待確定,展示所有思維鏈(CoT)會導(dǎo)致競爭對手的模型蒸餾,但我們也知道用戶(至少是高級用戶)想要看到這些,所以我們會找到一個合適的平衡點。
Q:滿血版o3什么時候上線?
奧特曼:我估計會超過幾周,但不會超過幾個 月。
Q:語音模式會有更新嗎?這是否是潛在的GPT-5o關(guān)注的重點?GPT-5o的大致時間表是什么?
奧特曼:是的,高級語音模式的更新即將到來!我想我們會直接稱它為GPT-5,而不是GPT-5o。目前還沒有具體的時間表。
Q:你會考慮發(fā)布一些模型權(quán)重,并發(fā)表一些研究嗎?
奧特曼:是的,我們正在討論。我個人認(rèn)為,在這個問題上我們站錯了隊,需要想出一個不同的開源策略;不是OpenAI的每個人都持有這種觀點,而且這也不是我們目前的最高優(yōu)先級。
再來一個問題彈:
我們距離在常規(guī)Plus計劃中提供Operator還有多遠(yuǎn)?
機器人部門的首要目標(biāo)是什么?
OpenAI如何看待更專業(yè)的芯片/TPU,比如Trillium、Cerebras等?OpenAI是否在關(guān)注這方面?
投資什么來對沖AGI和ASI未來的風(fēng)險?
你最難忘的假期是什么?
奧特曼:
幾個月
先小規(guī)模生產(chǎn)一個真正優(yōu)秀的機器人,從中學(xué)習(xí)經(jīng)驗
GB200目前很難被超越!
一個好的選擇是提升自己的內(nèi)在狀態(tài)——韌性、適應(yīng)力、平靜、快樂等
很難選擇!但首先想到的兩個是:在東南亞背包旅行或者非洲野生動物園之旅
Q:你是否計劃對Plus系列產(chǎn)品進行提價?
奧特曼:實際上我想逐漸減少。
Q:假設(shè)現(xiàn)在是2030年,你們剛剛創(chuàng)造了一個大多數(shù)人會稱之為AGI的系統(tǒng)。它在所有測試基準(zhǔn)上都表現(xiàn)出色,而且在速度和性能上都超過了你們最優(yōu)秀的工程師和研究人員。接下來怎么辦?除了「把它放到網(wǎng)站上提供服務(wù)」之外,還有其他計劃嗎?
奧特曼:在我看來,最重要的影響將是加速科學(xué)發(fā)現(xiàn)的速度,我認(rèn)為這是對提高生活質(zhì)量貢獻最大的因素。
4o圖像生成,快來了
接下來,補充的是其他OpenAI成員的回應(yīng)。
Q:你們還打算推出4o圖像生成器嗎?
首席產(chǎn)品官Kevin Weil:是的!我們正在努力。而且我認(rèn)為等待是值得的。
Q:太好了!有大致的時間表嗎?
首席產(chǎn)品官Kevin Weil:你這是想讓我惹麻煩啊。可能幾個月吧。
還有一個類似的問題。
Q:我們什么時候可以看到ChatGPT-5?
首席產(chǎn)品官Kevin Weil:就在o-17 micro和GPT-(π+1)之后不久。
又是一個問題彈:
我們還可以期待什么其他類型的智能體?
也為免費用戶提供一個智能體,這樣可以加快采用率...
關(guān)于新版DALL·E有什么更新嗎?
最后一個問題,也是每個人都會問的...AGI什么時候?qū)崿F(xiàn)?
首席產(chǎn)品官Kevin Weil:
關(guān)于更多智能體:非常非常快就來了。我想你會滿意的。
基于4o的圖像生成:大約幾個月后,我迫不及待想讓你們用上。它很棒。
AGI:是的
Q:你們是否計劃在推理模型中添加文件附件功能?
工程副總Srinivas Narayanan:正在開發(fā)中。未來推理模型將能夠使用不同的工具,包括檢索功能。
首席產(chǎn)品官Kevin Weil:只是想說,我迫不及待想看到能使用工具的推理模型了 :)
Q:真的。當(dāng)你解決這個問題時,一些非常有用的AI應(yīng)用場景就會被打開。想象一下,它能夠理解你500GB的工作文檔內(nèi)容。
當(dāng)你準(zhǔn)備回復(fù)一封郵件時,在你的郵件應(yīng)用旁邊會打開一個面板,持續(xù)分析與這個人相關(guān)的所有信息,包括你們的關(guān)系、討論的主題、過去的工作等等。也許某個你早已遺忘的文檔中的內(nèi)容會被標(biāo)記出來,因為它與當(dāng)前的討論非常相關(guān)。我太想要這個功能了。
工程副總Srinivas Narayanan:我們正在努力增加上下文長度。還沒有明確的日期/公告。
Q:「星際之門」項目對于OpenAI未來來說,有多重要?
首席產(chǎn)品官Kevin Weil:非常重要。我們所看到的一切都表明,我們擁有的計算能力越多,就能構(gòu)建越好的模型,也就能制造出越有價值的產(chǎn)品。
我們現(xiàn)在正在同時在兩個維度上擴展模型——更大規(guī)模的預(yù)訓(xùn)練,以及更多的強化學(xué)習(xí)(RL)/「草莓」訓(xùn)練——這兩者都需要計算資源。
為數(shù)億用戶提供服務(wù)也需要計算資源!而且隨著我們轉(zhuǎn)向更多能持續(xù)為你工作的智能代理產(chǎn)品,這也需要計算資源。所以你可以把「星際之門」看作是我們的工廠,將電力/GPU轉(zhuǎn)化為令人驚嘆的產(chǎn)品的地方。
Q:在內(nèi)部,你們現(xiàn)在用的是哪個模型?o4、o5還是o6?與o3相比,這些內(nèi)部模型的智能程度提高了多少?
API研究負(fù)責(zé)人Michelle Pokrass:我們已經(jīng)數(shù)不清了。
Q:請允許我們在使用高級語音功能的同時與文本/畫布進行交互。我希望能夠?qū)χf話,讓它對文檔進行迭代修改。
首席產(chǎn)品官Kevin Weil:是的!我們有很多不錯的工具是相對獨立開發(fā)的——目標(biāo)是讓這些工具盡快交到你手中。
下一步是整合所有這些功能,這樣你就可以與一個模型對話,它在搜索的同時進行推理,并生成一個可以運行Python的畫布。所有工具都需要更好地協(xié)同工作。另外順便說一下,所有模型都需要完整的工具使用能力(o系列模型目前還不能使用所有工具),這個也會實現(xiàn)的。
Q:o系列模型什么時候會支持ChatGPT中的記憶功能?
API研究負(fù)責(zé)人Michelle Pokrass:正在開發(fā)中!將我們所有的功能與o系列模型統(tǒng)一起來是我們的首要任務(wù)。
Q:4o是否會有重大改進?我真的很喜歡自定義GPT,如果它能夠升級就太棒了,或者如果我們能夠在自定義GPT中選擇使用什么模型(比如o3 mini)就更好了。
API研究負(fù)責(zé)人Michelle Pokrass:是的,我們還沒有完成4o系列!
參考資料:
https://www.reddit.com/r/OpenAI/comments/1ieonxv/ama_with_openais_sam_altman_mark_chen_kevin_weil/
為偉大思想而生!
AI+時代,互聯(lián)網(wǎng)思想(wanging0123),
第一必讀自媒體
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.