奧特曼公開深刻懺悔：在開源AI上，我們錯了！DeepSeek讓OpenAI優(yōu)勢不再，下一個是GPT-5

2025-02-02 00:03:48　來源: 互聯(lián)網(wǎng)思想

廣東舉報

分享至

來源：新智元

【導(dǎo)讀】o3-mini深夜降臨，OpenAI終于亮出了最新的底牌。在Reddit AMA問答中，奧特曼深刻懺悔在開源AI上，自己站錯了隊。他表示，內(nèi)部正在考慮開源策略，繼續(xù)研發(fā)模型，但OpenAI領(lǐng)先優(yōu)勢不會像以前那么大了。當(dāng)所有人還在驚嘆DeepSeek的驚人實力時，OpenAI終于坐不住了。

昨夜凌晨，o3-mini緊急上線，在數(shù)學(xué)代碼等基準(zhǔn)測試中刷新SOTA，重回王座。

最關(guān)鍵的是，免費用戶也可以體驗！

o3-mini實力可不是吹的，在「人類最后一次考試」中，o3-mini（high）直接在準(zhǔn)確率和校準(zhǔn)誤差（Calibration Error）均是最優(yōu)。

o3-mini上線幾小時后，OpenAI官方開啟了Reddit AMA大約1小時左右的在線問答。

奧特曼本人也上線，回答了網(wǎng)友們的一切問題。

主要精彩亮點有：

DeepSeek的確很優(yōu)秀，我們也會繼續(xù)研發(fā)更好的模型，但領(lǐng)先優(yōu)勢不會像以前那么大了
比起幾年前，我現(xiàn)在更傾向于認(rèn)為AI可能會出現(xiàn)快速突飛猛進
在開源權(quán)重AI模型這個問題上，我們站錯了隊
高級語音模式即將迎來更新，我們會直接稱它為GPT-5，而不是GPT-5o，目前還沒有具體的時間表。

除了奧特曼本人，首席研究官Mark Chen、首席產(chǎn)品官Kevin Weil、工程副總Srinivas Narayanan、API研究負(fù)責(zé)人Michelle Pokrass、研究負(fù)責(zé)人Hongyu Ren也一同在線，認(rèn)真回答了網(wǎng)友們所有問題。

接下來，讓我們一起看看他們都說了什么。

奧特曼深刻懺悔，在開源AI上站錯了隊

DeepSeek突然逆襲，或許是所有人都沒有想到的。

在AMA問答中，奧特曼本人也深深懺悔自己在開源AI上站錯了隊，不得不承認(rèn)DeepSeek的強大優(yōu)勢。

讓許多人驚嘆不已的是，奧特曼竟然說出，OpenAI領(lǐng)先優(yōu)勢不如以往。

以下所有，是我們匯總的奧特曼的經(jīng)典回答。

Q：讓我們來談?wù)劚局艿闹卮笤掝}：Deepseek。顯然這是一個非常令人印象深刻的模型，我也知道它可能是在其他LLM的輸出基礎(chǔ)上訓(xùn)練的。這會如何改變你們對未來模型的計劃？

奧特曼：它確實是一個非常好的模型！我們會開發(fā)出更好的模型，但我們不會像往年那樣保持那么大的領(lǐng)先優(yōu)勢了。

Q：你認(rèn)為遞歸式自我改進會是一個漸進的過程，還是一個突然起飛的過程？

奧特曼：我個人認(rèn)為，比起幾年前，我現(xiàn)在更傾向于認(rèn)為AI可能會出現(xiàn)快速突飛猛進。可能是時候就這個話題寫點東西了...

Q：我們能看到模型思考的所有token嗎？

奧特曼：是的，我們很快就會展示一個更有幫助、更詳細(xì)的版本。感謝R1提供的更新信息。

首席產(chǎn)品官Kevin Weil：我們正在努力展示比現(xiàn)在更多的內(nèi)容——這將很快實現(xiàn)。至于是否展示所有內(nèi)容還有待確定，展示所有思維鏈（CoT）會導(dǎo)致競爭對手的模型蒸餾，但我們也知道用戶（至少是高級用戶）想要看到這些，所以我們會找到一個合適的平衡點。

Q：滿血版o3什么時候上線？

奧特曼：我估計會超過幾周，但不會超過幾個月。

Q：語音模式會有更新嗎？這是否是潛在的GPT-5o關(guān)注的重點？GPT-5o的大致時間表是什么？

奧特曼：是的，高級語音模式的更新即將到來！我想我們會直接稱它為GPT-5，而不是GPT-5o。目前還沒有具體的時間表。

Q：你會考慮發(fā)布一些模型權(quán)重，并發(fā)表一些研究嗎？

奧特曼：是的，我們正在討論。我個人認(rèn)為，在這個問題上我們站錯了隊，需要想出一個不同的開源策略；不是OpenAI的每個人都持有這種觀點，而且這也不是我們目前的最高優(yōu)先級。

再來一個問題彈：

我們距離在常規(guī)Plus計劃中提供Operator還有多遠(yuǎn)？
機器人部門的首要目標(biāo)是什么？
OpenAI如何看待更專業(yè)的芯片/TPU，比如Trillium、Cerebras等？OpenAI是否在關(guān)注這方面？
投資什么來對沖AGI和ASI未來的風(fēng)險？
你最難忘的假期是什么？

奧特曼：

幾個月
先小規(guī)模生產(chǎn)一個真正優(yōu)秀的機器人，從中學(xué)習(xí)經(jīng)驗
GB200目前很難被超越！
一個好的選擇是提升自己的內(nèi)在狀態(tài)——韌性、適應(yīng)力、平靜、快樂等
很難選擇！但首先想到的兩個是：在東南亞背包旅行或者非洲野生動物園之旅

Q：你是否計劃對Plus系列產(chǎn)品進行提價？

奧特曼：實際上我想逐漸減少。

Q：假設(shè)現(xiàn)在是2030年，你們剛剛創(chuàng)造了一個大多數(shù)人會稱之為AGI的系統(tǒng)。它在所有測試基準(zhǔn)上都表現(xiàn)出色，而且在速度和性能上都超過了你們最優(yōu)秀的工程師和研究人員。接下來怎么辦？除了「把它放到網(wǎng)站上提供服務(wù)」之外，還有其他計劃嗎？

奧特曼：在我看來，最重要的影響將是加速科學(xué)發(fā)現(xiàn)的速度，我認(rèn)為這是對提高生活質(zhì)量貢獻最大的因素。

4o圖像生成，快來了

接下來，補充的是其他OpenAI成員的回應(yīng)。

Q：你們還打算推出4o圖像生成器嗎？

首席產(chǎn)品官Kevin Weil：是的！我們正在努力。而且我認(rèn)為等待是值得的。

Q：太好了！有大致的時間表嗎？

首席產(chǎn)品官Kevin Weil：你這是想讓我惹麻煩啊。可能幾個月吧。

還有一個類似的問題。

Q：我們什么時候可以看到ChatGPT-5？

首席產(chǎn)品官Kevin Weil：就在o-17 micro和GPT-(π+1)之后不久。

又是一個問題彈：

我們還可以期待什么其他類型的智能體？
也為免費用戶提供一個智能體，這樣可以加快采用率...
關(guān)于新版DALL·E有什么更新嗎？
最后一個問題，也是每個人都會問的...AGI什么時候?qū)崿F(xiàn)？

首席產(chǎn)品官Kevin Weil：

關(guān)于更多智能體：非常非常快就來了。我想你會滿意的。
基于4o的圖像生成：大約幾個月后，我迫不及待想讓你們用上。它很棒。
AGI：是的

Q：你們是否計劃在推理模型中添加文件附件功能？

工程副總Srinivas Narayanan：正在開發(fā)中。未來推理模型將能夠使用不同的工具，包括檢索功能。

首席產(chǎn)品官Kevin Weil：只是想說，我迫不及待想看到能使用工具的推理模型了 :)

Q：真的。當(dāng)你解決這個問題時，一些非常有用的AI應(yīng)用場景就會被打開。想象一下，它能夠理解你500GB的工作文檔內(nèi)容。

當(dāng)你準(zhǔn)備回復(fù)一封郵件時，在你的郵件應(yīng)用旁邊會打開一個面板，持續(xù)分析與這個人相關(guān)的所有信息，包括你們的關(guān)系、討論的主題、過去的工作等等。也許某個你早已遺忘的文檔中的內(nèi)容會被標(biāo)記出來，因為它與當(dāng)前的討論非常相關(guān)。我太想要這個功能了。

工程副總Srinivas Narayanan：我們正在努力增加上下文長度。還沒有明確的日期/公告。

Q：「星際之門」項目對于OpenAI未來來說，有多重要？

首席產(chǎn)品官Kevin Weil：非常重要。我們所看到的一切都表明，我們擁有的計算能力越多，就能構(gòu)建越好的模型，也就能制造出越有價值的產(chǎn)品。

我們現(xiàn)在正在同時在兩個維度上擴展模型——更大規(guī)模的預(yù)訓(xùn)練，以及更多的強化學(xué)習(xí)（RL）/「草莓」訓(xùn)練——這兩者都需要計算資源。

為數(shù)億用戶提供服務(wù)也需要計算資源！而且隨著我們轉(zhuǎn)向更多能持續(xù)為你工作的智能代理產(chǎn)品，這也需要計算資源。所以你可以把「星際之門」看作是我們的工廠，將電力/GPU轉(zhuǎn)化為令人驚嘆的產(chǎn)品的地方。

Q：在內(nèi)部，你們現(xiàn)在用的是哪個模型？o4、o5還是o6？與o3相比，這些內(nèi)部模型的智能程度提高了多少？

API研究負(fù)責(zé)人Michelle Pokrass：我們已經(jīng)數(shù)不清了。

Q：請允許我們在使用高級語音功能的同時與文本/畫布進行交互。我希望能夠?qū)χf話，讓它對文檔進行迭代修改。

首席產(chǎn)品官Kevin Weil：是的！我們有很多不錯的工具是相對獨立開發(fā)的——目標(biāo)是讓這些工具盡快交到你手中。

下一步是整合所有這些功能，這樣你就可以與一個模型對話，它在搜索的同時進行推理，并生成一個可以運行Python的畫布。所有工具都需要更好地協(xié)同工作。另外順便說一下，所有模型都需要完整的工具使用能力（o系列模型目前還不能使用所有工具），這個也會實現(xiàn)的。

Q：o系列模型什么時候會支持ChatGPT中的記憶功能？

API研究負(fù)責(zé)人Michelle Pokrass：正在開發(fā)中！將我們所有的功能與o系列模型統(tǒng)一起來是我們的首要任務(wù)。

Q：4o是否會有重大改進？我真的很喜歡自定義GPT，如果它能夠升級就太棒了，或者如果我們能夠在自定義GPT中選擇使用什么模型（比如o3 mini）就更好了。

API研究負(fù)責(zé)人Michelle Pokrass：是的，我們還沒有完成4o系列！

參考資料：

https://www.reddit.com/r/OpenAI/comments/1ieonxv/ama_with_openais_sam_altman_mark_chen_kevin_weil/

為偉大思想而生！

AI+時代，互聯(lián)網(wǎng)思想（wanging0123)，

第一必讀自媒體

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.