今天凌晨,OpenAI 開啟 12 月直播的第一天,直接拋出兩大更新:
①滿血(正式版)o1 模型正式上線;
② 可無限使用o1 模型的Pro 訂閱計劃,開啟!
接下來,我們?yōu)榇蠹以敿毥榻B這兩大更新。
滿血 o1 模型
相比于preview 版本,滿血(正式版) o1 模型無疑更為強大:
√滿血 o1 在數(shù)學、代碼和博士級科學問題上,獲得大幅提升;
√滿血版模型推理速度更快,比 preview 快了 60%;
√滿血 o1 增加了多模態(tài)推理功能。
要知道,在推理能力上,o1-preview 已經(jīng)是迄今為止的最強模型,而滿血 o1,則更進一步!
具體的差別,我們看一下官方演示:
首先,滿血版 o1(左)和o1-preview(右)現(xiàn)場競速↓
同一個問題:列出二世紀的羅馬皇帝,包括他們的統(tǒng)治時期和成就。
滿血 o1耗時14 秒完成作答;
o1-preview耗時33 秒完成作答。
綜合團隊多次離線測試,最終得出結(jié)論:滿血 o1 平均響應(yīng)速度比 o1-preview 快 60%。
同時,經(jīng)過一整套人類評估測試,OpenAI 團隊還發(fā)現(xiàn):滿血版 o1 在推理時犯重大錯誤的頻率比 o1-preview 少了34%。
滿血 o1 的另一大亮點是:支持多模態(tài)輸入,具備視覺推理能力,OpenAI 團隊也進行了現(xiàn)場展示↓
他們拿出一張畫著數(shù)據(jù)中心草圖的 A4 紙,拍照上傳后開啟測試。提示詞翻譯后如下↓
“這里展示了一個高度簡化的太空數(shù)據(jù)中心示意圖。對于任何簡化的假設(shè),請?zhí)峁├碛伞?/p>
”你的任務(wù)是估算這個托管GPU的數(shù)據(jù)中心所需的散熱器表面積的下限。在此過程中,還需要回答以下問題:
“你如何處理太陽和深空?
”熱力學第一定律如何發(fā)揮作用?“
僅僅 10 秒鐘,o1 就給出了答案。
測試時:OpenAI 團隊特意給 o1 模型挖了個坑——故意省略了其中一個參數(shù),以此來測試模型面對模糊問題的處理能力。
令人驚艷的是,滿血 o1 不僅選擇了正確的參數(shù)范圍,還通過進一步的細致論證最終找出了準確參數(shù)。
Pro 訂閱計劃
Pro 計劃是 OpenAI 在 Plus 計劃基礎(chǔ)上的一個升級版本,給人的第一個感覺是——貴!
最新的 Pro 權(quán)限需要支付200美元/月,折合成人民幣需要1450元/月。
我們具體來看一下 Pro 計劃有哪些特色功能:
①Pro 計劃可以無限制訪問OpenAI o1、o1-mini、GPT-4o 和 Advanced Voice;
②Pro 計劃有一個專屬模型——o1 pro。
o1 pro使用更多的計算來更深入地思考,并為最困難的問題提供更好的答案。
如果使用更嚴格的測試標準,模型必須在4次回答中每一次都回答正確,而不僅僅是答對一次。
那么 o1 Pro 模式的性能更恐怖,在數(shù)學方面是 o1-preview 的一倍,代碼是其 2 倍。
接下來 OpenAI 還有 11 天的直播,我們也會持續(xù)分享。
最值得期待的 GPT-5 獵戶座會放出來嗎?讓我們拭目以待。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.