今天凌晨,OpenAI 發(fā)布了一個全新的模型——GPT-4o mini。
并表示:即日起,開放給所有 ChatGPT 用戶。
這里的所有用戶,不僅包括 OpenAI 的付費 Plus、企業(yè)號、Team 賬號,同樣也包括所有的免費賬號。
也就是說,只要你注冊了的 ChatGPT,就可以直接使用最新版的 GPT-4o mini 模型了。
我們用一個免費 ChatGPT 賬號測試了一下,發(fā)現(xiàn)確實如此。
而這也標(biāo)志著,ChatGPT 正式進(jìn)入“4.0”時代。
作為 GPT-3.5 Turbo 的替代品——GPT-4o mini,是 GPT-4o 更小參數(shù)量的簡化版本。
盡管量級小,但功能并不弱。
專業(yè)機(jī)構(gòu)測試后表示:GPT-4o mini 性能比 GPT-4 更好,大約有 GPT-4o 80% 的能力。
01 GPT-4o mini 能力介紹
根據(jù) OpenAI 公布的測試數(shù)據(jù)顯示:
√GPT-4o mini 擁有非常好的數(shù)學(xué)、編碼、視覺等推理能力;
√GPT-4o mini MMLU 得分為82.0%,而谷歌的 Gemini Flash 為77.9%,Anthropic 的 Claude Haiku 為 73.8%;
√在數(shù)學(xué)和編碼方面,GPT-4o mini在 MGSM 測試中得分為87.0%,而 Gemini Flash 為 75.5%,Claude Haiku為 71.7%;
√GPT-4o mini 在衡量編碼性能的 Human Eval上 得分為87.2%,而 Gemini Flash 得分為 71.5%,Claude Haiku 得分為 75.9%。
此外,在多模態(tài)推理 MMMU 中,GPT-4o mini 也表現(xiàn)出色,得分為59.4%,力壓 Gemini Flash 的 56.1%,以及 Claude Haiku 的 50.2%。
尤為顯眼的是,GPT-3.5 Turbo 在這些基準(zhǔn)測試中的得分均不如 GPT-4o mini,甚至可以說被全面碾壓。
甚至,在大模型盲測競技場 LMSYS 中的表現(xiàn)也要優(yōu)于 GPT-4T 01-25。
02 GPT-4o mini Api
除了模型強(qiáng)大之外,GPT-4o mimi 的 Api 價格同樣令人驚喜。
→每百萬輸入tokens,15美分(約1.09元人民幣)
→每百萬輸出tokens,60美分(約4.36元人民幣)
也就是說,GPT-4o mini 創(chuàng)作一本 100 萬字的小說,只需要不到 5 塊錢的價格!
甚至,比 GPT-3.5 Turbo 便宜超過 60%。
OK,今天的分享就到這里。
有 ChatGPT 賬號的小伙伴趕緊去體驗一下吧。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.