OpenAI全量開放GPT-4o圖像生成能力,這回免費用戶第一時間上車!
即日起在ChatGPT和Sora中,向所有Plus、Pro、Team和免費用戶推出。
一夜之間,各種實測結果刷屏。最驚艷的莫過于對文本的處理能力。
比如,4o可以100%還原文字內容,且指定文字擺放位置。
男人右手舉著“a few”,左手舉著“words”
還能像連續劇一樣,一邊準確生成文字,一邊變換人物動作。
仔細對比兩張圖,第一張白板中的男人倒影和第二張圖也對應上了。
昨晚OpenAI突然宣布要開個小直播發布,這回奧特曼出現了(前情:GPT-4.5發布時他由于帶娃沒來)。
直播中展示了各種玩法,比如制作梗圖、文本渲染、多輪交互生成和指令遵循等。
直接現場咔嚓一張自拍,然后立馬轉成動漫風格。
順帶官方玩梗制作meme圖,要求在圖片中添加“feel the agi”。(沒錯,生成時還知道將小寫換成更符合的大寫)
現在,打開ChatGPT,即可嘗試這些能力。
實測生成速度很快(大約十幾秒一張),但普通用戶每天僅有3次體驗機會。
API預計將在未來幾周內逐步推出。
這波主打一個美觀又實用
我們終于邁向了這種真正集成的多模態模型。
按照官方介紹,作為多模態模型的4o現在終于補齊了一塊重要拼圖——圖片生成。
而且主打一個美觀和實用兩手抓。
話不多說,我們直接來看其能力升級的具體表現。
各項能力大升級
首先,OpenAI表示4o現在能精確融合符號和圖片了。
比如直接給一段文字,然后生成一張制作精美的菜單:
而且支持在多輪對話中逐步調整圖片內容和風格。
類似下面這樣,提供一張貓貓原圖,然后一步步創建一個游戲角色:
此外還非常注重細節,官方稱4o可以處理多達10-20個不同的物體,而其他模型一般在處理5-8個物體時就會遇到困難。
除了上述,4o在生成真實圖像方面也表現出色。
連現實版“照貓畫虎”也有了(doge):
網友實測ing
看完官方宣傳效果,網友們也趕緊來了一波實測~
經典梗圖第一時間申請出戰,畫面還真毫無違和感hhh。
甚至,復現同款書寫圖也是不在話下:
One More Thing
話說最近這兩天也過于熱鬧了,DeepSeek、OpenAI和谷歌幾乎同臺開戰。
值得一提的是,昨晚11點(北京時間)OpenAI突然宣布將有小發布,而DeepSeek剛剛發布了DeepSeek-v3-0324的官方技術報告。
不知道是不是被DS逼出來的新發布呢?(doge)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.