OpenAI 深夜放大招!GPT-4o原生圖像生成 API 正式開放,高清、可控、強編輯!
一句話形容:這是比web端更Pro的版本!
API換了一個新名字叫gpt-image-1
,這意味著,之前在 ChatGPT 里讓無數人驚艷的圖像生成能力,現在可以被全球開發者集成到自己的應用和工作流里了
但是:要使用gpt-image-1
,開發者需要先完成 [組織驗證,僅支持OpenAI官方支持的國家和地區驗證]
根據OpenAI的說法上個月 ChatGPT 圖像功能剛推出時,第一周就有 1.3 億用戶創作了超過 7 億張圖片。這次 API 開放的gpt-image-1
,正是驅動 ChatGPT 圖像體驗的那個原生多模態模型
下面我給給大家詳細解讀一下這個API
API 版有啥不一樣?
相比 ChatGPT 版本,API 版給了開發者更多精細控制的選項:
審核敏感度可調:通過moderation
參數(可選auto
默認 或low
低限制)控制內容過濾的嚴格程度
平衡質量與速度:可以指定quality
(low
,medium
,high
,auto
)來權衡生成速度和圖像細節
輸出定制化:支持指定圖像尺寸(1024x1024
方形,1024x1536
豎版,1536x1024
橫版,auto
默認)、輸出格式(png
,jpeg
,webp
)、壓縮率(jpeg
/webp
可設 0-100%),甚至背景透明(background: 'transparent'
)!這對需要 P 圖、做素材的場景簡直是福音(透明背景建議medium
或high
質量)
gpt-image-1
核心優勢:
? 高保真、更準確:圖像質量和細節表現出色
視覺風格多樣:能駕馭多種藝術風格
?? 精準圖像編輯:強大的編輯能力
豐富世界知識:能理解并運用現實世界知識創作
?? 文字渲染更強:在圖像中準確渲染文字的能力有顯著提升。
生態合作:已有多家大廠和初創在用
OpenAI 展示了眾多合作伙伴的早期應用案例,覆蓋創意工具、電商、教育、企業軟件、游戲等領域:
創意設計:Adobe (Firefly, Express)、Figma、Canva 都在集成,讓用戶直接在工具內生成、編輯圖像,調整風格、增刪物體、擴展背景等
adobe:
Figma:
營銷與內容創作:Airtable 助力營銷團隊管理素材工作流;HubSpot 探索生成營銷/銷售資料;OpusClip Thumbnail 為 YouTube 創作者生成定制化縮略圖;GoDaddy 嘗試生成 Logo、去背景、生成社媒帖子
Airtable:
OpusClip:
效率工具:Gamma 每天生成超 500 萬張 AI 圖片用于演示和網站;Wix 將其集成到 AI 設計平臺 Wixel
Gamma:
Wix:
電商:Photoroom 利用它推出 Product Beautifier、Product Staging 等工具,幫賣家快速生成專業商品圖、場景圖
虛擬形象與視頻:HeyGen 用它增強虛擬人編輯;InVideo 用它改進視頻中的文字生成和編輯控制
知識平臺:Quora 將gpt-image-1
設為默認圖像模型,提升平臺圖像質量
生活服務:Instacart 測試用它生成食譜和購物清單的圖片
API 核心功能一覽
目前圖像生成主要通過Images API
提供(未來會支持Responses API
):
圖像生成 (Generations):根據文本提示 從零生成圖像。可設置n
一次生成多張
圖像編輯 (Edits):
a.基于參考圖生成:可傳入一張或多張現有圖片 作為參考,結合提示生成新圖(例如,提供幾個單品圖,生成包含這些單品的禮品籃圖)
b.局部修改 (Inpainting):上傳原圖和一張蒙版圖 (mask
),蒙版的透明區域會被根據提示重新繪制,黑色區域保持不變。注意:prompt
需要描述完整的最終圖像,而非僅修改區域。蒙版圖需與原圖尺寸格式一致,且帶 Alpha 通道
模型選擇:
雖然 API 也支持 DALL·E 2 (支持 Variations 功能) 和 DALL·E 3 (高質量),但 OpenAI推薦使用gpt-image-1
,因為它在指令遵循、文字渲染、細節編輯和利用世界知識方面更勝一籌。
成本
gpt-image-1
按 Token 計費,分為三部分:
【文本輸入 Token : $5 / 1M tokens】
【圖像輸入 Token (用于編輯的參考圖)|: $10 / 1M tokens|】
【圖像輸出 Token (生成的圖像): $40 / 1M tokens】
實際換算下來,生成一張方形圖的大致成本:
? Low Quality: 約 $0.02 (272 tokens)
? Medium Quality: 約 $0.07 (1056 tokens)
? High Quality: 約 $0.19 (4160 tokens),人民幣超過1元了
不同尺寸和質量的 Token 數不同,具體可查閱文檔。成本與圖像尺寸、質量成正比
局限性提醒
雖然強大,gpt-image-1
仍有一些需注意的限制:
延遲:復雜提示可能需要長達 2 分鐘處理
文字渲染:雖有改進,但精確放置和清晰度仍可能遇到挑戰
一致性:跨多代生成保持角色或品牌元素的一致性有時會困難
構圖控制:對于需要精確布局的場景,模型可能難以完全按指令放置元素
體驗及圖像生成指南
前往 [Playground]
https://platform.openai.com/playground) 體驗
另外OpenAI提供了詳細的API 圖像生成指南
https://platform.openai.com/docs/guides/image-generation?image-generation-model=gpt-image-1
one more thing
Sam Altman 親自發話:Plus 用戶速率翻倍!
就在大家消化圖像 API 消息的同時,OpenAI CEO Sam Altman 又在 X 上宣布了一個好消息:
"我們已將 ChatGPT Plus 訂閱用戶的 o3和 o4-mini-high 的速率限制提高了一倍。盡情享用吧!我們確實在努力聽取反饋!"
他還提到,這背后是在速率限制、新功能發布和延遲之間做的艱難權衡,并表示 "GPU 正在路上,希望情況會變得更好"
參考:
https://openai.com/index/image-generation-api/
?星標AI寒武紀,好內容不錯過?
用你的贊和在看告訴我~
求贊
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.