網易首頁 > 網易號 > 正文申請入駐

炸裂！OpenAI Pro 級圖像 API 降臨

2025-04-24 10:04:06　來源: AI寒武紀

江蘇舉報

分享至

OpenAI 深夜放大招！GPT-4o原生圖像生成 API 正式開放，高清、可控、強編輯！

一句話形容：這是比web端更Pro的版本！

API換了一個新名字叫gpt-image-1，這意味著，之前在 ChatGPT 里讓無數人驚艷的圖像生成能力，現在可以被全球開發者集成到自己的應用和工作流里了

但是：要使用gpt-image-1，開發者需要先完成 [組織驗證，僅支持OpenAI官方支持的國家和地區驗證]

根據OpenAI的說法上個月 ChatGPT 圖像功能剛推出時，第一周就有 1.3 億用戶創作了超過 7 億張圖片。這次 API 開放的gpt-image-1，正是驅動 ChatGPT 圖像體驗的那個原生多模態模型

下面我給給大家詳細解讀一下這個API

API 版有啥不一樣？

相比 ChatGPT 版本，API 版給了開發者更多精細控制的選項：

審核敏感度可調：通過moderation參數（可選auto默認或low低限制）控制內容過濾的嚴格程度

平衡質量與速度：可以指定quality（low,medium,high,auto）來權衡生成速度和圖像細節

輸出定制化：支持指定圖像尺寸（1024x1024方形,1024x1536豎版,1536x1024橫版,auto默認）、輸出格式（png,jpeg,webp）、壓縮率（jpeg/webp可設 0-100%），甚至背景透明(background: 'transparent')！這對需要 P 圖、做素材的場景簡直是福音（透明背景建議medium或high質量）

gpt-image-1核心優勢：

? 高保真、更準確：圖像質量和細節表現出色
視覺風格多樣：能駕馭多種藝術風格
?? 精準圖像編輯：強大的編輯能力
豐富世界知識：能理解并運用現實世界知識創作
?? 文字渲染更強：在圖像中準確渲染文字的能力有顯著提升。

生態合作：已有多家大廠和初創在用

OpenAI 展示了眾多合作伙伴的早期應用案例，覆蓋創意工具、電商、教育、企業軟件、游戲等領域：

創意設計：Adobe (Firefly, Express)、Figma、Canva 都在集成，讓用戶直接在工具內生成、編輯圖像，調整風格、增刪物體、擴展背景等

adobe：

Figma：

營銷與內容創作：Airtable 助力營銷團隊管理素材工作流；HubSpot 探索生成營銷/銷售資料；OpusClip Thumbnail 為 YouTube 創作者生成定制化縮略圖；GoDaddy 嘗試生成 Logo、去背景、生成社媒帖子

Airtable：

OpusClip：

效率工具：Gamma 每天生成超 500 萬張 AI 圖片用于演示和網站；Wix 將其集成到 AI 設計平臺 Wixel

Gamma：

Wix：

電商：Photoroom 利用它推出 Product Beautifier、Product Staging 等工具，幫賣家快速生成專業商品圖、場景圖

虛擬形象與視頻：HeyGen 用它增強虛擬人編輯；InVideo 用它改進視頻中的文字生成和編輯控制

知識平臺：Quora 將gpt-image-1設為默認圖像模型，提升平臺圖像質量

生活服務：Instacart 測試用它生成食譜和購物清單的圖片

API 核心功能一覽

目前圖像生成主要通過Images API提供（未來會支持Responses API）：

圖像生成 (Generations)：根據文本提示從零生成圖像。可設置n一次生成多張

圖像編輯 (Edits)：

a.基于參考圖生成：可傳入一張或多張現有圖片作為參考，結合提示生成新圖（例如，提供幾個單品圖，生成包含這些單品的禮品籃圖）

b.局部修改 (Inpainting)：上傳原圖和一張蒙版圖 (mask)，蒙版的透明區域會被根據提示重新繪制，黑色區域保持不變。注意：prompt需要描述完整的最終圖像，而非僅修改區域。蒙版圖需與原圖尺寸格式一致，且帶 Alpha 通道

模型選擇：

雖然 API 也支持 DALL·E 2 (支持 Variations 功能) 和 DALL·E 3 (高質量)，但 OpenAI推薦使用gpt-image-1，因為它在指令遵循、文字渲染、細節編輯和利用世界知識方面更勝一籌。

成本

gpt-image-1按 Token 計費，分為三部分：

【文本輸入 Token : $5 / 1M tokens】

【圖像輸入 Token (用于編輯的參考圖)|: $10 / 1M tokens|】

【圖像輸出 Token (生成的圖像): $40 / 1M tokens】

實際換算下來，生成一張方形圖的大致成本：

? Low Quality: 約 $0.02 (272 tokens)
? Medium Quality: 約 $0.07 (1056 tokens)
? High Quality: 約 $0.19 (4160 tokens),人民幣超過1元了

不同尺寸和質量的 Token 數不同，具體可查閱文檔。成本與圖像尺寸、質量成正比

局限性提醒

雖然強大，gpt-image-1仍有一些需注意的限制：

延遲：復雜提示可能需要長達 2 分鐘處理

文字渲染：雖有改進，但精確放置和清晰度仍可能遇到挑戰

一致性：跨多代生成保持角色或品牌元素的一致性有時會困難

構圖控制：對于需要精確布局的場景，模型可能難以完全按指令放置元素

體驗及圖像生成指南

前往 [Playground]

https://platform.openai.com/playground) 體驗

另外OpenAI提供了詳細的API 圖像生成指南

https://platform.openai.com/docs/guides/image-generation?image-generation-model=gpt-image-1

one more thing

Sam Altman 親自發話：Plus 用戶速率翻倍！

就在大家消化圖像 API 消息的同時，OpenAI CEO Sam Altman 又在 X 上宣布了一個好消息：

"我們已將 ChatGPT Plus 訂閱用戶的 o3和 o4-mini-high 的速率限制提高了一倍。盡情享用吧！我們確實在努力聽取反饋！"

他還提到，這背后是在速率限制、新功能發布和延遲之間做的艱難權衡，并表示 "GPU 正在路上，希望情況會變得更好"

參考：

https://openai.com/index/image-generation-api/

?星標AI寒武紀，好內容不錯過?

用你的贊和在看告訴我～

求贊

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.