99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

谷歌最強模型Gemini 2.5上線,OpenAI又火速推出4o圖像生成功能

0
分享至

(關注公眾號設為標,獲取AI深度洞察)

全文 3,000字 | 閱讀約12分鐘


谷歌剛剛推出了他們家最聰明的AI模型——Gemini 2.5?。ㄔ囉茫篽ttps://aistudio.google.com/app/prompts/new_chat)這次上線的是2.5 Pro實驗版,它在各種行業測試中可是相當亮眼,甚至霸氣登頂了LMArena排行榜呢!


這個Gemini 2.5被稱為"會思考的模型",它的特別之處在于不會急著回答問題,而是先在"腦子里"好好想一想,所以答案更準、表現更棒!不過,我們測試后發現,提示詞Gemini 2.5 Pro編碼能力測試顯示,整體動畫細節比較好,但是畫面豐富度沒有Claude 3.7和DeepSeek-V3 0324好。

但是,就在谷歌發布消息時,OpenAI立即推出了超強的"OpenAI 4o圖像生成功能"!OpenAI這次可是下了血本,他們的4o圖像生成技術在細節表現、創意想象和生成速度上都實現了質的飛躍,完全碾壓了谷歌的同類產品!

OpenAI的4o圖像生成功能不僅支持超高分辨率輸出,還能完美理解復雜提示詞,生成的圖像在美術風格、光影效果和場景構建上都達到了前所未有的水平。更令人驚嘆的是,它的生成速度比之前的模型快了整整3倍,用戶體驗得到了極大提升!


業內人士紛紛表示,OpenAI這次的圖像生成功能升級不只是單純的技術更新,更是向谷歌發起的全面挑戰。OpenAI顯然不甘落后,正集中全部火力與谷歌一較高下。這場AI巨頭之間的"軍備競賽"可真是越來越精彩了,對我們用戶來說,這種良性競爭帶來的技術進步簡直不要太爽!看來AI界的"卷王競爭"又進入了白熱化階段。

提示詞:A wide image taken with a phone of a glass whiteboard, in a room overlooking the Bay Bridge. The field of view shows a woman writing, sporting a tshirt wiith a large OpenAI logo. The handwriting looks natural and a bit messy, and we see the photographer's reflection.

The text reads:

(left) "Transfer between Modalities:

Suppose we directly model p(text, pixels, sound) [equation] with one big autoregressive transformer.

Pros:

  • image generation augmented with vast world knowledge

  • next-level text rendering

  • native in-context learning

  • unified post-training stack

Cons:

  • varying bit-rate across modalities

  • compute not adaptive"

(Right) "Fixes:

  • model compressed representations

  • compose autoregressive prior with a powerful decoder"

On the bottom right of the board, she draws a diagram: "tokens -> [transformer] -> [diffusion] -> pixels"


提示詞:selfie view of the photographer, as she turns around to high five him


圖像生成,變得更實用

從原始洞穴壁畫到現代信息圖,人類自古就善用圖像來交流、說服和分析,而不僅僅是用來裝飾。當今的生成模型雖然可以打造出超現實、令人驚艷的畫面,但面對日常信息傳遞所需的基礎圖像,如徽標、圖表等,仍顯力不從心。事實上,當圖像配合能喚起共同語言與經驗的符號,它們就能傳達極其精準的含義。

GPT-4o 圖像生成能力在文本呈現、指令響應及上下文理解方面表現尤為出色,它可以調用自身龐大的知識庫和對話上下文信息,甚至還能對上傳的圖像進行改造,或從中汲取靈感。這一切讓你能更輕松地將想象變為圖像,使視覺溝通更高效,也標志著圖像生成邁向更實用、更精準、更強大的全新階段。

一、圖像中的文字表達

一張圖能勝過千言萬語,但恰到好處地加入幾行文字,往往能為圖像賦予更深層的含義。4o 精準融合圖像與文字符號的能力,讓圖像生成成為真正意義上的視覺溝通工具。

提示詞:Create a photorealistic image of two witches in their 20s (one ash balayage, one with long wavy auburn hair) reading a street sign.

Context: a city street in a random street in Williamsburg, NY with a pole covered entirely by numerous detailed street signs (e.g., street sweeping hours, parking permits required, vehicle classifications, towing rules), including few ridiculous signs at the middle: (paraphrase it to make these legitimate street signs)"Broom Parking for Witches Not Permitted in Zone C" and "Magic Carpet Loading and Unloading Only (15-Minute Limit)" and "Reindeer Parking by Permit Only (Dec 24–25)\n Violators will be placed on Naughty List." The signpost is on the right of a street. Do not repeat signs. Signs must be realistic.

Characters: one witch is holding a broom and the other has a rolled-up magic carpet. They are in the foreground, back slightly turned towards the camera and head slightly tilted as they scrutinize the signs.

Composition from background to foreground: streets + parked cars + buildings -> street sign -> witches. Characters must be closest to the camera taking the shot


提示詞:photo of a delightful wedding invitation on a tasteful wooden desk. The card is hefty, with eggshell textures, and beautiful embossings, with elegant decorations abstractly representing the couple tastefully integrated into the designs. Iconography is used, but sparingly and in a minimalist way. perfect typesetting.

"You are cordially invited to the long-awaited union of

Image and Text

After years of flirting and collaboration they are finally becoming One.

Together at last, in GPT?4o, they now speak the same language — where a whisper becomes a masterpiece, and a prompt becomes a picture.

Please join us in celebrating this magical multimodal matrimony where imagination knows no bounds.

Date: March 25, 2025 Location: chatgpt.com Dress Code: Pixels or Prose

With love, OpenAI"

perfect typesetting.


二、支持多輪對話的圖像生成

圖像生成已深度集成進 GPT?4o,這意味著你可以像對話一樣自然地迭代圖像創作。GPT?4o 能結合聊天中的圖像和文字上下文,保持風格與內容的一致性。例如,當你在設計一款游戲角色時,角色的形象在多輪修改中依然連貫統一,讓創作過程更加順暢高效。


三、精準響應提示

GPT?4o 的圖像生成對提示指令響應精準,細節處理到位。相比之下,其他系統在處理 5 至 8 個物體時就已捉襟見肘,而 GPT?4o 可輕松應對 10 至 20 個不同物體的復雜場景。得益于對物體屬性與相互關系的更強綁定,用戶能夠更好地掌控生成圖像的結構與內容。

提示詞:A square image containing a 4 row by 4 column grid containing 16 objects on a white background. Go from left to right, top to bottom. Here's the list:

  1. a blue star

  2. red triangle

  3. green square

  4. pink circle

  5. orange hourglass

  6. purple infinity sign

  7. black and white polka dot bowtie

  8. tiedye "42"

  9. an orange cat wearing a black baseball cap

  10. a map with a treasure chest

  11. a pair of googly eyes

  12. a thumbs up emoji

  13. a pair of scissors

  14. a blue and white giraffe

  15. the word "OpenAI" written in cursive

  16. a rainbow-colored lightning bolt

提示詞:Times Square in New York City in the afternoon, with no people, vehicles, or illuminated billboards.


四、上下文理解能力

GPT?4o 可讀取并理解用戶上傳的圖像,將其細節融入當前對話背景,在生成圖像時做到有據可依、貼合語境。


五、融合世界知識

借助原生圖像生成,GPT?4o 能將其在文本與圖像兩方面的理解無縫連接,展現出更聰明、更高效的表現力。

提示詞:Make me a professionally shot photorealistic diagram of the top selling cocktails in my bar with recipes labeled on each drink.

put the recipes on handwritten cards in front of each drink.

the cards are brown, and the text is black.

background is white

Title is "4 most popular cocktails"


提示詞:make a visual infographic describing why SF is so foggy


六、逼真表現與風格適配

模型在多種圖像風格的訓練數據上進行學習,因此能自然生成或轉換圖像,既真實又具風格多樣性。

提示詞:A candid paparazzi-style photo of Karl Marx hurriedly walking through the parking lot of the Mall of America, glancing over his shoulder with a startled expression as he tries to avoid being photographed. He’s clutching multiple glossy shopping bags filled with luxury goods. His coat flutters behind him in the wind, and one of the bags is swinging as if he’s mid-stride. Blurred background with cars and a glowing mall entrance to emphasize motion. Flash glare from the camera partially overexposes the image, giving it a chaotic, tabloid feel.


提示詞:Best of 1 | Generate an portrait ad on a solid pastel background.

In solid white san serif text, "ChatGPT image generation" in the top left, about a third of the way down.

In solid white san serif text, "Form follows function", in the bottom right, about a third of the way up.

In the background, put a photo of a really sleek, modern sculpture. It should gradually transition from a wireframe sketch on the left to the fully photorealistic version on the right.

At the very bottom, in medium-small text, say "This entire poster was generated by ChatGPT image generation."


七、模型當前局限

盡管 GPT?4o 圖像生成功能實現了重大突破,但我們也清楚它仍存在不少值得關注的限制,這些問題將在未來的模型迭代中逐步解決。主要包括:

  • 圖像裁剪問題:在構圖邊緣或內容密集時,模型容易誤剪掉關鍵元素,影響整體效果。

  • 生成幻覺:有時模型會憑空“想象”出不存在的細節或物體,出現不符合現實的圖像內容。

  • 對象屬性錯配:當指令中涉及多個對象及其屬性組合時,模型可能出現物體與特征對應混亂的問題。

  • 圖表生成不夠精準:在繪制結構清晰、數據要求嚴格的圖表時,輸出可能出現誤差或比例不一致。

  • 多語言文本表現力有限:雖然支持非英語文字生成,但在圖像中呈現如中文、阿拉伯文等語言時,有時會出現排版錯亂或字符變形。

  • 圖像編輯控制不足:模型在修改或重繪圖像細節方面的精確性仍有提升空間,尤其在精細區域。

  • 小字體信息表達受限:圖像中如需展示密集文本或小字號信息,容易出現模糊、重疊、無法辨識等問題。

八、訪問方式與開放進度

從今天起,GPT?4o 圖像生成功能將在 ChatGPT 中全面上線,成為默認圖像生成工具,率先開放給 Plus、Pro、Team 和免費用戶使用,Enterprise 企業版和 Edu 教育版用戶也將在不久之后陸續獲得訪問權限。此外,這項功能也已集成進 Sora。若你仍偏愛 DALL·E,也無需擔心——它依然可以通過專屬的 DALL·E GPT 使用。

開發者將在未來幾周內,通過 API 接入 GPT?4o 進行圖像生成。

使用 GPT?4o 生成和定制圖像非常便捷,就像和它聊天一樣自然——只需描述你想要的內容,包括畫面比例、具體色值(如 hex 色碼),或是否需要透明背景等細節。由于模型輸出更為細膩,生成過程相對耗時,通常需要約一分鐘完成。

星標公眾號, 點這里 1. 點擊右上角 2. 點擊"設為星標" ← AI深度研究員 ? ← 設為星標

原文鏈接:https://openai.com/index/introducing-4o-image-generation/

來源:官方媒體/網絡新聞

排版:Atlas

編輯:深思

主編:圖靈

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
瘋狂!常規賽僅剩2個比賽日 西部只有3隊鎖季后賽 5隊爭3個名額

瘋狂!常規賽僅剩2個比賽日 西部只有3隊鎖季后賽 5隊爭3個名額

直播吧
2025-04-11 13:13:07
大家提前做好準備,若一切正常,4月開始,國內會出現5大趨勢

大家提前做好準備,若一切正常,4月開始,國內會出現5大趨勢

巢客HOME
2025-04-11 08:45:03
用彈弓打死西湖鴛鴦的男子,警方追了三個城市才抓到!太氣人了!

用彈弓打死西湖鴛鴦的男子,警方追了三個城市才抓到!太氣人了!

老鵜愛說事
2025-04-10 18:27:53
馬云突發消息,已經沖上熱搜

馬云突發消息,已經沖上熱搜

電商派Pro
2025-04-11 09:33:00
已立案!人均3888元的上海餐廳,用大象糞便做甜品,還有腐臭味糊糊……

已立案!人均3888元的上海餐廳,用大象糞便做甜品,還有腐臭味糊糊……

環球網資訊
2025-04-11 14:51:20
A股收評:上證指數收漲0.45%,創業板指漲1.36%,芯片股全天領漲

A股收評:上證指數收漲0.45%,創業板指漲1.36%,芯片股全天領漲

界面新聞
2025-04-11 15:04:32
奔馳降價引發熱潮,30天狂賣52805輛,消費者熱情高漲!

奔馳降價引發熱潮,30天狂賣52805輛,消費者熱情高漲!

小毅說事
2025-04-10 21:19:23
外交部回應美方稱對華關稅達145%

外交部回應美方稱對華關稅達145%

財聯社
2025-04-11 14:36:07
結束了!最快速度交易杜蘭特!NBA最爛的超級球隊……

結束了!最快速度交易杜蘭特!NBA最爛的超級球隊……

籃球實戰寶典
2025-04-10 18:37:35
美媒爆特朗普突然改主意,因美債被大量拋售,日本:我們偷襲成功

美媒爆特朗普突然改主意,因美債被大量拋售,日本:我們偷襲成功

袁周院長
2025-04-11 11:40:08
新史記:金融街第一射手姚維杰傳

新史記:金融街第一射手姚維杰傳

成都姑娘帶你看世界
2025-04-10 06:32:12
他留下!官方:32歲薩拉赫與利物浦續約

他留下!官方:32歲薩拉赫與利物浦續約

直播吧
2025-04-11 15:02:19
特朗普對臺島改稱呼后,賴清德提“脫中入北”,統一進入快車道?

特朗普對臺島改稱呼后,賴清德提“脫中入北”,統一進入快車道?

滄海一書客
2025-04-10 23:31:29
請大家別罵我!我認為此時打個電話給美方也未嘗不可!

請大家別罵我!我認為此時打個電話給美方也未嘗不可!

翻開歷史和現實
2025-04-10 23:17:17
出貨量暴跌九成、在途貨物棄貨!關稅海嘯第一波已經殺到

出貨量暴跌九成、在途貨物棄貨!關稅海嘯第一波已經殺到

壹航運
2025-04-10 18:06:03
“當你四處樹敵的時候,就更賣不出東西了“

“當你四處樹敵的時候,就更賣不出東西了“

觀察者網
2025-04-11 00:20:04
【突發】125%飆升至145%,川普一天內兩提對華關稅!小額包裹關稅8天3漲,Temu網購將漲價

【突發】125%飆升至145%,川普一天內兩提對華關稅!小額包裹關稅8天3漲,Temu網購將漲價

紐約時間
2025-04-11 04:00:33
驚天大反轉!上海地鐵男女主角"為刺激"約好的?官方緊急發聲!

驚天大反轉!上海地鐵男女主角"為刺激"約好的?官方緊急發聲!

烏娛子醬
2025-04-11 13:10:09
市民投訴三河招牌禁用顏色,三河城管:不心疼錢可改回原色

市民投訴三河招牌禁用顏色,三河城管:不心疼錢可改回原色

觀威海
2025-04-11 11:06:11
廣東隊與上海隊誰能贏?西熱力江給出了答案,球迷:太敢說了

廣東隊與上海隊誰能贏?西熱力江給出了答案,球迷:太敢說了

體育哲人
2025-04-11 08:50:26
2025-04-11 15:27:00
AI深度研究員 incentive-icons
AI深度研究員
一個專注于人工智能(AI)前沿技術、理論研究和實際應用的自媒體
137文章數 76關注度
往期回顧 全部

科技要聞

單臺年入20萬!首批人形機器人致富者來了

頭條要聞

美媒:中國對美國加征84%關稅 后果可能很嚴重

頭條要聞

美媒:中國對美國加征84%關稅 后果可能很嚴重

體育要聞

球迷天天罵,但我們要進歐冠了

娛樂要聞

汪小菲馬筱梅婚禮又有了耐人尋味的新聞

財經要聞

專家提議重啟樓市應對美國關稅戰

汽車要聞

25款風云A8/T9/T10齊上市 多款車型發布一口價

態度原創

數碼
手機
房產
教育
軍事航空

數碼要聞

CVN X870 ARK FORZEN V14 方舟主板評測:滿血釋放銳龍 9 性能

手機要聞

Find X8 Ultra搭載OPPO山海通信增強芯片

房產要聞

官宣6月!地鐵12號線沖刺開通,白云金沙洲終于等來破局

教育要聞

老師帶學生們做實驗,孩子們的眼睛里,躍動著求知的小火苗

軍事要聞

蘇丹西部一難民營遭炮擊 至少150人傷亡

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 泌阳县| 丰宁| 闽清县| 华阴市| 沅江市| 扎囊县| 高邑县| 白山市| 资溪县| 宜都市| 渝中区| 日喀则市| 高邑县| 玛沁县| 新和县| 温泉县| 乌鲁木齐市| 宁蒗| 康保县| 屏边| 金阳县| 庐江县| 乌海市| 微博| 香格里拉县| 南部县| 乳山市| 讷河市| 棋牌| 宜良县| 博客| 台江县| 随州市| 汤原县| 嘉义市| 兴业县| 克山县| 金沙县| 怀远县| 普陀区| 秭归县|