網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

與GPT4o圖像生成共創(chuàng)24小時(shí)：AI或許不是讓人更強(qiáng)，而是讓工具消失

2025-03-27 07:42:55　來(lái)源: AI深度研究員

上海舉報(bào)

分享至

（關(guān)注公眾號(hào)設(shè)為標(biāo)，獲取AI深度洞察）

全文3,000字 | 閱讀約12 分鐘

（文中配圖都由GPT-4o生成，目前輸出中文）

網(wǎng)上的這段評(píng)測(cè)引起了我的共鳴："GPT-4o在面對(duì)圖像時(shí)不僅能看出情緒，還能結(jié)合環(huán)境提供更多判斷，同時(shí)處理速度也比前代快得多。"更有趣的是，國(guó)外Hacker News論壇上的用戶們也分享了如何通過(guò)與GPT-4o簡(jiǎn)單對(duì)話實(shí)現(xiàn)復(fù)雜的創(chuàng)意任務(wù)，例如"改變繪圖風(fēng)格"或執(zhí)行"把白天變成夜晚"、"給他戴上帽子"等操作，這些在傳統(tǒng)設(shè)計(jì)軟件中需要多步驟才能完成的任務(wù)。

多數(shù)專業(yè)評(píng)測(cè)關(guān)注GPT-4o的技術(shù)規(guī)格和性能提升，而我更想了解這項(xiàng)技術(shù)如何改變?nèi)伺c工具的關(guān)系。在過(guò)去的48小時(shí)里，我沉浸在與GPT-4o圖像生成功能的深度交互中，不斷思考一個(gè)問(wèn)題：AI工具的終極形態(tài)是什么？隨著界面越來(lái)越簡(jiǎn)化，學(xué)習(xí)成本越來(lái)越低，我們是否正在進(jìn)入一個(gè)工具本身變得"隱形"的新時(shí)代？而GPT-4o的圖像生成功能，或許讓我們窺見(jiàn)了這一進(jìn)化的終點(diǎn)：工具不再需要被學(xué)習(xí)，它理解我們，而非我們理解它。

一、技術(shù)的跨越
告別碎片化工作流

在GPT-4o之前，創(chuàng)意工作者的數(shù)字工作流程通常是分散且復(fù)雜的。設(shè)計(jì)一張海報(bào)可能需要在Photoshop中處理圖像，在Illustrator中創(chuàng)建矢量元素，再用InDesign進(jìn)行排版，每個(gè)步驟都需要專業(yè)知識(shí)和技巧。而AI圖像生成初期，我們?nèi)匀恍枰脑O(shè)計(jì)提示詞，了解不同模型的特性，甚至通過(guò)插件和自定義工作流程來(lái)獲得滿意的結(jié)果。

GPT-4o原生圖像生成功能的出現(xiàn)徹底改變了這一切。這個(gè)模型不再需要調(diào)用獨(dú)立的DALL-E來(lái)處理圖像生成，而是由同一個(gè)神經(jīng)網(wǎng)絡(luò)原生處理各種模態(tài)的內(nèi)容。當(dāng)我第一次使用它時(shí)，我驚訝地發(fā)現(xiàn)自己不再需要思考提示詞的結(jié)構(gòu)或參數(shù)，只需用自然語(yǔ)言描述我的想法，GPT-4o就能理解我的意圖并生成相應(yīng)的圖像。更令人震撼的是，我可以在對(duì)話中隨意修改、調(diào)整圖像，整個(gè)創(chuàng)作過(guò)程變得如此流暢，就像與一位理解我創(chuàng)意構(gòu)想的助手對(duì)話一樣。

文字渲染的突破性進(jìn)展

GPT-4o在圖像中文字渲染方面的進(jìn)步尤為顯著。模型采用了全新的自我回歸方法，從左到右、從上到下依次生成圖像，大大提高了文字的準(zhǔn)確性和連貫性。用戶測(cè)試發(fā)現(xiàn)GPT-4o不僅能看出圖像中的情緒，還能結(jié)合人物所處環(huán)境和著裝，提供更多的判斷信息。更令人驚喜的是，它展現(xiàn)了令人驚嘆的跨語(yǔ)言能力，例如能在用戶輸入中文提示詞的情況下，直接將圖片中的德語(yǔ)翻譯成中文。這一技術(shù)突破意味著設(shè)計(jì)師可以直接生成包含準(zhǔn)確文字的海報(bào)、廣告或信息圖表，無(wú)需后期在其他軟件中調(diào)整文字。

當(dāng)我嘗試生成一張帶有產(chǎn)品說(shuō)明的營(yíng)銷圖像時(shí)，GPT-4o不僅精確地呈現(xiàn)了文字內(nèi)容，還自動(dòng)調(diào)整了字體和排版以匹配整體設(shè)計(jì)風(fēng)格，這種集成體驗(yàn)令人印象深刻。

二、工具簡(jiǎn)化與專業(yè)重構(gòu)

"之前看過(guò)個(gè)設(shè)計(jì)師說(shuō)只要AI生成的圖像還沒(méi)有圖層，設(shè)計(jì)師飯碗就穩(wěn)得很，現(xiàn)在看來(lái)設(shè)計(jì)師飯碗要炸了。"這句在社交媒體上流傳的話語(yǔ)道出了許多創(chuàng)意專業(yè)人士的憂慮。圖層是專業(yè)設(shè)計(jì)軟件的核心功能，也是設(shè)計(jì)師對(duì)自己工作的專業(yè)把控的象征。然而，GPT-4o雖然尚未提供圖層功能，但它在對(duì)話式的圖像修改上表現(xiàn)出的強(qiáng)大能力已經(jīng)開(kāi)始動(dòng)搖這一看似堅(jiān)固的壁壘。

當(dāng)我向GPT-4o描述"將海報(bào)背景從白天改為黃昏，同時(shí)保持前景人物清晰"這樣的復(fù)雜修改要求時(shí)，它能夠完美執(zhí)行，而無(wú)需我手動(dòng)分離圖層或使用蒙版。這種能力意味著傳統(tǒng)設(shè)計(jì)工具中許多復(fù)雜的操作可能很快就會(huì)被簡(jiǎn)單的自然語(yǔ)言指令所取代。GPT-4o在處理多個(gè)物體之間關(guān)系的能力上有了質(zhì)的飛躍，可以同時(shí)維護(hù)15-20個(gè)物體的屬性，準(zhǔn)確把握它們之間的位置、大小和顏色關(guān)系。

然而，這并不意味著設(shè)計(jì)師這一職業(yè)將完全消失。相反，設(shè)計(jì)師的角色可能會(huì)轉(zhuǎn)變?yōu)閯?chuàng)意引導(dǎo)者和策略思想家，專注于概念發(fā)展和品牌敘事，而將執(zhí)行層面的工作交給AI助手完成。正如一位資深設(shè)計(jì)師在論壇中評(píng)論的："我們不應(yīng)該把自己定義為Photoshop的操作者，而應(yīng)該是視覺(jué)問(wèn)題的解決者。"

三、用戶體驗(yàn)的革命
交互范式轉(zhuǎn)變

在使用GPT-4o之前，我們習(xí)慣了"人適應(yīng)工具"的交互模式——學(xué)習(xí)軟件界面，記憶快捷鍵，適應(yīng)工具的邏輯和限制。但GPT-4o帶來(lái)了一種全新的交互范式："工具理解人"。相比GPT-4，GPT-4o處理速度明顯加快，平均響應(yīng)時(shí)間從約5秒減少到僅320毫秒，這種實(shí)時(shí)互動(dòng)的體驗(yàn)極大地提升了創(chuàng)作流程的自然度。

當(dāng)我說(shuō)"制作一張關(guān)于未來(lái)城市的海報(bào)"時(shí)，GPT-4o不僅生成了一張未來(lái)城市的圖像，還自動(dòng)添加了適當(dāng)?shù)臉?biāo)題和排版元素。當(dāng)我表示希望畫(huà)面更加科技感時(shí)，它立即調(diào)整了色調(diào)和元素，而不需要我詳細(xì)解釋"科技感"意味著什么樣的視覺(jué)語(yǔ)言。這種直覺(jué)式的交互大大降低了創(chuàng)意表達(dá)的門(mén)檻，使非專業(yè)人士也能快速實(shí)現(xiàn)自己的創(chuàng)意構(gòu)想。

創(chuàng)意新模式

GPT-4o不僅是一個(gè)執(zhí)行指令的工具，更是一個(gè)能夠提供創(chuàng)意輸入的協(xié)作伙伴。在測(cè)試過(guò)程中，當(dāng)我向它描述一個(gè)模糊的創(chuàng)意概念時(shí)，它不僅能夠可視化我的想法，還會(huì)主動(dòng)提出改進(jìn)建議或替代方案，這種雙向交流使創(chuàng)作過(guò)程變得更加豐富和充滿可能性。實(shí)際使用中，用戶可以進(jìn)行有趣的互動(dòng)，例如要求它繪制一個(gè)空白的井字游戲，然后讓它下第一步棋，接著用戶下一步，如此往復(fù)。還可以進(jìn)行信息保持的轉(zhuǎn)換，如改變繪圖風(fēng)格，或者執(zhí)行"把白天變成夜晚"、"給他戴上帽子"等指令。這種靈活的交互方式，使創(chuàng)意過(guò)程變得更加直觀和自然。

四、內(nèi)容價(jià)值的重構(gòu)
技術(shù)門(mén)檻的消失

GPT-4o最革命性的影響可能在于它極大地降低了創(chuàng)意表達(dá)的技術(shù)門(mén)檻。以往，制作一張專業(yè)海報(bào)需要多年的設(shè)計(jì)軟件學(xué)習(xí)和實(shí)踐，而現(xiàn)在，任何人都可以通過(guò)自然語(yǔ)言描述獲得接近專業(yè)水準(zhǔn)的視覺(jué)作品。

"人類從會(huì)使用工具的動(dòng)物進(jìn)化到只需要思考的存在。"這句話精準(zhǔn)地概括了這一變化的本質(zhì)。當(dāng)工具不再需要專門(mén)的學(xué)習(xí)和掌握，創(chuàng)意的核心就回歸到了思想和概念本身。這種民主化趨勢(shì)既擴(kuò)大了創(chuàng)意表達(dá)的可能性，也模糊了專業(yè)與業(yè)余的界限。

專業(yè)價(jià)值的重新定義

"復(fù)雜工程化注定會(huì)被模型碾碎，但被摧毀的只是表層的技術(shù)壁壘，而非創(chuàng)造的本質(zhì)。"隨著AI工具的發(fā)展，創(chuàng)意專業(yè)人士需要重新思考自己的價(jià)值所在。技術(shù)操作能力不再是稀缺資源，那么什么才是AI難以取代的核心競(jìng)爭(zhēng)力？答案可能在于更深層次的創(chuàng)意思維、文化理解、策略洞察和人際溝通能力。

一位資深創(chuàng)意總監(jiān)在行業(yè)論壇中寫(xiě)道："AI可以生成海報(bào)，但它無(wú)法理解品牌的歷史脈絡(luò)，無(wú)法感知文化趨勢(shì)的微妙變化，也無(wú)法與客戶建立情感連接和信任。這些都是設(shè)計(jì)師需要培養(yǎng)的新核心能力。“

五、工具簡(jiǎn)化的終極方向

從技術(shù)演進(jìn)的角度看，所有領(lǐng)域的發(fā)展都遵循著"由繁入簡(jiǎn)"的規(guī)律。從命令行到圖形界面，從手工編碼到可視化開(kāi)發(fā)，再到如今的自然語(yǔ)言驅(qū)動(dòng)——技術(shù)的真正成熟不是通過(guò)增加復(fù)雜性，而是通過(guò)消解復(fù)雜性來(lái)實(shí)現(xiàn)的。

GPT-4o原生圖像生成功能正是這一規(guī)律的最新體現(xiàn)。那些我曾引以為傲的復(fù)雜工作流程——精心調(diào)教的提示詞、層層疊加的插件、環(huán)環(huán)相扣的模型鏈——如今都被一個(gè)簡(jiǎn)單對(duì)話界面所取代。這不是技術(shù)的倒退，而是技術(shù)真正走向成熟的標(biāo)志。"manus的歸宿也是如此，不知道哪來(lái)這么多人吹"——這句網(wǎng)絡(luò)評(píng)論反映了一些人對(duì)手工技藝消失的擔(dān)憂。確實(shí)，隨著技術(shù)的發(fā)展，許多傳統(tǒng)技能可能會(huì)被自動(dòng)化所取代。然而，歷史告訴我們，技術(shù)革新不會(huì)消滅創(chuàng)造力，只會(huì)改變它的表現(xiàn)形式。

六、創(chuàng)新的新起點(diǎn)

當(dāng)復(fù)雜的工具被簡(jiǎn)化，當(dāng)技術(shù)門(mén)檻被消解，人類創(chuàng)造力的表達(dá)將迎來(lái)前所未有的可能性。GPT-4o原生圖像生成功能不僅是AI技術(shù)的一次進(jìn)步，更是創(chuàng)意表達(dá)方式的一次范式轉(zhuǎn)變。從產(chǎn)品思維角度看，這代表了人機(jī)交互的本質(zhì)轉(zhuǎn)變：從"人適應(yīng)工具"到"工具理解人"。對(duì)創(chuàng)意行業(yè)的專業(yè)人士而言，這是一個(gè)既充滿機(jī)遇又充滿挑戰(zhàn)的時(shí)刻。復(fù)雜工程化注定會(huì)被模型碾碎，但被摧毀的只是表層的技術(shù)壁壘，而非創(chuàng)造的本質(zhì)。

站在技術(shù)與創(chuàng)意交匯的十字路口，我們不禁思考：當(dāng)工具變得如此智能和易用，人類創(chuàng)造力的下一個(gè)前沿在哪里？也許答案就在于我們對(duì)意義和美的獨(dú)特感知，以及對(duì)文化和情感的深刻理解——這些正是AI尚無(wú)法完全復(fù)制的領(lǐng)域。

在這個(gè)新時(shí)代，真正的挑戰(zhàn)不再是掌握復(fù)雜工具，而是提出正確的問(wèn)題，表達(dá)獨(dú)特的視角，創(chuàng)造有意義的內(nèi)容。正如一位設(shè)計(jì)師所言："當(dāng)每個(gè)人都能使用AI創(chuàng)作，創(chuàng)意的價(jià)值將不再取決于你使用了什么工具，而是取決于你內(nèi)心有什么獨(dú)特的東西想要表達(dá)。"

也許，這正是技術(shù)發(fā)展的終極意義——不是取代人類創(chuàng)造力，而是將我們從工具的束縛中解放出來(lái)，讓我們能夠更純粹地追求創(chuàng)意本身。當(dāng)我們站在GPT-4o這樣的技術(shù)肩膀上眺望未來(lái)，我們看到的不是創(chuàng)意的終結(jié)，而是創(chuàng)新的新起點(diǎn)。

星標(biāo)公眾號(hào)，點(diǎn)這里 1. 點(diǎn)擊右上角 2. 點(diǎn)擊"設(shè)為星標(biāo)" ← AI深度研究員 ? ← 設(shè)為星標(biāo)

參考資料：https://www.morganstanley.com/insights/articles/ai-trends-reasoning-frontier-models-2025-tmt

來(lái)源：官方媒體/網(wǎng)絡(luò)新聞

排版：Atlas

編輯：深思

主編: 圖靈

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.