(關(guān)注公眾號(hào)設(shè)為標(biāo),獲取AI深度洞察)
全文3,000字 | 閱讀約12 分鐘
(文中配圖都由GPT-4o生成,目前輸出中文)
網(wǎng)上的這段評(píng)測(cè)引起了我的共鳴:"GPT-4o在面對(duì)圖像時(shí)不僅能看出情緒,還能結(jié)合環(huán)境提供更多判斷,同時(shí)處理速度也比前代快得多。"更有趣的是,國(guó)外Hacker News論壇上的用戶們也分享了如何通過(guò)與GPT-4o簡(jiǎn)單對(duì)話實(shí)現(xiàn)復(fù)雜的創(chuàng)意任務(wù),例如"改變繪圖風(fēng)格"或執(zhí)行"把白天變成夜晚"、"給他戴上帽子"等操作,這些在傳統(tǒng)設(shè)計(jì)軟件中需要多步驟才能完成的任務(wù)。
多數(shù)專業(yè)評(píng)測(cè)關(guān)注GPT-4o的技術(shù)規(guī)格和性能提升,而我更想了解這項(xiàng)技術(shù)如何改變?nèi)伺c工具的關(guān)系。在過(guò)去的48小時(shí)里,我沉浸在與GPT-4o圖像生成功能的深度交互中,不斷思考一個(gè)問(wèn)題:AI工具的終極形態(tài)是什么?隨著界面越來(lái)越簡(jiǎn)化,學(xué)習(xí)成本越來(lái)越低,我們是否正在進(jìn)入一個(gè)工具本身變得"隱形"的新時(shí)代?而GPT-4o的圖像生成功能,或許讓我們窺見(jiàn)了這一進(jìn)化的終點(diǎn):工具不再需要被學(xué)習(xí),它理解我們,而非我們理解它。
一、技術(shù)的跨越
告別碎片化工作流
在GPT-4o之前,創(chuàng)意工作者的數(shù)字工作流程通常是分散且復(fù)雜的。設(shè)計(jì)一張海報(bào)可能需要在Photoshop中處理圖像,在Illustrator中創(chuàng)建矢量元素,再用InDesign進(jìn)行排版,每個(gè)步驟都需要專業(yè)知識(shí)和技巧。而AI圖像生成初期,我們?nèi)匀恍枰脑O(shè)計(jì)提示詞,了解不同模型的特性,甚至通過(guò)插件和自定義工作流程來(lái)獲得滿意的結(jié)果。
GPT-4o原生圖像生成功能的出現(xiàn)徹底改變了這一切。這個(gè)模型不再需要調(diào)用獨(dú)立的DALL-E來(lái)處理圖像生成,而是由同一個(gè)神經(jīng)網(wǎng)絡(luò)原生處理各種模態(tài)的內(nèi)容。當(dāng)我第一次使用它時(shí),我驚訝地發(fā)現(xiàn)自己不再需要思考提示詞的結(jié)構(gòu)或參數(shù),只需用自然語(yǔ)言描述我的想法,GPT-4o就能理解我的意圖并生成相應(yīng)的圖像。更令人震撼的是,我可以在對(duì)話中隨意修改、調(diào)整圖像,整個(gè)創(chuàng)作過(guò)程變得如此流暢,就像與一位理解我創(chuàng)意構(gòu)想的助手對(duì)話一樣。
文字渲染的突破性進(jìn)展
GPT-4o在圖像中文字渲染方面的進(jìn)步尤為顯著。模型采用了全新的自我回歸方法,從左到右、從上到下依次生成圖像,大大提高了文字的準(zhǔn)確性和連貫性。用戶測(cè)試發(fā)現(xiàn)GPT-4o不僅能看出圖像中的情緒,還能結(jié)合人物所處環(huán)境和著裝,提供更多的判斷信息。更令人驚喜的是,它展現(xiàn)了令人驚嘆的跨語(yǔ)言能力,例如能在用戶輸入中文提示詞的情況下,直接將圖片中的德語(yǔ)翻譯成中文。這一技術(shù)突破意味著設(shè)計(jì)師可以直接生成包含準(zhǔn)確文字的海報(bào)、廣告或信息圖表,無(wú)需后期在其他軟件中調(diào)整文字。
當(dāng)我嘗試生成一張帶有產(chǎn)品說(shuō)明的營(yíng)銷圖像時(shí),GPT-4o不僅精確地呈現(xiàn)了文字內(nèi)容,還自動(dòng)調(diào)整了字體和排版以匹配整體設(shè)計(jì)風(fēng)格,這種集成體驗(yàn)令人印象深刻。
二、工具簡(jiǎn)化與專業(yè)重構(gòu)
"之前看過(guò)個(gè)設(shè)計(jì)師說(shuō)只要AI生成的圖像還沒(méi)有圖層,設(shè)計(jì)師飯碗就穩(wěn)得很,現(xiàn)在看來(lái)設(shè)計(jì)師飯碗要炸了。"這句在社交媒體上流傳的話語(yǔ)道出了許多創(chuàng)意專業(yè)人士的憂慮。圖層是專業(yè)設(shè)計(jì)軟件的核心功能,也是設(shè)計(jì)師對(duì)自己工作的專業(yè)把控的象征。然而,GPT-4o雖然尚未提供圖層功能,但它在對(duì)話式的圖像修改上表現(xiàn)出的強(qiáng)大能力已經(jīng)開(kāi)始動(dòng)搖這一看似堅(jiān)固的壁壘。
當(dāng)我向GPT-4o描述"將海報(bào)背景從白天改為黃昏,同時(shí)保持前景人物清晰"這樣的復(fù)雜修改要求時(shí),它能夠完美執(zhí)行,而無(wú)需我手動(dòng)分離圖層或使用蒙版。這種能力意味著傳統(tǒng)設(shè)計(jì)工具中許多復(fù)雜的操作可能很快就會(huì)被簡(jiǎn)單的自然語(yǔ)言指令所取代。GPT-4o在處理多個(gè)物體之間關(guān)系的能力上有了質(zhì)的飛躍,可以同時(shí)維護(hù)15-20個(gè)物體的屬性,準(zhǔn)確把握它們之間的位置、大小和顏色關(guān)系。
然而,這并不意味著設(shè)計(jì)師這一職業(yè)將完全消失。相反,設(shè)計(jì)師的角色可能會(huì)轉(zhuǎn)變?yōu)閯?chuàng)意引導(dǎo)者和策略思想家,專注于概念發(fā)展和品牌敘事,而將執(zhí)行層面的工作交給AI助手完成。正如一位資深設(shè)計(jì)師在論壇中評(píng)論的:"我們不應(yīng)該把自己定義為Photoshop的操作者,而應(yīng)該是視覺(jué)問(wèn)題的解決者。"
三、用戶體驗(yàn)的革命
交互范式轉(zhuǎn)變
在使用GPT-4o之前,我們習(xí)慣了"人適應(yīng)工具"的交互模式——學(xué)習(xí)軟件界面,記憶快捷鍵,適應(yīng)工具的邏輯和限制。但GPT-4o帶來(lái)了一種全新的交互范式:"工具理解人"。相比GPT-4,GPT-4o處理速度明顯加快,平均響應(yīng)時(shí)間從約5秒減少到僅320毫秒,這種實(shí)時(shí)互動(dòng)的體驗(yàn)極大地提升了創(chuàng)作流程的自然度。
當(dāng)我說(shuō)"制作一張關(guān)于未來(lái)城市的海報(bào)"時(shí),GPT-4o不僅生成了一張未來(lái)城市的圖像,還自動(dòng)添加了適當(dāng)?shù)臉?biāo)題和排版元素。當(dāng)我表示希望畫(huà)面更加科技感時(shí),它立即調(diào)整了色調(diào)和元素,而不需要我詳細(xì)解釋"科技感"意味著什么樣的視覺(jué)語(yǔ)言。這種直覺(jué)式的交互大大降低了創(chuàng)意表達(dá)的門(mén)檻,使非專業(yè)人士也能快速實(shí)現(xiàn)自己的創(chuàng)意構(gòu)想。
創(chuàng)意新模式
GPT-4o不僅是一個(gè)執(zhí)行指令的工具,更是一個(gè)能夠提供創(chuàng)意輸入的協(xié)作伙伴。在測(cè)試過(guò)程中,當(dāng)我向它描述一個(gè)模糊的創(chuàng)意概念時(shí),它不僅能夠可視化我的想法,還會(huì)主動(dòng)提出改進(jìn)建議或替代方案,這種雙向交流使創(chuàng)作過(guò)程變得更加豐富和充滿可能性。實(shí)際使用中,用戶可以進(jìn)行有趣的互動(dòng),例如要求它繪制一個(gè)空白的井字游戲,然后讓它下第一步棋,接著用戶下一步,如此往復(fù)。還可以進(jìn)行信息保持的轉(zhuǎn)換,如改變繪圖風(fēng)格,或者執(zhí)行"把白天變成夜晚"、"給他戴上帽子"等指令。這種靈活的交互方式,使創(chuàng)意過(guò)程變得更加直觀和自然。
四、內(nèi)容價(jià)值的重構(gòu)
技術(shù)門(mén)檻的消失
GPT-4o最革命性的影響可能在于它極大地降低了創(chuàng)意表達(dá)的技術(shù)門(mén)檻。以往,制作一張專業(yè)海報(bào)需要多年的設(shè)計(jì)軟件學(xué)習(xí)和實(shí)踐,而現(xiàn)在,任何人都可以通過(guò)自然語(yǔ)言描述獲得接近專業(yè)水準(zhǔn)的視覺(jué)作品。
"人類從會(huì)使用工具的動(dòng)物進(jìn)化到只需要思考的存在。"這句話精準(zhǔn)地概括了這一變化的本質(zhì)。當(dāng)工具不再需要專門(mén)的學(xué)習(xí)和掌握,創(chuàng)意的核心就回歸到了思想和概念本身。這種民主化趨勢(shì)既擴(kuò)大了創(chuàng)意表達(dá)的可能性,也模糊了專業(yè)與業(yè)余的界限。
專業(yè)價(jià)值的重新定義
"復(fù)雜工程化注定會(huì)被模型碾碎,但被摧毀的只是表層的技術(shù)壁壘,而非創(chuàng)造的本質(zhì)。"隨著AI工具的發(fā)展,創(chuàng)意專業(yè)人士需要重新思考自己的價(jià)值所在。技術(shù)操作能力不再是稀缺資源,那么什么才是AI難以取代的核心競(jìng)爭(zhēng)力?答案可能在于更深層次的創(chuàng)意思維、文化理解、策略洞察和人際溝通能力。
一位資深創(chuàng)意總監(jiān)在行業(yè)論壇中寫(xiě)道:"AI可以生成海報(bào),但它無(wú)法理解品牌的歷史脈絡(luò),無(wú)法感知文化趨勢(shì)的微妙變化,也無(wú)法與客戶建立情感連接和信任。這些都是設(shè)計(jì)師需要培養(yǎng)的新核心能力。“
五、工具簡(jiǎn)化的終極方向
從技術(shù)演進(jìn)的角度看,所有領(lǐng)域的發(fā)展都遵循著"由繁入簡(jiǎn)"的規(guī)律。從命令行到圖形界面,從手工編碼到可視化開(kāi)發(fā),再到如今的自然語(yǔ)言驅(qū)動(dòng)——技術(shù)的真正成熟不是通過(guò)增加復(fù)雜性,而是通過(guò)消解復(fù)雜性來(lái)實(shí)現(xiàn)的。
GPT-4o原生圖像生成功能正是這一規(guī)律的最新體現(xiàn)。那些我曾引以為傲的復(fù)雜工作流程——精心調(diào)教的提示詞、層層疊加的插件、環(huán)環(huán)相扣的模型鏈——如今都被一個(gè)簡(jiǎn)單對(duì)話界面所取代。這不是技術(shù)的倒退,而是技術(shù)真正走向成熟的標(biāo)志。"manus的歸宿也是如此,不知道哪來(lái)這么多人吹"——這句網(wǎng)絡(luò)評(píng)論反映了一些人對(duì)手工技藝消失的擔(dān)憂。確實(shí),隨著技術(shù)的發(fā)展,許多傳統(tǒng)技能可能會(huì)被自動(dòng)化所取代。然而,歷史告訴我們,技術(shù)革新不會(huì)消滅創(chuàng)造力,只會(huì)改變它的表現(xiàn)形式。
六、創(chuàng)新的新起點(diǎn)
當(dāng)復(fù)雜的工具被簡(jiǎn)化,當(dāng)技術(shù)門(mén)檻被消解,人類創(chuàng)造力的表達(dá)將迎來(lái)前所未有的可能性。GPT-4o原生圖像生成功能不僅是AI技術(shù)的一次進(jìn)步,更是創(chuàng)意表達(dá)方式的一次范式轉(zhuǎn)變。從產(chǎn)品思維角度看,這代表了人機(jī)交互的本質(zhì)轉(zhuǎn)變:從"人適應(yīng)工具"到"工具理解人"。對(duì)創(chuàng)意行業(yè)的專業(yè)人士而言,這是一個(gè)既充滿機(jī)遇又充滿挑戰(zhàn)的時(shí)刻。復(fù)雜工程化注定會(huì)被模型碾碎,但被摧毀的只是表層的技術(shù)壁壘,而非創(chuàng)造的本質(zhì)。
站在技術(shù)與創(chuàng)意交匯的十字路口,我們不禁思考:當(dāng)工具變得如此智能和易用,人類創(chuàng)造力的下一個(gè)前沿在哪里?也許答案就在于我們對(duì)意義和美的獨(dú)特感知,以及對(duì)文化和情感的深刻理解——這些正是AI尚無(wú)法完全復(fù)制的領(lǐng)域。
在這個(gè)新時(shí)代,真正的挑戰(zhàn)不再是掌握復(fù)雜工具,而是提出正確的問(wèn)題,表達(dá)獨(dú)特的視角,創(chuàng)造有意義的內(nèi)容。正如一位設(shè)計(jì)師所言:"當(dāng)每個(gè)人都能使用AI創(chuàng)作,創(chuàng)意的價(jià)值將不再取決于你使用了什么工具,而是取決于你內(nèi)心有什么獨(dú)特的東西想要表達(dá)。"
也許,這正是技術(shù)發(fā)展的終極意義——不是取代人類創(chuàng)造力,而是將我們從工具的束縛中解放出來(lái),讓我們能夠更純粹地追求創(chuàng)意本身。當(dāng)我們站在GPT-4o這樣的技術(shù)肩膀上眺望未來(lái),我們看到的不是創(chuàng)意的終結(jié),而是創(chuàng)新的新起點(diǎn)。
星標(biāo)公眾號(hào), 點(diǎn)這里 1. 點(diǎn)擊右上角 2. 點(diǎn)擊"設(shè)為星標(biāo)" ← AI深度研究員 ? ← 設(shè)為星標(biāo)
參考資料:https://www.morganstanley.com/insights/articles/ai-trends-reasoning-frontier-models-2025-tmt
來(lái)源:官方媒體/網(wǎng)絡(luò)新聞
排版:Atlas
編輯:深思
主編: 圖靈
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.