網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

GPT-4o登頂，但AI吉卜力被宮崎駿認(rèn)為是侮辱

2025-04-01 18:24:52　來(lái)源: 壹零社

重慶舉報(bào)

分享至

北京時(shí)間今日凌晨，OpenAI以一場(chǎng)靜默的“技術(shù)核爆”震撼全球科技圈——全新升級(jí)的GPT-4o正式登場(chǎng)！

《電腦報(bào)》青少年月刊有獎(jiǎng)?wù){(diào)查

你是不是也對(duì)AI的酷炫功能充滿好奇？想用代碼召喚屬于自己的機(jī)器人？只需花3分鐘完成這份問(wèn)卷，即有機(jī)會(huì)獲得《電腦報(bào)》及新刊物訂閱、未來(lái)人類32GB定制U盤等豐富獎(jiǎng)品！！！

掃描二維碼填寫問(wèn)卷

GPT-4o引爆圖像生成革命

2025年4月1日凌晨，OpenAI再次以技術(shù)革新震撼全球——GPT-4o原生圖像生成功能的全面升級(jí)，不僅以壓倒性優(yōu)勢(shì)沖進(jìn)大模型排行榜第二，更以吉卜力風(fēng)格的創(chuàng)作狂潮席卷社交網(wǎng)絡(luò)，徹底顛覆了AI圖像生成的競(jìng)爭(zhēng)格局。

GPT-4o的殺手锏在于其自回歸（Autoregressive）架構(gòu)，與傳統(tǒng)擴(kuò)散模型（如Midjourney）不同，該模型通過(guò)“對(duì)話式”交互實(shí)現(xiàn)精準(zhǔn)控制。用戶不僅能上傳圖片進(jìn)行風(fēng)格轉(zhuǎn)換，還能通過(guò)自然語(yǔ)言指令實(shí)時(shí)修改細(xì)節(jié)——例如為貓咪戴上偵探帽，或?yàn)榭苹脠?chǎng)景添加血條UI。這種“模型即產(chǎn)品”的設(shè)計(jì)，讓創(chuàng)作門檻從“參數(shù)調(diào)試”降為“聊天對(duì)話”，效率提升數(shù)十倍。

此次更新中，GPT-4o最核心的升級(jí)在于多模態(tài)交互能力的質(zhì)變。用戶可通過(guò)自然語(yǔ)言連續(xù)調(diào)整圖像風(fēng)格與構(gòu)圖，例如在對(duì)話中要求“將畫面光影調(diào)暗，并添加一只戴帽子的貓”，系統(tǒng)能精準(zhǔn)執(zhí)行且保持視覺(jué)一致性。

此外，模型大幅優(yōu)化了文字渲染能力，生成的標(biāo)志、圖表等信息圖像中，文字準(zhǔn)確率遠(yuǎn)超同類工具，甚至能結(jié)合上下文知識(shí)庫(kù)實(shí)現(xiàn)“零提示詞創(chuàng)作”。

技術(shù)報(bào)告顯示，GPT-4o在LMSYS基準(zhǔn)測(cè)試中躍居全球第二，數(shù)學(xué)、編碼、復(fù)雜問(wèn)題解決等關(guān)鍵領(lǐng)域評(píng)分飆升30分以上，直接超越自家GPT-4.5和競(jìng)爭(zhēng)對(duì)手Grok 3。更驚人的是，其成本僅為GPT-4.5的十分之一，API響應(yīng)速度提升兩倍。

在最新發(fā)布的AI大模型綜合能力榜中，GPT-4o以87.6分（滿分100）的成績(jī)緊隨榜首Claude 3 Opus，但相較第三名Grok-3的79.1分已拉開(kāi)斷層差距。

Grok-3的致命短板暴露于多模態(tài)場(chǎng)景的笨拙：其圖像處理依賴獨(dú)立模塊拼接，導(dǎo)致跨領(lǐng)域任務(wù)頻頻“卡殼”。

而GPT-4.5雖在文本邏輯上保持優(yōu)勢(shì)，卻因未針對(duì)圖像原生優(yōu)化，在短視頻生成、虛擬現(xiàn)實(shí)等新興賽道被用戶詬病“慢半拍”。

吉卜力美學(xué)與全網(wǎng)狂歡

“ All Ghibli Images（AGI） ”——這一網(wǎng)友戲稱的標(biāo)簽，精準(zhǔn)概括了GPT-4o引發(fā)的現(xiàn)象級(jí)傳播。

用戶僅需輸入“吉卜力風(fēng)格”，即可一鍵生成宮崎駿動(dòng)畫般的場(chǎng)景，從網(wǎng)紅表情包到經(jīng)典名場(chǎng)面，甚至個(gè)人生活照均被“二次元化”。OpenAI CEO山姆·奧特曼連夜更換吉卜力風(fēng)格頭像，并坦言GPU因生圖需求暴增而超負(fù)荷運(yùn)轉(zhuǎn)。

Midjourney等傳統(tǒng)工具在此次浪潮中黯然失色。用戶實(shí)測(cè)對(duì)比顯示，GPT-4o在光影細(xì)節(jié)、角色一致性上表現(xiàn)更優(yōu)，且支持多輪修改指令，例如“讓角色穿上雨衣，背景改為雪景”。設(shè)計(jì)師群體亦感嘆：“AI已能捕捉吉卜力的靈魂——治愈感與奇幻氛圍的平衡。”

上線僅12小時(shí)，GPT-4o的API調(diào)用量已突破2.3億次，社交媒體相關(guān)話題閱讀量超50億。其流量爆發(fā)的背后，是三大群體的狂歡——

1.內(nèi)容創(chuàng)作者：短視頻博主利用其“文字→分鏡→成片”的全鏈路生成能力，將內(nèi)容生產(chǎn)效率提升10倍；

2.電商企業(yè)：通過(guò)AI實(shí)時(shí)生成百萬(wàn)級(jí)個(gè)性化商品圖，廣告點(diǎn)擊率平均提升22%；

3.科研機(jī)構(gòu)：在蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)、天文圖像分析等領(lǐng)域，GPT-4o展現(xiàn)出超越專業(yè)軟件的潛力。

AI吉卜力為何不被宮崎駿認(rèn)可

“這是對(duì)生命本身的侮辱。”宮崎駿對(duì)AI的態(tài)度從未動(dòng)搖。

早在2016年，他在紀(jì)錄片中看到AI生成的動(dòng)畫片段時(shí)，便直言感到“生理性厭惡”。他認(rèn)為，手繪動(dòng)畫的每一筆觸都承載著創(chuàng)作者對(duì)生命的敬畏與情感的投入，而AI生成的“完美模仿”剝離了人性的溫度，淪為空洞的技術(shù)復(fù)制。

宮崎駿的堅(jiān)持，源于手繪動(dòng)畫的不可替代性。吉卜力作品通常需數(shù)年打磨，如《風(fēng)之谷》的每一幀都凝聚著團(tuán)隊(duì)對(duì)細(xì)節(jié)的極致追求。而AI生成一張“吉卜力風(fēng)”圖片僅需1分鐘，成本幾乎為零。這種效率對(duì)比折射出藝術(shù)與技術(shù)的根本矛盾：AI能模仿風(fēng)格，卻無(wú)法復(fù)刻故事中的哲思與人性共鳴。正如網(wǎng)友所言：“《千與千尋》的魔法，在于它教會(huì)我們看見(jiàn)被忽視的美，而非濾鏡般的畫面轉(zhuǎn)換。”

值得一提的是AI生成的吉卜力風(fēng)格圖片是否侵權(quán)？這一問(wèn)題引發(fā)激烈爭(zhēng)論。

法律專家指出，“創(chuàng)作風(fēng)格”本身不受版權(quán)法保護(hù)，但OpenAI若未經(jīng)授權(quán)使用吉卜力電影畫面訓(xùn)練模型，則可能觸碰法律紅線。

盡管宮崎駿的批判態(tài)度人盡皆知，吉卜力工作室母公司日本電視臺(tái)至今未公開(kāi)回應(yīng)，這一沉默被解讀為對(duì)技術(shù)趨勢(shì)的無(wú)奈。更具諷刺意味的是，連宮崎駿批評(píng)AI的紀(jì)錄片片段，也被網(wǎng)友二次加工成“吉卜力風(fēng)”表情包。

爭(zhēng)議與未來(lái)

盡管GPT-4o引發(fā)創(chuàng)作狂歡，爭(zhēng)議也隨之而來(lái)。宮崎駿公開(kāi)批評(píng)AI生成“缺乏對(duì)生命的敬畏”，版權(quán)問(wèn)題與職業(yè)沖擊的討論再度升溫。技術(shù)層面，模型仍存在圖像裁剪偏差、編輯一致性不足等局限，OpenAI表示將進(jìn)一步優(yōu)化多模態(tài)對(duì)齊能力。

Midjourney CEO公開(kāi)質(zhì)疑GPT-4o“只為融資炒作”，卻難掩焦慮。

曾以美學(xué)性著稱的Midjourney，在4o的多模態(tài)理解能力前黯然失色。設(shè)計(jì)師章蕭醇感嘆：“兩年研究的工具鏈，一夜成了擺設(shè)。”GPT-4o不僅能處理20個(gè)對(duì)象并保持邏輯關(guān)聯(lián)（遠(yuǎn)超同行5-8個(gè)），還能調(diào)用知識(shí)庫(kù)生成專業(yè)圖表，教育、游戲、廣告等場(chǎng)景的創(chuàng)意工作正經(jīng)歷“AI平權(quán)”。

行業(yè)分析師指出，此次更新標(biāo)志著自然語(yǔ)言交互正式成為AI圖像生成的核心入口。隨著API接口開(kāi)放，GPT-4o或?qū)⒅厮軓V告設(shè)計(jì)、影視概念創(chuàng)作等領(lǐng)域的生產(chǎn)流程。面對(duì)谷歌Gemini等對(duì)手的追趕，OpenAI能否憑借“低成本+高可控性”持續(xù)領(lǐng)跑，仍待觀察。

OpenAI的“陽(yáng)謀”

GPT-4o的橫空出世，絕非一次簡(jiǎn)單的技術(shù)升級(jí)，而是OpenAI精心布局生態(tài)帝國(guó)的一枚關(guān)鍵落子。從ChatGPT企業(yè)版到Sora視頻模型，再到如今的GPT-4o，這家公司正以驚人的速度編織一張覆蓋文字、圖像、視頻的全模態(tài)生產(chǎn)網(wǎng)絡(luò)。

這條技術(shù)鏈的終點(diǎn)，是一個(gè)完全由AI驅(qū)動(dòng)的創(chuàng)作生態(tài)閉環(huán)——用戶只需輸入需求，便能獲得從文案策劃、視覺(jué)設(shè)計(jì)到動(dòng)態(tài)呈現(xiàn)的一站式解決方案。

這種全鏈條能力對(duì)中小企業(yè)的吸引力不言而喻。過(guò)去，企業(yè)若想實(shí)現(xiàn)AI多模態(tài)內(nèi)容生產(chǎn)，往往需要分別采購(gòu)文本生成、圖像處理、視頻剪輯等多套工具，不僅成本高昂，數(shù)據(jù)孤島問(wèn)題更是難以解決。

而OpenAI通過(guò)統(tǒng)一的技術(shù)架構(gòu)，將復(fù)雜流程簡(jiǎn)化為“自然語(yǔ)言指令→多模態(tài)輸出”的直通車。這背后的商業(yè)邏輯清晰而鋒利：以極低的使用門檻吸引海量用戶涌入，再通過(guò)訂閱制服務(wù)將流量轉(zhuǎn)化為持續(xù)收入。

與此同時(shí)，GPT-4o的爆發(fā)式應(yīng)用正在為OpenAI構(gòu)建更堅(jiān)固的技術(shù)護(hù)城河。數(shù)以億計(jì)的用戶每天生成的海量圖像數(shù)據(jù)，如同永不枯竭的燃料，持續(xù)注入模型訓(xùn)練的飛輪。

這些真實(shí)場(chǎng)景中的交互反饋，讓系統(tǒng)能夠捕捉到傳統(tǒng)實(shí)驗(yàn)室數(shù)據(jù)難以覆蓋的長(zhǎng)尾需求——從網(wǎng)紅博主的“光影氛圍感”到工程師的“零件尺寸公差”，GPT-4o的進(jìn)化速度正在突破人工標(biāo)注的極限。這種“越用越強(qiáng)”的滾雪球效應(yīng)，使得競(jìng)爭(zhēng)對(duì)手即便投入同等算力，也難以復(fù)現(xiàn)其生態(tài)滋養(yǎng)出的理解深度。

點(diǎn)評(píng)

人類與AI的創(chuàng)造力共生

GPT-4o的爆發(fā)，是AI從“工具”進(jìn)化為“創(chuàng)作伙伴”的分水嶺。它或許會(huì)重塑設(shè)計(jì)行業(yè)生態(tài)，但人類獨(dú)有的情感與敘事能力，仍是AI難以跨越的護(hù)城河。正如網(wǎng)友用4o生成的《千與千尋》高清版——技術(shù)可以復(fù)刻畫面，但湯婆婆眼神中的貪婪，仍需觀眾自己體會(huì)。

微信訂閱

歡迎通過(guò)郵局渠道訂閱2025年《電腦報(bào)》

郵發(fā)代號(hào)：77-19

單價(jià)：8元，年價(jià)：400元

編輯｜張毅

主編｜黎坤

總編輯｜吳新

爆料聯(lián)系：cpcfan1874（微信）

壹零社：用圖文、視頻記錄科技互聯(lián)網(wǎng)新鮮事、電商生活、云計(jì)算、ICT領(lǐng)域、消費(fèi)電子，商業(yè)故事。《中國(guó)知網(wǎng)》每周全文收錄；中國(guó)科技報(bào)刊100強(qiáng)；2021年微博百萬(wàn)粉絲俱樂(lè)部成員；2022年抖音優(yōu)質(zhì)科技內(nèi)容創(chuàng)作者

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.