北京時(shí)間今日凌晨,OpenAI以一場(chǎng)靜默的“技術(shù)核爆”震撼全球科技圈——全新升級(jí)的GPT-4o正式登場(chǎng)!
《電腦報(bào)》青少年月刊有獎(jiǎng)?wù){(diào)查
你是不是也對(duì)AI的酷炫功能充滿好奇?想用代碼召喚屬于自己的機(jī)器人?只需花3分鐘完成這份問(wèn)卷,即有機(jī)會(huì)獲得《電腦報(bào)》及新刊物訂閱、未來(lái)人類32GB定制U盤等豐富獎(jiǎng)品!!!
掃描二維碼填寫問(wèn)卷
01
GPT-4o引爆圖像生成革命
2025年4月1日凌晨,OpenAI再次以技術(shù)革新震撼全球——GPT-4o原生圖像生成功能的全面升級(jí),不僅以壓倒性優(yōu)勢(shì)沖進(jìn)大模型排行榜第二,更以吉卜力風(fēng)格的創(chuàng)作狂潮席卷社交網(wǎng)絡(luò),徹底顛覆了AI圖像生成的競(jìng)爭(zhēng)格局。
GPT-4o的殺手锏在于其自回歸(Autoregressive)架構(gòu),與傳統(tǒng)擴(kuò)散模型(如Midjourney)不同,該模型通過(guò)“對(duì)話式”交互實(shí)現(xiàn)精準(zhǔn)控制。用戶不僅能上傳圖片進(jìn)行風(fēng)格轉(zhuǎn)換,還能通過(guò)自然語(yǔ)言指令實(shí)時(shí)修改細(xì)節(jié)——例如為貓咪戴上偵探帽,或?yàn)榭苹脠?chǎng)景添加血條UI。這種“模型即產(chǎn)品”的設(shè)計(jì),讓創(chuàng)作門檻從“參數(shù)調(diào)試”降為“聊天對(duì)話”,效率提升數(shù)十倍。
此次更新中,GPT-4o最核心的升級(jí)在于多模態(tài)交互能力的質(zhì)變。用戶可通過(guò)自然語(yǔ)言連續(xù)調(diào)整圖像風(fēng)格與構(gòu)圖,例如在對(duì)話中要求“將畫面光影調(diào)暗,并添加一只戴帽子的貓”,系統(tǒng)能精準(zhǔn)執(zhí)行且保持視覺(jué)一致性。
此外,模型大幅優(yōu)化了文字渲染能力,生成的標(biāo)志、圖表等信息圖像中,文字準(zhǔn)確率遠(yuǎn)超同類工具,甚至能結(jié)合上下文知識(shí)庫(kù)實(shí)現(xiàn)“零提示詞創(chuàng)作”。
技術(shù)報(bào)告顯示,GPT-4o在LMSYS基準(zhǔn)測(cè)試中躍居全球第二,數(shù)學(xué)、編碼、復(fù)雜問(wèn)題解決等關(guān)鍵領(lǐng)域評(píng)分飆升30分以上,直接超越自家GPT-4.5和競(jìng)爭(zhēng)對(duì)手Grok 3。更驚人的是,其成本僅為GPT-4.5的十分之一,API響應(yīng)速度提升兩倍。
在最新發(fā)布的AI大模型綜合能力榜中,GPT-4o以87.6分(滿分100)的成績(jī)緊隨榜首Claude 3 Opus,但相較第三名Grok-3的79.1分已拉開(kāi)斷層差距。
Grok-3的致命短板暴露于多模態(tài)場(chǎng)景的笨拙:其圖像處理依賴獨(dú)立模塊拼接,導(dǎo)致跨領(lǐng)域任務(wù)頻頻“卡殼”。
而GPT-4.5雖在文本邏輯上保持優(yōu)勢(shì),卻因未針對(duì)圖像原生優(yōu)化,在短視頻生成、虛擬現(xiàn)實(shí)等新興賽道被用戶詬病“慢半拍”。
02
吉卜力美學(xué)與全網(wǎng)狂歡
“ All Ghibli Images(AGI) ”——這一網(wǎng)友戲稱的標(biāo)簽,精準(zhǔn)概括了GPT-4o引發(fā)的現(xiàn)象級(jí)傳播。
用戶僅需輸入“吉卜力風(fēng)格”,即可一鍵生成宮崎駿動(dòng)畫般的場(chǎng)景,從網(wǎng)紅表情包到經(jīng)典名場(chǎng)面,甚至個(gè)人生活照均被“二次元化”。OpenAI CEO山姆·奧特曼連夜更換吉卜力風(fēng)格頭像,并坦言GPU因生圖需求暴增而超負(fù)荷運(yùn)轉(zhuǎn)。
Midjourney等傳統(tǒng)工具在此次浪潮中黯然失色。用戶實(shí)測(cè)對(duì)比顯示,GPT-4o在光影細(xì)節(jié)、角色一致性上表現(xiàn)更優(yōu),且支持多輪修改指令,例如“讓角色穿上雨衣,背景改為雪景”。設(shè)計(jì)師群體亦感嘆:“AI已能捕捉吉卜力的靈魂——治愈感與奇幻氛圍的平衡。”
上線僅12小時(shí),GPT-4o的API調(diào)用量已突破2.3億次,社交媒體相關(guān)話題閱讀量超50億。其流量爆發(fā)的背后,是三大群體的狂歡——
1.內(nèi)容創(chuàng)作者:短視頻博主利用其“文字→分鏡→成片”的全鏈路生成能力,將內(nèi)容生產(chǎn)效率提升10倍;
2.電商企業(yè):通過(guò)AI實(shí)時(shí)生成百萬(wàn)級(jí)個(gè)性化商品圖,廣告點(diǎn)擊率平均提升22%;
3.科研機(jī)構(gòu):在蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)、天文圖像分析等領(lǐng)域,GPT-4o展現(xiàn)出超越專業(yè)軟件的潛力。
03
AI吉卜力為何不被宮崎駿認(rèn)可
“這是對(duì)生命本身的侮辱。”宮崎駿對(duì)AI的態(tài)度從未動(dòng)搖。
早在2016年,他在紀(jì)錄片中看到AI生成的動(dòng)畫片段時(shí),便直言感到“生理性厭惡”。他認(rèn)為,手繪動(dòng)畫的每一筆觸都承載著創(chuàng)作者對(duì)生命的敬畏與情感的投入,而AI生成的“完美模仿”剝離了人性的溫度,淪為空洞的技術(shù)復(fù)制。
宮崎駿的堅(jiān)持,源于手繪動(dòng)畫的不可替代性。吉卜力作品通常需數(shù)年打磨,如《風(fēng)之谷》的每一幀都凝聚著團(tuán)隊(duì)對(duì)細(xì)節(jié)的極致追求。而AI生成一張“吉卜力風(fēng)”圖片僅需1分鐘,成本幾乎為零。這種效率對(duì)比折射出藝術(shù)與技術(shù)的根本矛盾:AI能模仿風(fēng)格,卻無(wú)法復(fù)刻故事中的哲思與人性共鳴。正如網(wǎng)友所言:“《千與千尋》的魔法,在于它教會(huì)我們看見(jiàn)被忽視的美,而非濾鏡般的畫面轉(zhuǎn)換。”
值得一提的是AI生成的吉卜力風(fēng)格圖片是否侵權(quán)?這一問(wèn)題引發(fā)激烈爭(zhēng)論。
法律專家指出,“創(chuàng)作風(fēng)格”本身不受版權(quán)法保護(hù),但OpenAI若未經(jīng)授權(quán)使用吉卜力電影畫面訓(xùn)練模型,則可能觸碰法律紅線。
盡管宮崎駿的批判態(tài)度人盡皆知,吉卜力工作室母公司日本電視臺(tái)至今未公開(kāi)回應(yīng),這一沉默被解讀為對(duì)技術(shù)趨勢(shì)的無(wú)奈。更具諷刺意味的是,連宮崎駿批評(píng)AI的紀(jì)錄片片段,也被網(wǎng)友二次加工成“吉卜力風(fēng)”表情包。
04
爭(zhēng)議與未來(lái)
盡管GPT-4o引發(fā)創(chuàng)作狂歡,爭(zhēng)議也隨之而來(lái)。宮崎駿公開(kāi)批評(píng)AI生成“缺乏對(duì)生命的敬畏”,版權(quán)問(wèn)題與職業(yè)沖擊的討論再度升溫。技術(shù)層面,模型仍存在圖像裁剪偏差、編輯一致性不足等局限,OpenAI表示將進(jìn)一步優(yōu)化多模態(tài)對(duì)齊能力。
Midjourney CEO公開(kāi)質(zhì)疑GPT-4o“只為融資炒作”,卻難掩焦慮。
曾以美學(xué)性著稱的Midjourney,在4o的多模態(tài)理解能力前黯然失色。設(shè)計(jì)師章蕭醇感嘆:“兩年研究的工具鏈,一夜成了擺設(shè)。”GPT-4o不僅能處理20個(gè)對(duì)象并保持邏輯關(guān)聯(lián)(遠(yuǎn)超同行5-8個(gè)),還能調(diào)用知識(shí)庫(kù)生成專業(yè)圖表,教育、游戲、廣告等場(chǎng)景的創(chuàng)意工作正經(jīng)歷“AI平權(quán)”。
行業(yè)分析師指出,此次更新標(biāo)志著自然語(yǔ)言交互正式成為AI圖像生成的核心入口。隨著API接口開(kāi)放,GPT-4o或?qū)⒅厮軓V告設(shè)計(jì)、影視概念創(chuàng)作等領(lǐng)域的生產(chǎn)流程。面對(duì)谷歌Gemini等對(duì)手的追趕,OpenAI能否憑借“低成本+高可控性”持續(xù)領(lǐng)跑,仍待觀察。
05
OpenAI的“陽(yáng)謀”
GPT-4o的橫空出世,絕非一次簡(jiǎn)單的技術(shù)升級(jí),而是OpenAI精心布局生態(tài)帝國(guó)的一枚關(guān)鍵落子。從ChatGPT企業(yè)版到Sora視頻模型,再到如今的GPT-4o,這家公司正以驚人的速度編織一張覆蓋文字、圖像、視頻的全模態(tài)生產(chǎn)網(wǎng)絡(luò)。
這條技術(shù)鏈的終點(diǎn),是一個(gè)完全由AI驅(qū)動(dòng)的創(chuàng)作生態(tài)閉環(huán)——用戶只需輸入需求,便能獲得從文案策劃、視覺(jué)設(shè)計(jì)到動(dòng)態(tài)呈現(xiàn)的一站式解決方案。
這種全鏈條能力對(duì)中小企業(yè)的吸引力不言而喻。過(guò)去,企業(yè)若想實(shí)現(xiàn)AI多模態(tài)內(nèi)容生產(chǎn),往往需要分別采購(gòu)文本生成、圖像處理、視頻剪輯等多套工具,不僅成本高昂,數(shù)據(jù)孤島問(wèn)題更是難以解決。
而OpenAI通過(guò)統(tǒng)一的技術(shù)架構(gòu),將復(fù)雜流程簡(jiǎn)化為“自然語(yǔ)言指令→多模態(tài)輸出”的直通車。這背后的商業(yè)邏輯清晰而鋒利:以極低的使用門檻吸引海量用戶涌入,再通過(guò)訂閱制服務(wù)將流量轉(zhuǎn)化為持續(xù)收入。
與此同時(shí),GPT-4o的爆發(fā)式應(yīng)用正在為OpenAI構(gòu)建更堅(jiān)固的技術(shù)護(hù)城河。數(shù)以億計(jì)的用戶每天生成的海量圖像數(shù)據(jù),如同永不枯竭的燃料,持續(xù)注入模型訓(xùn)練的飛輪。
這些真實(shí)場(chǎng)景中的交互反饋,讓系統(tǒng)能夠捕捉到傳統(tǒng)實(shí)驗(yàn)室數(shù)據(jù)難以覆蓋的長(zhǎng)尾需求——從網(wǎng)紅博主的“光影氛圍感”到工程師的“零件尺寸公差”,GPT-4o的進(jìn)化速度正在突破人工標(biāo)注的極限。這種“越用越強(qiáng)”的滾雪球效應(yīng),使得競(jìng)爭(zhēng)對(duì)手即便投入同等算力,也難以復(fù)現(xiàn)其生態(tài)滋養(yǎng)出的理解深度。
06
點(diǎn)評(píng)
人類與AI的創(chuàng)造力共生
GPT-4o的爆發(fā),是AI從“工具”進(jìn)化為“創(chuàng)作伙伴”的分水嶺。它或許會(huì)重塑設(shè)計(jì)行業(yè)生態(tài),但人類獨(dú)有的情感與敘事能力,仍是AI難以跨越的護(hù)城河。正如網(wǎng)友用4o生成的《千與千尋》高清版——技術(shù)可以復(fù)刻畫面,但湯婆婆眼神中的貪婪,仍需觀眾自己體會(huì)。
微信訂閱
歡迎通過(guò)郵局渠道訂閱2025年《電腦報(bào)》
郵發(fā)代號(hào):77-19
單價(jià):8元,年價(jià):400元
編輯|張毅
主編|黎坤
總編輯|吳新
爆料聯(lián)系:cpcfan1874(微信)
壹零社:用圖文、視頻記錄科技互聯(lián)網(wǎng)新鮮事、電商生活、云計(jì)算、ICT領(lǐng)域、消費(fèi)電子,商業(yè)故事。《中國(guó)知網(wǎng)》每周全文收錄;中國(guó)科技報(bào)刊100強(qiáng);2021年微博百萬(wàn)粉絲俱樂(lè)部成員;2022年抖音優(yōu)質(zhì)科技內(nèi)容創(chuàng)作者
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.