AI好好用報(bào)道
編輯:楊文
騰訊混元生成的AI電影鏡頭,讓我想到《天使愛(ài)美麗》、《花樣年華》。
從上周六開(kāi)始,AI 視頻圈又炸鍋了。
;緊接著 ,網(wǎng)友們瘋狂整活。
國(guó)內(nèi)的 AI 廠商也沒(méi)閑著。
最讓人驚喜的是,騰訊混元也下場(chǎng)搞視頻生成模型了。
目前,該視頻模型已經(jīng)開(kāi)啟小范圍內(nèi)測(cè)。我們?cè)诘谝粫r(shí)間拿到體驗(yàn)資格。
與其他視頻生成模型類似,僅需輸入一句提示詞,騰訊混元就能生成一段 5 秒視頻。
它支持中英文輸入,還有 5 種畫面尺寸可供選擇。
先放幾個(gè)視頻給大家「嘗嘗鮮」:
繁華的巴黎,一個(gè)頭戴棕色貝雷帽的男人正坐在咖啡館里沉思。
一位年輕時(shí)髦的女人走向窗邊,然后轉(zhuǎn)身凝視旁邊的男人,動(dòng)作流暢自然。
兩位小姐姐坐在街邊相顧無(wú)言,鏡頭切換、人物神態(tài)簡(jiǎn)直和電影別無(wú)二致。
接下來(lái),我們就全方位測(cè)評(píng)一番。
畫質(zhì)
不得不說(shuō),混元視頻模型生成的畫面太有電影感了。
提示詞:一個(gè)電影般的背后跟隨鏡頭,拍攝一名女警背對(duì)著我們穿過(guò)夜晚的事故現(xiàn)場(chǎng)。
畫質(zhì)高清穩(wěn)定,人物動(dòng)作流暢。四處停放的警車,閃爍的警燈,勘查現(xiàn)場(chǎng)的警察…… 好萊塢元素拉滿。
提示詞:一個(gè)電影般的背后跟隨鏡頭,拍攝消防員背對(duì)著我們穿過(guò)熊熊烈火。
生成三個(gè)鏡頭,每個(gè)鏡頭都很有故事性。
混元很會(huì)控制景深。虛化的背景,讓主體運(yùn)動(dòng)更加突出,火焰的光影在消防員身上舞動(dòng),形成一種強(qiáng)烈的視覺(jué)沖擊。
再來(lái)個(gè)科幻風(fēng)格的電影。
提示詞:夜晚,一個(gè)機(jī)器人正行走在繁華的大街上,昏暗,近景鏡頭,科幻,生動(dòng),賽博朋克,高質(zhì)量。
這個(gè)長(zhǎng)得像擎天柱一樣的機(jī)器人,漫步在人潮涌動(dòng)的大街上,腦袋還時(shí)不時(shí)左右張望。
鏡頭隨著機(jī)器人的移動(dòng)而微微晃動(dòng),使得畫面更具真實(shí)感。
提示詞:一個(gè)男人坐在咖啡廳里喝咖啡,柔和,近景鏡頭,休閑,現(xiàn)代,電影風(fēng)格,高質(zhì)量。
視頻中,男人從端起咖啡、抿了一口到緩緩放下杯子,整套動(dòng)作一氣呵成。
男人的眼神、表情也生成得很是逼真,手指也沒(méi)出現(xiàn)明顯的 bug。
鏡頭切換
混元最值得稱道的,還是原生鏡頭切換效果。
它能夠自動(dòng)生成同一主體在不同視角下的鏡頭,并在視頻中進(jìn)行切換,以增強(qiáng)畫面的敘事感。
要知道,在此之前,只有 Sora 具備這種鏡頭切換效果。
比如下面這個(gè)視頻中,最初是個(gè)中景鏡頭,女人正手撐下巴思考,啪一下鏡頭轉(zhuǎn)換成女人面部大特寫,深邃眼眸、烈焰紅唇,再接著,鏡頭又切換到城市街景。
(提示詞:一個(gè)極端特寫鏡頭,聚焦于一位時(shí)髦的美麗女性,她坐在咖啡館里,深陷沉思,鏡頭切換到城市的街景,景深效果,電影般的 35 毫米膠片質(zhì)感,光線非常具有電影感。)
再如,雨滴打在玻璃上緩緩滑落,下一秒鏡頭就轉(zhuǎn)到窗外,男人撐著一把紅色的傘站在大街上,整個(gè)畫面很有氛圍感。
(提示詞:雨滴敲打著窗戶,鏡頭切換到下雨的大街上,有個(gè)男人正撐著一把紅色的傘,站在大街上 Overcast Somber Cinematic High-quality Modern Style)
運(yùn)動(dòng)效果
流暢的視頻運(yùn)動(dòng)可以提供更加連貫和平滑的視覺(jué)體驗(yàn),能夠增強(qiáng)角色動(dòng)作的真實(shí)感,因此,各家的視頻生成模型均在畫面運(yùn)動(dòng)上「做文章」,騰訊混元也不例外。
他們?cè)谶\(yùn)動(dòng)一致性方面下了功夫,減少了物體變形和運(yùn)動(dòng)不連貫的問(wèn)題。
提示詞:日落時(shí)分,一只烏龜在黑色沙灘上爬行。
雖然混元生成的畫面運(yùn)動(dòng)幅度大,但海龜爬行的動(dòng)作,以及沙灘場(chǎng)景變化自然真實(shí),沒(méi)有突兀的跳躍和不連貫。
我們又用 Sora 經(jīng)典提示詞試了下。
提示詞:A litter of golden retriever puppies playing in the snow. Their heads pop out of the snow, covered in. 中文提示詞:一窩金毛獵犬小狗在雪地里玩耍。它們的頭從雪地里冒出來(lái),渾身都是雪。
兩只小狗抬爪子、啃咬的動(dòng)作很逼真,身上的雪花也隨著打架的動(dòng)作抖落。
此外,它還能生成包含多個(gè)連貫動(dòng)作的視頻。
提示詞:男人走出臥室,關(guān)上門,看到一只可愛(ài)的毛茸茸的生物。
提示詞:女人摘下墨鏡,看著對(duì)面的男人笑了,光線柔和,愉快,現(xiàn)代,電影風(fēng)格,高質(zhì)量。
語(yǔ)義理解
混元視頻生成能力對(duì)提示詞撰寫的精細(xì)度與準(zhǔn)確度要求較高。用戶可以進(jìn)行細(xì)致的刻畫,例如生成主體的細(xì)節(jié),人物概念的組合等。
面對(duì)又長(zhǎng)又復(fù)雜的文字描述,混元基本能 get 到信息并進(jìn)行輸出。
提示詞:一支穿著厚重冬季裝備的極地探險(xiǎn)隊(duì),在呼嘯的暴風(fēng)雪中艱難前行,幾乎無(wú)法透過(guò)雪花看清彼此,冰柱附著在他們的胡須和派克服上,他們的臉上顯露出堅(jiān)定的決心,攝像機(jī)捕捉到一個(gè)中景鏡頭,展示了他們周圍風(fēng)暴的強(qiáng)度,寒冷、柔和的光線增添了一種孤立和堅(jiān)韌的感覺(jué)。
提示詞:日出時(shí)分,色彩鮮艷的熱氣球飄過(guò)廣闊的非洲大草原,成群的大象和瞪羚在下方的草原上移動(dòng)。遠(yuǎn)處,乞力馬扎羅山的影子映襯著粉紅色和橙色的天空。
經(jīng)過(guò)多輪測(cè)評(píng),總體來(lái)說(shuō)混元視頻生成模型還是有些本事傍身的,尤其是電影級(jí)畫質(zhì)和原生鏡頭切換,效果相當(dāng)能打。
和其他視頻生成模型一樣,它也有不少小「毛病」。比如,每次生成內(nèi)容具有不確定性,生成結(jié)果無(wú)法達(dá)到 100% 可控,同時(shí)輸入多個(gè)實(shí)體,可能不會(huì)都生成出來(lái),顏色和數(shù)量也未必匹配等。
不過(guò)混元大模型仍在升級(jí)和調(diào)試中,未來(lái)或許有更好的表現(xiàn)。
以后我們會(huì)帶來(lái)更多好玩的AI應(yīng)用,也歡迎大家進(jìn)群交流。
? THE END
轉(zhuǎn)載請(qǐng)聯(lián)系本公眾號(hào)獲得授權(quán)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.