AI好好用報道
編輯:楊文
一手實測。
騰訊打了場「閃電戰(zhàn)」。
3 月 3 日,騰訊元寶反超 DeepSeek,登頂中國區(qū)蘋果 AppStore 免費榜榜單第一。
要知道,春節(jié)前,騰訊元寶的排名還在 200 名開外,在一眾大模型面前就是個「小卡拉米」,但自從接入 DeepSeek 后,僅用了 10 天時間,就一口氣殺到榜單第二。
緊接著又用了不到 10 天,坐上了這頭把交椅。
騰訊元寶的廣告貼得到處都是。
刷個公眾號、朋友圈,冷不丁就跳出個「「騰訊元寶,AI 人工智能專家」的字樣:
充個話費,微信「生活服務(wù)」欄里就赫然躺著個「元寶下載」:
搜索個信息,也能在微信搜索欄下方瞅見它:
聽個歌吧,一打開 QQ 音樂,開屏廣告就是它;在騰訊視頻追個劇,暫停一下還是它;甚至開個會,都逃不過它。
此外,B 站、小紅書、微博等各類 APP 中也都有元寶的身影。
騰訊元寶瘋狂拉新的同時,混元視頻也沒閑著。
3 月 6 日,騰訊混元終于上線并開源了圖生視頻模型。
體驗鏈接:https://video.hunyuan.tencent.com/
只需要上傳一張圖片,輸入提示詞,就能生成一段自帶配音的 5 秒視頻。
視頻畫質(zhì)最高可達 2K 高清。
接下來,我們就去體驗一下。
表情控制
表情是人類交流中最直觀、最重要的部分。
一個微笑、一個皺眉,甚至一個眼神的微妙變化,都能傳遞出豐富的情感信息。
如果 AI 生成的視頻中人物表情僵硬、不自然,觀眾會立刻感到疏離,甚至?xí)X得「一眼假」。
我們就先來試試混元 AI 視頻的「表情控制」能力。
前兩天,第 97 屆奧斯卡金像獎獲獎名單出爐,阿德里安?布勞迪憑借電影 《 野獸派 》,拿下最佳男主角。
我們上傳了一張他以往的劇照,然后輸入提示詞:男人悲傷地流淚。
?
畫面中的阿德里安立馬鮮活起來。
他的眉頭微微皺起,眼中閃爍著淚光,淚水緩緩地從眼眶中溢出,順著臉頰滑落,頭部還微微抖動。
不過可惜的是,混元自動生成的配音對不上。
我們又上傳了一張 Midjourney 生成的人物特寫照,輸入的提示詞也很簡單:男人微笑起來。
?
混元生成的視頻中,白發(fā)老人時而緊盯鏡頭,時而目光低垂。
微笑時,眼睛瞇起,眼角的皺紋更加明顯,嘴巴微張上揚,露出幾顆牙齒,整個表情逼真自然,同時還伴隨著身體的動作,使畫面更不顯呆板。
劇情向
如果我們把提示詞寫得稍微復(fù)雜一些,混元還能生成堪比電影大片的劇情向視頻。
比如,我們輸入提示詞:老人坐在長椅上,這時從畫面右側(cè)走過來一個年輕女性,看著老人。
混元嚴(yán)格遵循了文本描述。視頻一開始,一位老人獨自坐在公園的長椅上,背對著鏡頭,隨著老人目光的移動,畫面右側(cè)走進一名身穿黑色風(fēng)衣的年輕女性。
雖然她的運動幅度較大,但并沒有出現(xiàn)左右腿不分或者四肢亂飛的畸變問題。
它還發(fā)揮想象力,在遠處生成了幾輛汽車緩緩駛過,讓畫面更加充實,場景也更加逼真。
我們還截取了《傲慢與偏見》中凱拉?奈特利的一幀畫面,提示詞:女生坐在秋千上,畫面左側(cè)走過來一個男人。
視頻中,女主輕輕蕩著秋千,男人從左側(cè)入畫,順勢移步到女主的身后,整套動作流暢自然,幾乎挑不出什么毛病。
不過遺憾的是,女主的面貌發(fā)生了改變,已經(jīng)不是凱拉?奈特利,這也說明混元在主體一致性方面還有進步空間。
再比如下面這則混元生成的視頻,無論是對提示詞的遵循,還是對運動細節(jié)的處理都很到位,但也犯了同樣的毛病 —— 人物的面貌會發(fā)生變化。
(提示詞:女生正走在路上,畫面左側(cè)走過來一個男人,手里拿著一捧玫瑰花。)
制作廣告片
去年 AI 視頻生成模型集中爆發(fā)時,不少網(wǎng)友開始使用 AI 制作廣告片。
這次混元的「圖生視頻」功能上線后,AI 廣告制作者又多了一個選擇。
比如,我們丟給它一張樹莓冰激凌的圖片:
為了讓生成效果更佳,我們可以使用接入 DeepSeek 的騰訊元寶來寫提示詞。
由于混元「圖生視頻」提示詞不能超過 200 字,我們可以將其簡化一下:
超現(xiàn)實主義美食 CG 動畫,4K 分辨率,主體為慢旋轉(zhuǎn)的威化甜筒冰淇淋特寫,展示細膩乳脂從頂端緩緩滑落的黏稠質(zhì)感,5 顆帶露珠的覆盆子依次彈跳濺起水花,背景暖橙色漸變光暈中漂浮著動態(tài)冰晶粒子,Phantom 高速攝影捕捉水滴飛濺。
上效果:
(配音為混元自動生成)
再來一個香水的廣告看看效果:
(提示詞:超現(xiàn)實香水廣告 CG,中心懸浮的 Art Deco 風(fēng)格藍水晶香水瓶緩慢自轉(zhuǎn),蝶群環(huán)繞飛舞。配音為混元自動生成。)
此外,我們還發(fā)現(xiàn),除了圖生視頻功能外,混元視頻還上線了對口型和動作驅(qū)動功能。
我們只需一張不帶手的頭肩半身照,外加一段 10 秒的音頻或者是輸入希望角色說出的內(nèi)容即可。
比如女版馬斯克唱《紅色高跟鞋》:
我們還可以上傳圖片,選擇動作模版,即可一鍵生成同款動作驅(qū)動視頻。
比如讓哪吒跳廣場舞:
以后我們會帶來更多的AI評測,也歡迎大家進群交流。
? THE END
轉(zhuǎn)載請聯(lián)系本公眾號獲得授權(quán)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.