編輯|楊文、劉欣
AI 視頻圈從不缺「神仙打架」。
上周,快手可靈剛發布了 2.0 模型,號稱是史上最強視覺模型;昨天,生數科技就上線了全新視頻模型 Vidu Q1。
它不僅能直出 1080P 電影級高清視頻:
還能通過首尾幀功能實現大師級運鏡:
同時動畫生成效果也再上一個 level:
據視頻生成模型權威測評基準 VBench-1.0 以及 VBench-2.0 剛剛發布的測評結果,Vidu Q1 在 VBench 系列的兩個榜單上都超越了 Runway 、OpenAI Sora、快手的 Kling 等國內外頂尖模型,拿下文生視頻賽道榜單雙第一。
此外在國內權威大模型測評機構 SuperCLUE 的圖生視頻榜中,Vidu Q1 也在動漫風格、寫實風格上斬獲雙榜單第一的成績。
目前 Vidu Q1 已全球同步上線,無需邀請碼,打開 App 和網頁即可體驗,而且每秒生成價格最低僅需 0.3 元。
鏈接直達:https://www.vidu.cn/
Vidu Q1 實力到底如何,我們直接上手實測一波。
高清畫質、電影質感
此次發布的 Vidu Q1,在文生視頻和圖生視頻上均支持 1080P 高分辨率,無論是宏大的科幻敘事還是人物特寫的細微表情,都可以清晰呈現。
提示詞:富士膠片 Portra 400H 靜態照片,急馳的日產天際線 R33 GTR LM JGTC,大幅度運動效果,東京 7-11 便利店,午夜時分。
午夜的街道、跑車的極速漂移都生成得相當逼真,即使是大幅度運動畫面也沒崩。
提示詞:一位沖浪者在波濤洶涌的大海中駕馭巨浪,陽光透過浪花灑在沖浪者的身上,水花四濺,展現出勇敢和挑戰自我的精神。
Vidu Q1 精準地模擬了波浪起伏,男子沖浪時的快速移動也很絲滑,沒有任何卡頓或模糊。
提示詞:一位街頭小提琴手在雪花飄落的寧靜歐洲廣場上演奏,雪花落在她的發間,身后是燭光映照的窗戶。
Vidu Q1 嚴格遵循了文本描述,「雪花飄落」、「燭光映照的窗戶」等細節它都生成得很到位,而且女生拉小提琴時手指動作流暢自然,完全沒有出現缺失或多余的手指問題。
動畫風格
一直以來,Vidu 最讓人稱道的就是動畫效果。
不管是類似新海誠,宮崎駿,大友克洋風格的日本動畫,還是類似迪斯尼、皮克斯、彼得·道格特風格的美國動畫,Vidu 都能穩定輸出。
而這次上線的 Q1,相比于前一版本又有了大幅提升,支持更加多元風格的視頻輸出。
提示詞:動漫風格,一個男孩在鄉村小徑上騎自行車,兩旁是野花與高大的樹木,遠處可見有著木質房屋的小村莊,陽光明媚,氛圍寧靜而歡快。
提示詞:一個充滿魔法氣息的森林,地上開滿了會發光的奇異花朵,天空中飄著彩色的泡泡。一位穿著精靈服裝的少女站在畫面中央,她有著大大的眼睛和尖尖的耳朵,正好奇地伸手,周圍的一切都顯得夢幻而神秘。
提示詞:一只可愛的松鼠從樹洞里掏出松果,想吃掉松果。
X 網友 Naegiko 使用 Vidu Q1 制作了一則集合多種風格的短片,效果相當驚艷,尤其是對動漫人物面部表情的處理,甚是靈動。
https://x.com/naegiko/status/1914424072341217788
大師級運鏡
這次 Vidu Q1 的首尾幀功能也再次升級,僅需兩張圖,不僅能生成推拉搖移等各種鏡頭,還能自動腦補出電影質感的完整片段。
比如我們上傳這兩張圖,分別作為首幀和尾幀:
連提示詞都不用寫, Q1 直接讓馬斯克變身鋼鐵俠,效果相當酷炫。
再比如下面這個例子,同樣上傳首尾幀,無需提示詞,宇航員身上就長出了五顏六色的花朵。
此外,Q1 還能生成一系列高運動鏡頭。提示詞只簡單要求推進鏡頭,Q1 就能在鏡頭不斷推進的過程中,讓主角轉個身逐漸露出側臉。
下面這個視頻也是如此。首幀是一張海邊懸崖的圖片,尾幀是一張輪船在海上航行的圖片,然后 Q1 自動生成右移鏡頭,將兩幅圖片絲滑銜接在一起。
告別無聲電影
Q1 模型發布同時,Vidu 還推出了文生音效模型。只需一句話,即可生成最長 10 秒的專屬音效。
這也意味著,Vidu 打通了視頻創作的整個工作流,從視頻生成到音效生成,一個平臺就能搞定。
具體來說,該模型有三大技術創新亮點。
首先,用戶可以精準控制生成音效的時間,音效可以在 10 秒內的任意時間點開始生成。這也是目前為止業內商業領域首個支持精細化時間控制的文生音效系統。
比如 0s-4s 海浪拍打礁石、4s-6s: 輪船鳴笛:
其次,Vidu 的文生音效功能還支持多段音效疊加,并以一個完整的音頻文件輸出。例如,下面的示例中,通過多段音效的疊加,成功還原了火車經過的真實感。
或者是人聲鼎沸的熱鬧集市:
最后,相比于業內普遍只能生成 16KHz 或者 32KHz,Vidu 的音效已經可以做到 48KHz 的音樂級采樣率和保真度,這也是文生音效在商業化領域中首家做到 48KHz 的高保真音效。
我們還可以用 Vidu 的文生音效功能探索更多玩法,比如生成一段搖滾樂:
總體來說,Vidu Q1 的優勢不僅在于高清畫質和穩定的視頻表現,還在于為創作者提供了一套完整的視頻創作解決方案。從 1080P 高清視頻生成、多風格動畫渲染、專業級運鏡,再到全新的文生音效功能,Vidu 幾乎覆蓋了視頻創作的全部環節。
同時,每秒生成成本低至 0.3 元的定價策略,僅為同行的十分之一,這也為個人創作者和中小企業提供了更經濟實惠的選擇。
大家快去 Vidu 網站和 Vidu 手機端體驗一波吧。
? THE END
轉載請聯系本公眾號獲得授權
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.