01
圖生視頻進入生產力變現階段
在AI視頻生成技術爆發的2025年,"開局一張圖,故事全靠AI"已成為內容創作者的日常。
在AI視頻生成大生態里面,圖生視頻(Image-to-Video)賽道因技術門檻高、商業化潛力大,很早就成為全球科技巨頭與創業公司競逐的焦點。阿里“Animate Anyone”模型可將靜態服裝模特圖轉化為動態走秀視頻,極大降低電商廣告成本;商湯科技推出的“AI冰冰”數字人,則展示了虛擬主播的逼真表現力。
不過對于大眾而言,對“圖生視頻”的體驗更多還停留在抖音、嗶哩嗶哩等UGC平臺,在平臺預設模板的幫助下,通過“一張照片+一句話”即可生成創意短視頻,但對于想要真正嘗試內容創作路線,將自己的想法編成視頻內容的用戶,通義萬相、即夢AI、可靈AI、海螺AI這樣的主流“圖生視頻”創作平臺又該如何選擇呢?
02
平臺定位差異開始
可靈AI愈發專業
從專業視頻工作者的角度看,通義萬相、即夢AI、可靈AI、海螺AI這四個平臺雖在功能表述上接近,但其技術內核卻有明顯區別的。
通義萬相2.1基于自研的高效VAE和DiT架構,其核心創新在于將長視頻拆分為“塊”(Chunk),通過緩存中間特征降低顯存消耗,解決了長視頻生成的算力瓶頸,而即夢AI最新推出的OmniHuman多模態模型,該模型為閉源,重點服務于短視頻創作者,主打“一鍵式”高效創作。海螺AI則上線了一個新模型I2V-01-Director,將精準運鏡作為主打功能。
而當年憑借時長和高清畫面緊追Sora的可靈AI,僅半年多時間已進行20余次更新升級,在迭代速度和可用性上已經和Sora拉開身位。新推出的“多圖參考”模式, 能夠理解和整合多個圖片中的不同主體,根據用戶的文字描述,創造性地生成融合視頻,進一步攻克了AI視頻生成中的一致性難題。
對于用戶而言,可靈AI的“圖生視頻”功能是最為“豐富”的,從首位幀、多圖參考到創意特效,用戶完全可以根據自己需求選擇相應模式,且每個模式下提供了照片描述、參數設置、運鏡控制(1.6模型暫不支持),對于有一定創作經驗的用戶而言,可靈AI明顯在UI界面和功能設計上領先。
03
實測
AI離讀懂圖稍欠火候
筆者原本的意圖是想生成一段少女騎龍貓在彩虹上奔跑的視頻,給AI提供了一張少女的正臉圖片配上詳細的提示詞。
畫面主體 :一位身著輕便衣裙、活力滿滿的少女,騎在造型憨態可掬、體型稍大且毛茸茸的龍貓身上,龍貓邁開大步歡快奔跑。
場景構圖 :腳下是一道色彩鮮艷、橫跨天際的彩虹,彩虹有清晰的七彩漸變,周圍天空湛藍如洗,點綴著幾朵輕柔的白云,陽光明媚但不刺眼,從合適角度灑下,給畫面籠罩一層夢幻暖光。
細節元素 :少女頭發隨風飄動,臉上洋溢著燦爛笑容,雙手緊緊抱著龍貓,龍貓耳朵也被風吹得晃動,彩虹表面有淡淡的光影流轉效果,就好像有細小的光芒在跳躍。
氛圍營造 :整體氛圍輕松愉悅、充滿童話夢幻感,畫面節奏輕快,仿佛能聽到歡快的童話音樂與奔跑時帶起的呼吁聲。
原本以為如此詳細的提示詞,加上清晰的頭像照片,AI平臺會輕松幫我們圓夢少女騎龍貓的兒時愿望,可實際結果是各平臺成品效果讓人看得直搖頭。
在測試的四個平臺中,即夢AI顯然沒有明白“騎”龍貓的含義,將少女頭像和龍貓身體直接拼接在了一起,簡直讓人不忍直視,而海螺AI則完全不在乎筆者給出的少女頭像照片,倒是按照它自己對提示詞的理解生成了一段純卡通動漫,這樣的內容顯然 也是不合格的。唯獨通義萬相將少女頭像卡通畫后按要求完成了視頻的生成,還為龍貓加入了嘴部細節動作,只是整體大背景依舊未能擺脫三毛特效的既視感。
而在前面界面設計表現不錯的可靈AI在最終的生成環節卻給出“排隊中,預計等待大于3小時”的提示,顯然,對于單純想要在朋友圈秀一下或者快速制作短視頻內容的用戶而言,這樣的等待時間明顯過長了。
04
按需選擇,場景為王
相較文生視頻,AI大模型在“圖生視頻”上的表現多少有些不如人意。當然,可能也是筆者在視頻內容設計上較為復雜,目前“圖生視頻”功能可能更適合“讓人物微笑”“湖面水波蕩漾”一類相對簡單的“動圖”模式,只不過恐怕很難同大眾腦中的“生產力”工具掛上鉤。
事實上,每個AI大模型平臺的“圖生視頻”功能并不止于此。海螺AI就在“圖生視頻”和“文生視頻”兩項外,提供了“主體參考”模式,筆者在該模式下上傳任務照片和相應描述,其畫面生成效果明顯更符合筆者所需。即夢AI也提供多種視頻模型供用戶選擇,以滿足用戶不同風格內容生成的需求。
從這里也可以看出,當下“圖生視頻”模式的運用,更多還是要用戶選擇適合的模式。而隨著技術迭代,AI視頻工具將更注重多模態交互與場景定制化。
當前,通義萬相已開源模型推動生態發展,可靈AI推出“AI試衣”等垂直功能,均預示著行業正從通用化向專業化細分。對于創作者而言,選擇工具時需權衡生成質量、成本與場景適配性,才能將AI的生產力價值最大化。
微信訂閱
歡迎通過郵局渠道訂閱2025年《電腦報》
郵發代號:77-19
單價:8元,年價:400元
編輯|張毅
主編|黎坤
總編輯|吳新
爆料聯系:cpcfan1874(微信)
壹零社:用圖文、視頻記錄科技互聯網新鮮事、電商生活、云計算、ICT領域、消費電子,商業故事。《中國知網》每周全文收錄;中國科技報刊100強;2021年微博百萬粉絲俱樂部成員;2022年抖音優質科技內容創作者
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.