99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

近千個反現實視頻構建了「不可能」基準,哪個AI不服?來戰!

0
分享至



白澤琛,新加坡國立大學 Show Lab 博士生,他的研究方向主要包括視頻理解和統一的多模態模型,在 CVPR、ICCV、NeurIPS、ICLR 等會議發表多篇文章;曾在 Amazon AI 擔任 Applied Scientist,在 ByteDance、Baidu 擔任 Research Intern。

茲海,新加坡國立大學 Show Lab Research Fellow,于北京大學獲得博士學位,主要研究方向為多模態模型的安全。

Mike Zheng Shou,PI,新加坡國立大學校長青年教授,福布斯 30 under 30 Asia,創立并領導 Show Lab 實驗室。

"當物理、生命、地理與社會規律被顛覆,多模態模型(LMMs)是否還能識別它們的 “不可能性”?"

隨著人工智能合成視頻(AIGC)技術的飛速發展,我們正步入一個由 AI 主導的視頻創作時代。當前的 AI 視頻生成技術可以逼真地模擬現實世界,但在 “反現實”(anti-reality)場景方面仍然存在巨大的探索空間。

來自 NUS 的團隊提出了 Impossible Videos 概念,即那些違背物理、生命、地理或社會常識的視頻,并構建了 IPV-BENCH,一個全新的基準,用于評測 AI 模型在 “反現實” 視頻生成與理解方面的極限能力。



  • 論文標題:Impossible Videos
  • 論文鏈接:https://arxiv.org/abs/2503.14378
  • 項目主頁:https://showlab.github.io/Impossible-Videos/
  • 代碼開源:https://github.com/showlab/Impossible-Videos
  • Hugging Face: https://huggingface.co/datasets/showlab/ImpossibleVideos

Impossible Videos 示例,包括物理、生物、地理和社會規范下的不可能場景

為什么 Impossible Videos 重要?

當前的合成視頻數據集大多模擬現實世界,而忽略了真實世界中不可能發生的反現實場景。

我們嘗試回答兩個核心問題:

1、現有的視頻生成模型是否能按照提示生成高質量的 “不可能” 視頻?

2、現有的視頻理解模型是否能夠正確識別和解釋 “不可能” 視頻?

Impossible Videos 的研究將推動:

  • 更強大的 AI 視覺推理能力。
  • 更深入的 AI 物理、社會和常識性理解。
  • 更安全可控的 AI 內容生成能力。

IPV-BENCH:首個 Impossible Video 基準

我們構建了 IPV-BENCH,一個涵蓋 四大領域(物理、生物、地理、社會),共 14 個類別 的基準,用于評測視頻模型的生成和理解能力。一共包含 260 個文本提示,902 個高質量 AI 生成 impossible videos,及相應反事實事件標注。與現有其他基準數據集相比,IPV-BENCH 擁有更豐富全面的數據模態及標注。

Impossible Videos 分類



Benchmark 統計數據



關鍵結果分析

1. 評測主流 AI 視頻生成模型

使用 IPV-BENCH 提供的 260 條文本提示,我們測試了多個主流的開源和閉源 AI 視頻生成模型,如 OpenAI Sora、Kling、HunyuanVideo 等。我們提出了評價指標 IPV-Score,綜合考慮生成視頻的視覺質量以及提示遵循情況。發現:

  • 大多數模型難以生成符合 “不可能” 概念的高質量視頻。表現最佳的 Mochi 1 也僅在 37.3% 的例子中生成了高質量且符合提示要求的 “不可能” 視頻,大多數模型的成功率徘徊在 20% 左右。
  • 模型在視頻質量以及提示遵循兩方面能力不均衡。商業模型在視覺質量上遙遙領先,但是難以嚴格遵循文本提示生成 “不可能” 事件。開源模型如 Mochi 1 視覺質量雖然遜色,但是提示遵循能力遠強于閉源模型。
  • 影響生成能力的兩點限制:1)“不可能” 的文本提示作為分布外數據,容易引起 artifacts,造成視頻質量下降。2)過度強調對事實規律的遵循限制了模型的創造力。



各視頻生成模型評估結果





視頻生成模型的失敗案例。(上) Mochi 1: A car was driving on a country road when it suddenly began to leave the ground and fly into the sky. (下) Sora: On a city street, a yellow car gradually turns green as it drives.

2. 評測主流 AI 視頻理解模型

使用 902 個高質量視頻以及對應的人工標注,我們構建了三個不同任務評測主流多模態理解模型對超現實現象的理解能力,包括:1)AI 生成視頻判斷任務(Judgement),2)“不可能” 事件識別任務(選擇題,MC),3)“不可能” 事件描述任務(自然語言,Open)。



“不可能” 事件識別任務示例



“不可能” 事件描述任務示例

根據是否需要時域線索進行判斷,我們將 “不可能” 事件劃分為空域 (Spatial) 和時域(Temporal)兩類。 分析實驗結果可以發現:

  • 現有模型展示出了對 “不可能” 事件一定程度的理解能力。在 “不可能” 事件識別任務(MC)中,現有模型在區分選項中的不可能事件和其他事件方面展示了較大的潛力。然而,在沒有選項線索的開放描述任務中(Open),模型從視頻中直接推理并解釋” 不可能” 事件仍舊困難。
  • 物理規律類視頻的理解更具挑戰、生物、社會、地理類的視頻理解相對容易。
  • 現有模型在時域動態推理方面仍存在不足。模型在時域任務上的性能顯著低于在空域任務上的性能。



視頻理解模型在各類別任務上的表現



視頻理解模型在空域和時域任務上的表現

總結與未來方向


  • 首個 Impossible Videos Benchmark: 提供標準化評測體系。
  • 新挑戰:從反事實的視角評測模型對現實世界規律的理解。
  • 面向未來:當前多模態模型在 “不可能” 事件理解、 時域推理、反事實生成 等方面仍存在巨大挑戰。基于 Impossible Videos 的數據增強、模型微調等是幫助模型掌握世界規律的新視角。

參考文獻

[1] Huang, Ziqi, et al. "Vbench: Comprehensive benchmark suite for video generative models." Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2024.

[2] Ye, Junyan, et al. "Loki: A comprehensive synthetic data detection benchmark using large multimodal models." arXiv preprint arXiv:2410.09732 (2024).

[3] Kong, Weijie, et al. "Hunyuanvideo: A systematic framework for large video generative models." arXiv preprint arXiv:2412.03603 (2024).

[4] Bai, Zechen, Hai Ci, and Mike Zheng Shou. "Impossible Videos." arXiv preprint arXiv:2503.14378 (2025).

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
慘烈!江蘇常州凌晨發生交通事故,現場一片狼藉!

慘烈!江蘇常州凌晨發生交通事故,現場一片狼藉!

小人物看盡人間百態
2025-04-10 21:52:40
華南師范大學連夜通報:成立調查組第一時間啟動調查

華南師范大學連夜通報:成立調查組第一時間啟動調查

新京報政事兒
2025-04-11 07:31:53
斯諾克世錦賽:傅家俊打出16套紅球清臺破百,成為歷史第7人

斯諾克世錦賽:傅家俊打出16套紅球清臺破百,成為歷史第7人

懂球帝
2025-04-11 09:31:10
"不跳是狗!"湖北一男子被朋友激將,跳水溺亡,朋友竟冷眼旁觀

"不跳是狗!"湖北一男子被朋友激將,跳水溺亡,朋友竟冷眼旁觀

派大星紀錄片
2025-04-11 15:42:41
媽呀!這是梁洛施?出席活動被拍 好像貴婦版張柏芝??!

媽呀!這是梁洛施?出席活動被拍 好像貴婦版張柏芝啊!

小椰的奶奶
2025-04-11 18:34:39
比關稅更可怕的是,商品接下來應該賣給誰?

比關稅更可怕的是,商品接下來應該賣給誰?

羅sir財話
2025-04-11 11:41:52
吳鎮宇:香港男人都要感謝張智霖,他連袁詠儀都敢娶,放過了別人

吳鎮宇:香港男人都要感謝張智霖,他連袁詠儀都敢娶,放過了別人

姩姩有娛呀
2025-04-11 03:07:32
局長兒子囂張跋扈打斷同學門牙,同學母親亮明身份,對方下跪求饒

局長兒子囂張跋扈打斷同學門牙,同學母親亮明身份,對方下跪求饒

真實故事匯
2023-12-19 21:59:16
九十年代的臥鋪大巴亂成啥樣?網友:我的初次就是在上面丟的

九十年代的臥鋪大巴亂成啥樣?網友:我的初次就是在上面丟的

娛樂圈人物大賞
2025-04-10 01:15:06
萬斯對中國改稱呼,中方也送美國一個新名字,特朗普已等不到電話

萬斯對中國改稱呼,中方也送美國一個新名字,特朗普已等不到電話

墜入二次元的海洋
2025-04-12 01:04:38
57歲大學教授鋼鐵廠夜會小三,二人雙雙掉入冶煉爐,真相脊背發涼

57歲大學教授鋼鐵廠夜會小三,二人雙雙掉入冶煉爐,真相脊背發涼

罪案洞察者
2025-04-02 10:44:17
突發!亞馬遜無法發貨!

突發!亞馬遜無法發貨!

跨境老鳥Mike
2025-04-11 11:28:15
證監會持續發力!4月12日,今日凌晨的三大重要消息全面來襲

證監會持續發力!4月12日,今日凌晨的三大重要消息全面來襲

風口招財豬
2025-04-12 00:40:46
謝賢遮羞布被揭,公開和張柏芝關系,謝霆鋒得知后急忙否認

謝賢遮羞布被揭,公開和張柏芝關系,謝霆鋒得知后急忙否認

她時尚丫
2025-04-11 15:20:54
前男籃隊長這氣度?垃圾時間一舉動敗人品,球迷:活該拿不到冠軍

前男籃隊長這氣度?垃圾時間一舉動敗人品,球迷:活該拿不到冠軍

弄月公子
2025-04-11 08:27:20
山西全民“等風來”:極端大風中的城市“攻防戰”

山西全民“等風來”:極端大風中的城市“攻防戰”

環球網資訊
2025-04-11 20:40:05
不裝了?華為撕下臺積電“遮羞布”,張忠謀翻臉:追加1000億投資

不裝了?華為撕下臺積電“遮羞布”,張忠謀翻臉:追加1000億投資

大衛聊科技
2025-04-03 13:10:44
最后一次,中方對所有美國商品加稅125%,只給美國8個小時考慮

最后一次,中方對所有美國商品加稅125%,只給美國8個小時考慮

南宗歷史
2025-04-11 19:38:44
馬英九:若大陸統一臺灣的手段不和平,過程不民主,臺灣人不接受

馬英九:若大陸統一臺灣的手段不和平,過程不民主,臺灣人不接受

紅色鑒史官
2025-04-08 23:05:02
排面十足!汪小菲“我愛妻”婚禮將舉行,馬筱梅婚紗鑲999顆鉆!

排面十足!汪小菲“我愛妻”婚禮將舉行,馬筱梅婚紗鑲999顆鉆!

烏娛子醬
2025-04-11 22:42:40
2025-04-12 04:19:00
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
10345文章數 142293關注度
往期回顧 全部

科技要聞

單臺年入20萬!首批人形機器人致富者來了

頭條要聞

專家:不用太擔心關稅 現在要看的是中美雙方誰扛不住

頭條要聞

專家:不用太擔心關稅 現在要看的是中美雙方誰扛不住

體育要聞

球迷天天罵,但我們要進歐冠了

娛樂要聞

汪小菲馬筱梅婚禮又有了耐人尋味的新聞

財經要聞

造假累計數百億 揭秘東旭集團造假手法

汽車要聞

25款風云A8/T9/T10齊上市 多款車型發布一口價

態度原創

家居
藝術
本地
數碼
軍事航空

家居要聞

浪漫與優雅 不被定義的現代法式

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

本地新聞

華北將迎“歷史罕見”大風

數碼要聞

蘋果員工越來越有信心推遲推出的個性化Siri體驗將于“今年秋季”發布

軍事要聞

蘇丹西部一難民營遭炮擊 至少150人傷亡

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 东乡| 忻城县| 华容县| 砚山县| 山东省| 明溪县| 天峨县| 温宿县| 丹阳市| 鄢陵县| 大渡口区| 桃园市| 杭锦旗| 会昌县| 郁南县| 扎囊县| 天水市| 宿迁市| 卢湾区| 获嘉县| 会东县| 望谟县| 黄平县| 城口县| 淄博市| 龙州县| 余干县| 石狮市| 永修县| 浦东新区| 襄垣县| 历史| 莎车县| 宣威市| 金秀| 班玛县| 庄浪县| 县级市| 镇宁| 拉萨市| 宜州市|