網易首頁 > 網易號 > 正文申請入駐

生成AI拿下3大頂會最佳！2025投稿新風向！

2025-03-20 10:03:49　來源: 人工智能研究

貴州舉報

分享至

近兩年，生成AI無疑是頂會寵兒！5月ICLR’24公布了杰出論文獎，紐大的擴散模型研究位列其中；6月CVPR’24公布了兩篇最佳論文，也皆與生成AI有關；7月ICML’24最佳論文十篇里，SD3、Genie等基于擴散模型的生成創新同樣獲獎。

有一說一，圖生視頻這項功能本身在視頻AI領域已不新奇，但難的是生成效果好，體驗過后不難發現騰訊的開源視頻生成模型HunyuanVideo可以稱得上大模型的第一梯隊。

為了幫助大家掌握混元視頻生成大模型原理與本地部署，研夢非凡于3月27日晚（周四），邀請了大模型資深算法工程師張導師，獨家詳解《騰訊重磅開源HunyuanVideo,偉大無需多言》（AI前沿直播課NO.96），從現有開源生成模型回顧，重點講解HunyuanVideo的算法研究、本地部署演示，1節課吃透HunyuanVideo架構原理，一節課get免費的國產Sora部署！

掃描二維碼找助教0元預約直播課！

凡預約即可免費領取100篇擴散模型論文（43篇CVPR'25 最新收錄）

直播課內容概覽 01 論文背景

現有開源視頻生成模型的不足及關鍵挑戰
HuanyuanVideo的目標

02 HunyuanVideo的整體流程框架

HunyuanVideo數據預處理

數據過濾
數據標注

03 HunyuanVideo模型結構（重要）

3D Variational Auto-Encoder
統一圖像與視頻生成架構
核心組件（重要）

雙流到單流 Transformer
3D 旋轉位置編碼（RoPE）
多尺度生成支持

文本編碼器
Model Scaling

Image model scaling law
video model scaling law

04 HunyuanVideo模型預訓練

圖像預訓練：兩階段漸進策略
視頻 - 圖像聯合訓練：多維度分桶策略
漸進式課程學習
圖像 - 視頻混合訓練

05 HunyuanVideo模型加速 06 HunyuanVideo本地部署演示（重要）

掃描二維碼找助教0元預約直播課！

凡預約即可免費領取100篇擴散模型論文（43篇CVPR'25 最新收錄）

導師介紹

張老師

985高校碩士畢業，現在某上市公司擔任高級算法工程師，在自動駕駛感知領域有超5年工作經驗，熟練掌握python、pytorch。

對目標檢測、目標跟蹤、圖像分割、點云、多模態、模型輕量化和部署方向有多年的項目經驗。

研夢非凡可指導的研究方向

主流方向科研論文常用方法

研夢非凡現有idea

研夢非凡科研論文指導方案

idea并不是直接拍腦門拍出來的，是一遍一遍實驗、跑代碼、改模型、思路修正的過程中產生的。研夢非凡1V1定制化論文指導，和研夢導師一起找idea，研夢導師指導實驗，共同解決數據問題。授之以漁——搭建論文寫作框架，增刪改查，針對性實驗指導！哪里薄弱補哪里！

全程1v1論文輔導掃碼咨詢助教

研夢非凡導師團隊

研夢非凡的導師來自海外QStop50、國內華五、C9、985高校的教授/博士導師/博士后，世界500強公司算法工程師，以及國內外知名人工智能實驗室研究員。

這是一支實力強大的高學歷導師團隊，在計算機科學、機器學習、深度學習等領域，積累了豐富的科研經歷，研究成果也發表在國際各大頂級會議和期刊上，在指導學員的過程中，全程秉持初心，堅持手把手個性化帶教。包括但不限于以下導師～～

<<< 左右滑動見更多 >>>

研夢非凡隸屬于蘇州研途教育，深耕考研輔導行業13年，累計服務1w+付費學員（60%高校學生/教師，40%職場精英）；科研為本，質量為先！我們有：500+ 國內外頂尖高校博士/教授，互聯網大廠/獨角獸公司的高級算法科學家組成的教師團隊;深度定制的科研服務，根據每位學員的實際情況，提供個性化的科研輔導方案，確保交付結果;一站式、全方位科研支持，從選題到方案設計，從實驗實施到論文撰寫、成果發表，4V1全流程保姆式服務！

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.