近兩年,生成AI無疑是頂會寵兒!5月ICLR’24公布了杰出論文獎,紐大的擴散模型研究位列其中;6月CVPR’24公布了兩篇最佳論文,也皆與生成AI有關;7月ICML’24最佳論文十篇里,SD3、Genie等基于擴散模型的生成創新同樣獲獎。
有一說一,圖生視頻這項功能本身在視頻AI領域已不新奇,但難的是生成效果好,體驗過后不難發現騰訊的開源視頻生成模型HunyuanVideo可以稱得上大模型的第一梯隊。
為了幫助大家掌握混元視頻生成大模型原理與本地部署,研夢非凡于3月27日晚(周四),邀請了大模型資深算法工程師張導師,獨家詳解《騰訊重磅開源HunyuanVideo,偉大無需多言》(AI前沿直播課NO.96),從現有開源生成模型回顧,重點講解HunyuanVideo的算法研究、本地部署演示,1節課吃透HunyuanVideo架構原理,一節課get免費的國產Sora部署!
掃描二維碼找助教0元預約直播課!
凡預約即可免費領取100篇擴散模型論文(43篇CVPR'25 最新收錄)
直播課內容概覽 01 論文背景
現有開源視頻生成模型的不足及關鍵挑戰
HuanyuanVideo的目標
HunyuanVideo數據預處理
數據過濾
數據標注
3D Variational Auto-Encoder
統一圖像與視頻生成架構
核心組件(重要)
雙流到單流 Transformer
3D 旋轉位置編碼(RoPE)
多尺度生成支持
文本編碼器
Model Scaling
Image model scaling law
video model scaling law
圖像預訓練:兩階段漸進策略
視頻 - 圖像聯合訓練:多維度分桶策略
漸進式課程學習
圖像 - 視頻混合訓練
掃描二維碼找助教0元預約直播課!
凡預約即可免費領取100篇擴散模型論文(43篇CVPR'25 最新收錄)
導師介紹
張老師
985高校碩士畢業,現在某上市公司擔任高級算法工程師,在自動駕駛感知領域有超5年工作經驗,熟練掌握python、pytorch。
對目標檢測、目標跟蹤、圖像分割、點云、多模態、模型輕量化和部署方向有多年的項目經驗。
研夢非凡可指導的研究方向
主流方向科研論文常用方法
研夢非凡現有idea
研夢非凡科研論文指導方案
idea并不是直接拍腦門拍出來的,是一遍一遍實驗、跑代碼、改模型、思路修正的過程中產生的。研夢非凡1V1定制化論文指導,和研夢導師一起找idea,研夢導師指導實驗,共同解決數據問題。授之以漁——搭建論文寫作框架,增刪改查,針對性實驗指導!哪里薄弱補哪里!
全程1v1論文輔導掃碼咨詢助教
研夢非凡導師團隊
研夢非凡的導師來自海外QStop50、國內華五、C9、985高校的教授/博士導師/博士后,世界500強公司算法工程師,以及國內外知名人工智能實驗室研究員。
這是一支實力強大的高學歷導師團隊,在計算機科學、機器學習、深度學習等領域,積累了豐富的科研經歷,研究成果也發表在國際各大頂級會議和期刊上,在指導學員的過程中,全程秉持初心,堅持手把手個性化帶教。包括但不限于以下導師~~
<<< 左右滑動見更多 >>>
研夢非凡隸屬于蘇州研途教育,深耕考研輔導行業13年,累計服務1w+付費學員(60%高校學生/教師,40%職場精英);科研為本,質量為先!我們有:500+ 國內外頂尖高校博士/教授,互聯網大廠/獨角獸公司的高級算法科學家組成的教師團隊;深度定制的科研服務,根據每位學員的實際情況,提供個性化的科研輔導方案,確保交付結果;一站式、全方位科研支持,從選題到方案設計,從實驗實施到論文撰寫、成果發表,4V1全流程保姆式服務!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.