瘋了,全都瘋了。
昨天一天時間,來了N個大貨:
早上MiniMax上線TTS,字節上線AI編程Trae;下午字節全量上線豆包實時語音;晚上DeepSeek開源R1性能直接對標OpenAI o1,然后Kimi的k1.5直接正面硬剛。
這感覺就是一波撒完,直接回家過年了。。。
昨天的余溫還沒過,今天下午,騰訊混元又悄悄開了個閉門發布會,作為混元的老基友,我自然是受邀參加期期不落。
在這個閉門會上,混元直接又為這個AI年味添磚加瓦,開源了他們最新一代的3D大模型:
Hunyuan3D-2.0
甚至因為知道很多人不會部署,就想快速用一下,還貼心的做了個線上的應用,騰訊的產品體驗,那還是拉滿的。。。
過年了,開源社區真的過年了。
DeepSeek、混元、智譜、通義、面壁智能,我愿稱為當今的開源五虎。
都在以各自不同的力量,為著開源社區做貢獻。
說回Hunyuan3D-2.0,從模型層面看,比較屌的是用了現在AI 3D業界效果最好的一種方式,就是把模型和材質進行解藕分步生成,用這樣的架構,兩個子模型可以各司其職,整體效果會比只用1個模型同時去生存模型和材質效果更好。
從他們自己的跑分和盲測來看,基本達到了AI 3D開源模型里面的No.1。
開源鏈接在此:
代碼倉庫:https://github.com/tencent/Hunyuan3D-2
模型權重:https://huggingface.co/tencent/Hunyuan3D-2
demo頁面:https://huggingface.co/spaces/tencent/Hunyuan3D-2
除了開源之外,他們還貼心的做了一個產品,我們一直說,模型不是產品,模型根本沒有任何用戶體驗,只有把基于模型能力做出來的符合用戶需求的產品,才是最屌的產品。
而這次,他們做的這個產品——混元3D創作引擎,才是我覺得,整場發布會里面,最牛逼的。。。
不僅免費使用,支持文生3D、圖生3D、紋理生成、低多邊形生成、骨骼綁定、動作驅動、草圖生3D、3D風格化、3D游戲等等。
甚至,還做了一個類似Comfyui的在線3D工作流。。。
不是,你跟我說,這是一個產品的1.0版本?
你瘋了還是我起猛了...
只能說,騰訊內部對產品的要求還是太高了。
網址在此:https://3d.hunyuan.tencent.com/
先給大家看一下Hunyuan3D-2.0生成的效果。
整體相比1.0,有了巨大的進步,在幾何結構上,變得更加銳利,更加精準,材質也變得更加穩定了。
不過問題也是有的,比如在人物角色上,肢體已經表現的非常好了,但是AI 3D模型的糊臉通病也還是會有概率存在。
而大臉的時候會正常。
整體模型質量上,強的起飛,而且,這玩意是開源的,這就很牛逼。
除了模型外,最酷的,我覺得還是針對游戲所做的一整套工作流方案。
如果對于3D或者游戲有了解的朋友可能會知道,在游戲開發里,游戲模型是有面數的的面數非常的重要,有經驗的建模大佬都是在能省的地方就省。
在能達到差不多效果的前提下,減少面數,節省內存,能讓你的游戲玩起來不卡幀。
一般來說,主機游戲項目一般主角能干到十幾萬面左右,但是在手游項目里,一般角色都不能超過兩萬面。
模型面數的節省,就變成了重中之重。
所以說騰訊還是太懂了游戲了,在這次3D模型生成上,就給了一個非常實用的功能:低多邊形。
簡單的說,就是自適應給你用最小的面數實現你想生成的最優效果。
你作為一個游戲開發,你生成出來的東西,雖然還是會有AI 3D的很難二次編輯的問題,但是已經可以修改,并且直接扔到游戲引擎里面進行渲染,這一點我覺得還是蠻酷的。
很明顯就是奔著解決游戲開發中模型的實際問題而去的,畢竟,中國你要說靠游戲這事吃飯的,騰訊敢說第一,沒人敢說第二。
而且在生成后的3D模型里,還有骨骼綁定和動作。
也是方便大家能更快速的預覽動畫。
在實驗室TAB里,還有幾個有趣的功能,咱真的就是說,混元給的功能實在太多了。。。
3D紋理生成和草圖生3D這兩個,我自己覺得還是很有用的。
比如我現在自己手搓了一個斧子的模型,是個純白模。
貼材質講道理其實也是很浪費時間的,那我其實就可以直接傳到混元3D里,用嘴來描述一下斧子的材質。
比如我就想要一把北歐時代的戰斧,大概幾十秒鐘,就會在原模型的基礎上,把貼圖就給我生成完了。
草圖生成也挺好玩的。
比如我現在有這么一張草圖,我想把這個妹子,變成3D的,看看是什么模樣。
我們就可以直接扔進去,用嘴描述,卡通風格美女。
幾十秒時間,一個3D模型就出來了。很有意思。
但是,最讓我覺得,有想象力的,還是他們的工作流。
我就問你,習慣玩各種工作流的小伙伴,看到這玩意,熟不熟悉。
這,就是混元3D里面加的全新功能,工作流。
雖然現在只有4個模板,還不能自己自定義。
但是混元說,很快就會給大家開放,可以創建自己的工作流。
這玩意,上限有多高我想都不需要我描述了,能巨幅提高3D創作管線的效率。
以官方的圖生游戲角色工作流為例。
可以一張圖進去,進行背景去除,然后直接調整為T-pose,再進行模型和紋理生成,再進行骨骼綁定,輸出動作動畫。
最牛逼的一步,是把任意圖扔進去,能直接給你變成T-pose。
我給大家傳一張圖,你們就知道是什么意思了。
比如這個男孩的圖片,可以看到他現在是雙手插兜的。
我們把圖片傳進去,然后運行工作流。
你會發現,第二步把背景去掉,而第三步,直接把人物變成了T字型的人物造型。
后續的模型生成,也會以這個T字型的圖片去進行生成。
轉成T字型這一步,對于3D建模管線來說,非常重要。
T字型的模型,幾乎就是角色的基石。
如果沒有這個造型,角色的各個部分可能會亂七八糟。
手臂沒法自然展開,因為你根本不知道他的手在哪,腿的位置也對不上,甚至整個模型都無法正確綁定骨骼。
更別說后續動畫師要給角色添加動作了,沒有T字型,他們的工作量會直接爆炸。而且絕壁會想殺了你。
T字型的作用,不只是方便建模和動畫,還是整個3D管線流暢運作的關鍵。
這一步不到位,后面可能會事倍功半,甚至重做。
所以,這小小的一步,就能看出來,騰訊,是真的懂游戲開發的痛點啊。。。
而且這種節點式的可視化操作,一下子就把3D創作的門檻往下拉了好幾個檔次。
真的,有一點當年ComfyUI的味道了。
等3D技術再發展發展,到了Hunyuan3D-3.0、4.0,是不是以后,我們可以把真實演員的定妝照扔進去,自動去背后,一鍵T-pose,再直接生成影視里可用的3D人物?
甚至再進一步,配合如今的AI自動配骨骼、AI動作捕捉、實時渲染技術,感覺能直接搞出類似《曼達洛人》那種虛擬拍攝。
再說游戲領域,騰訊本身就有一票兒頂尖游戲部門,像天美、光子、魔方。
他們最懂游戲玩法,也最清楚開發管線里哪里最痛。
很多時候,美術資源占了項目的大半成本和周期,而AI 3D的出現恰好能先解決大批量的基礎建模、貼圖、優化等工作。
尤其是一些NPC、小怪、道具、場景,完全可以用Hunyuan3D批量生成,然后再讓美術做微調和二次設計就行。
這樣就能把寶貴的人力和時間,更多集中在核心角色、故事氛圍、獨特風格這些高價值環節上,把故事把游戲,做的更加牛逼。
此術雖新,前路浩瀚。
從騰訊發布會離開的時候,我忽然又些恍惚。
各大廠商一波接一波猛料,還沒消化完DeepSeek R1的開源,就碰上混元又拋出Hunyuan3D-2.0。
仿佛大家,約定好要在舊年結束前,把所有火藥一次性點燃,來一場璀璨的新春大秀。
相信無論你是不是從業者,都能感受到那股熱浪滾滾的氣息。
無他。
前路已明。
以上,既然看到這里了,如果覺得不錯,隨手點個贊、在看、轉發三連吧,如果想第一時間收到推送,也可以給我個星標?~謝謝你看我的文章,我們,下次再見。
>/ 作者:卡茲克
>/ 投稿或爆料,請聯系郵箱:wzglyay@gmail.com
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.