99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

3D版DeepSeek卷起開源月:兩大基礎模型率先SOTA!又是VAST

0
分享至

衡宇 魚羊 發自 凹非寺
量子位 | 公眾號 QbitAI

3D生成版DeepSeek再上新高度!

國產、易用、性能強且開源——

新模型一露面就刷新SOTA,并且第一時間加入開源全家桶

順時針轉個圈圈給大家看,效果是這樣:



加上“皮膚”是這樣:



再來一個,效果是這樣:



肉眼可見,這次妥妥升級變成了更細節的細節控~

以上效果,都來自3D大模型明星初創公司VAST,其剛剛上新的兩個基礎模型,TripoSG和TripoSF,為團隊的最新研發成果。該團隊去年3月開源了TripoSR,在開源3D生成基礎模型中爆火全球。

TripoSG,發布即開源,一露面就刷新開源3D生成模型SOTA,讓廣大開發者第一時間享受技術進步的成果。

TripoSF,目前為開源第一階段,已經用實力證明了自己:橫掃一切開源和閉源的現有方法,拿下新SOTA。

你就說秀不秀吧(手動狗頭)?!

——但基礎模型還只是VAST最近大秀一波技術肌肉的上半程表演。

量子位獲悉,接下來VAST要連續開源一個月,每周都有新開源項目公布。而TripoSG和TripoSF是開源月里第二周的項目。

在整個開源月里,除了第一波單張圖像端到端生成三維組合場景、第二波3D基礎模型,接下來還有三維部件補全模型、通用三維模型綁定生成模型、三維幾何精細化模型以及SIGGRAPH Asia 2024 RTL收錄的交互式草圖生三維模型等等技術將與大家見面。



港真,我的胃口已經被吊起來了。

在DeepSeek之后,各領域的國產之光們紛紛開啟了開源大秀。而VAST,就是領先的3D大模型領域公司率先發起的攻勢。

并且這個開源攻勢,持續一個月!

開源月第二彈,兩個基礎模型拿下開閉源新SOTA

3D版DeepSeek登場,一出手就是開源月;第二波出擊比第一波更猛,開源2個強大的基礎模型,很有誠意的那種。

它們分別是:

  • TripoSG:開源的3D模型新SOTA;目前開源1.5B版本。
  • TripoSF:以開源之身,刷新閉源3D模型SOTA;目前階段性開源部分成果。

都沿用了VAST最著名的Tripo系列來命名,但各有偏重——

TripoSG

對于TripoSG,官方介紹是這樣的:

  • 一款在質量、細節和保真度上實現重大突破的基礎3D生成模型。

其開源內容,包括1.5B版本TripoSG的模型權重、推理代碼以及交互式演示Demo。



讓我們從技術側來剖析一下TripoSG的廬山真面目。



簡單來說,TripoSG身上體現了VAST針對3D領域特性,引入的多項關鍵設計創新。

第一,率先將基于校正流(RF,Rectified Flow)的Transformer架構應用于3D形狀生成。

之所以選擇基于矯正流來做,是因為VAST在研究過程中發現,相較于傳統的擴散模型(Diffusion Model),矯正流在噪聲和數據之間提供了更簡潔的線性路徑建模,有助于實現更穩定、高效的訓練。

拿它結合已被驗證的可擴展性和卓越性能的Transformer架構(如DiT),屬于強強結合,讓TripoSG擁有很穩定的強大內核。

第二,TripoSG是首個在3D領域發布的MoE Transformer模型。

以Transformer為基礎,TripoSG融合了包括跳躍連接(skip-connections)在內的關鍵增強設計,以改善跨層特征融合。

此外,獨立的交叉注意力(cross-attention)機制能夠高效地注入全局(CLIP)和局部(DINOv2)圖像特征,讓輸入的2D圖像和輸出的3D形狀之間精準對齊。

這還不夠,VAST團隊為了實現TripoSG的高效Scaling——從1.5B拓展到4B那種——團隊在Transformer中集成了MoE層。

這個辦法此前都只在大語言模型領域實踐過,VAST發現3D領域同樣適用

這樣一來,可以在幾乎不增加推理計算成本的前提下,顯著提升模型參數容量,并重點應用于網絡中更深、更關鍵的層級。



第三,開發了高質量VAE與創新幾何監督。

VAST開發了一種采用符號距離函數(SDFs,Signed Distance Functions)進行幾何表示的VAE,相較之下,比此前常用的體素占用柵格(occupancy grids)具有更高的精度。

需要注意的是,基于Transformer的VAE架構在分辨率上有很強的泛化性,無需重新訓練,即可處理更高分辨率的輸入。



與此同時,TripoSG還引入了一種混合監督訓練策略,將標準的SDF損失與表面法線引導(surface normal guidance)和 程函方程損失 (eikonal loss)相結合。

讓VAE能學習到幾何上更準確、細節更豐富的表示,又能為后續的流模型提供了質量更高的潛空間。

第四,重視數據治理,特意開發一套完善、精細的數據構建與治理流水線。

流程各階段如下:

質量評分(Scoring)——數據篩選(Filtering)——修復與增強(Fixing & Augmentation)——SDF 數據生產(SDF Production)



通過這一流程,VAST為TripoSG構建了一個包含200萬高質量“圖像-SDF”訓練樣本對的數據集

消融實驗明確證明,在此高質量數據集上訓練的模型性能顯著優于在更大規模、但未經過濾的原始數據集上訓練的模型(這一點凸顯了數據質量與數量同等重要,甚至更為關鍵)

集以上四點于一身的TripoSG,經Normal-FID等量化指標評估,以及基于大型多模態模型(如基于GPTEval3D框架的Claude 3.5)的定性評估,輕松拿下3D開源模型界的新SOTA

讓我們來看看3D模型開源界新王的表現——

首先,TripoSG為什么能拿下新SOTA,必然是在語義一致性上有超出現有模型的表現

簡單來說,TripoSG輸出的3D形狀,能準確反映輸入圖像的語義內容和視覺外觀。

當你告訴它你想要一個三斗柜,既寫實又稍微Q一點那種,你將得到:



不渲染可能視覺上沒那么明顯,但一上色,你就能發現“哎喲不錯哦”,確實是古樸寫實但又兼具可愛風。

還有一些日常生活的使用痕跡:



非常能直觀感受到的一點是,即使面對具有復雜拓撲結構或包含精細元素的挑戰性輸入,TripoSG也能生成連貫、合理的形狀





TripoSF

再來看TripoSF。



研發TripoSF,VAST有專門的針對性目標,旨在突破傳統3D建模在細節、復雜結構和擴展性上的瓶頸

具體來說,3D模型雖然也在不斷發展之中,但現有方法仍有不足。比如預處理帶來的細節損失、對復雜幾何形狀表達能力的不足,或在高分辨率下面臨高昂的內存和計算成本……

令人頭禿。



據VAST官方表示,此前一直在研究中尋找3D模型的tokenizer,現在終于有所進展——

沒錯,就是TripoSF的核心表示方法,SparseFlex。這家伙拉高了3D生成任務的上限。

它借鑒了Flexicubes(可微分地提取帶尖銳特征的網格)的優勢,并創造性地引入了稀疏體素結構,僅在物體表面附近的區域存儲和計算體素信息。

帶來的效果很顯著,約有以下三點:

  • 大幅降低內存占用,讓TripoSF能夠在10243的高分辨率下進行訓練和推理。
  • 原生支持任意拓撲處理:不僅通過省略空白區域的體素,自然地表示開放表面(如布料、葉片),還有效捕捉內部結構。
  • 支持基于渲染損失的直接優化:SparseFlex是可微分的,允許TripoSF使用渲染損失進行端到端訓練,避免了數據轉換(如水密化)導致的細節退化。

為了實現上述第一點,VAST還做了很多功課,最終推出一種叫“視錐體感知的分區體素訓練”的策略

視錐體感知的分區體素訓練借鑒了實時渲染中的視錐體剔除思想,在每次訓練迭代中,僅激活和處理位于相機視錐體內的SparseFlex體素



有針對性和選擇性的激活,顯著降低訓練開銷,讓10243這樣高分辨率下的高效訓練成為可能。

另一邊,視錐體感知的分區體素訓練策略首次使僅通過渲染監督即可重建模型的內部精細結構——在此之前,依賴水密表面數據的方法沒法完成這個任務。

當然,還有不得不提的關鍵一步,即基于SparseFlex表示和高效的訓練策略,VAST還構建了TripoSF VAE(變分自編碼器),它成為了TripoSF重建和生成能力的基礎

具體到輸入到輸出,是醬嬸兒的:

  • 輸入:處理從三維網格采樣得到的點云數據。
  • 編碼:使用稀疏Transformer將輸入幾何映射為緊湊的隱空間編碼。
  • 解碼:從隱編碼重建高分辨率的SparseFlex參數,并采用自剪枝上采樣模塊(self-pruning upsampling)來保持稀疏性并精確定義邊界,尤其對開放表面效果顯著。
  • 輸出:生成SparseFlex參數,可用于提取高質量的三維網格。



一頓操作過后,來看TripoSF的實戰表現——

實驗結果表明,TripoSF的質量達到了新SOTA。

在多個標準基準測試中,TripoSF與先前方法相比,實現了約82%的Chamfer Distance降低和約88%的F-score提升



而用TripoSF得到的模型,是這樣的:



多看幾個項目效果也能發現,確如論文中表述的那樣,有了SparseFlex的TripoSF,分辨率高,細節退化情況大幅降低



就,獲得的3D模型真的更真實了!我們多看幾個Case:





BTW,與TripoSG的開源策略不同,TirpoSF選擇了階段性開源的方法。

現在,TirpoSF開源了TripoSF VAE的預訓練模型及相關的推理代碼。

不過滿血版開源應該也不遠了!VAST官方表示,滿血版預計將在Tripo 3.0時開放

且按耐住著急的心多等一會兒吧~

開源全家桶,從基礎模型到創新應用全覆蓋

開源月第二周發布兩個基礎模型之外,量子位也搶先打聽到了VAST開源月的后續內容。

主打一個3D生成全流程技術覆蓋。

下周的開源月第三彈,主打3D生成模型的專業能力——

三維部件補全模型、通用三維模型綁定生成模型。

開源月最后一周的壓軸好戲,主打在3D生成領域的前沿探索——

三維幾何精細化模型以及SIGGRAPH Asia 2024 RTL收錄的交互式草圖生三維模型。



至于開源質量嘛,我們可以通過今天的TripoSG和TripoSF,以及近期VAST的其它動作,窺一斑而知全豹。

這次開源月正式啟幕的第一周,VAST第一發是在3月13日開源了兩個項目:

一個是MV-Adapter,VAST和北航、上海交大聯合出品。

雖于去年12月第一次問世,但3月13日又有新一步的進展,開放了幾何控制下的多視圖生成模型權重。

它是第一個基于適配器的多視圖圖像生成解決方案,可以在不改變原始網絡結構或特征空間的情況下,增強文生圖模型及其衍生產品。



另一個開源的項目叫MIDI

它能僅憑單張圖像,創建高保真3D場景,論文已中CVPR 2025。





這一系列開源屬于是既有技術深度,又有覆蓋廣度了。



實際上,作為全球領先的3D生成技術提供方,VAST一直很看重在技術前沿的探索

單在2024年一年里,就發表了幾十篇新論文;同時積極投身開源社區,此前的開源項目還包括:

世界最大3D生成算法框架threestudio、圖生3D的Wonder3D,和Stable Diffusion背后公司Stability AI一起開源的TripoSR……

憑借技術上的活躍度,VAST旗下的Tripo系列在全網社交媒體上,也屬于是3D生成領域的當紅炸子雞(doge)

不僅業余玩家玩得起勁,也獲得了不少專業藝術工作者的認可,可以說是3D生成版的國產之光了。





對了,關于技術,此前VAST的CTO梁鼎還給量子位分享過他們的總體目標

第一步是靜態的內容生成,就像生成一個個雕塑。

第二步是動態的內容生成,讓原本靜態的雕塑動起來,和用戶互動。

他還認為,在今年(2025年)年底之前,每個人都可以零門檻、零成本地進行實時3D內容創作。

現在,VAST用開源月,讓每個人朝向這個目標更進一步。

而一系列技術新成果和開源推進之下,VAST也越來越受到關注,正在成為3D大模型賽道最具代表性的明星公司。

有個VC和技術招聘領域的江湖套梗是這樣說的:

  • 語言、圖像和視頻之后,3D是AIGC領域的下一個未來……那3D大模型賽道,究竟有誰在啊?
  • VAST

【 TripoSG 】

Homepage:https://yg256li.github.io/TripoSG-Page/

論文arXiv:https://arxiv.org/abs/2502.06608

GitHub代碼:https://github.com/VAST-AI-Research/TripoSG

抱抱臉模型權重:https://huggingface.co/VAST-AI/TripoSG

抱抱臉演示:https://huggingface.co/spaces/VAST-AI/TripoSG

【 TripoSF 】

Homepage:https://xianglonghe.github.io/TripoSF/

論文arXiv:https://arxiv.org/abs/2503.21732

GitHub代碼:https://github.com/VAST-AI-Research/TripoSF

抱抱臉模型權重:https://huggingface.co/VAST-AI/TripoSF

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
網友:湖北這次狂風暴雨加冰雹,汽修店都堵了!保險公司受傷最重

網友:湖北這次狂風暴雨加冰雹,汽修店都堵了!保險公司受傷最重

火山詩話
2025-04-12 10:51:50
驚天巨變!中美隨時進入攤牌狀態

驚天巨變!中美隨時進入攤牌狀態

戶外釣魚哥阿旱
2025-04-12 08:57:37
美教育部長將“AI”稱為“A1” 美網友:這就是教育

美教育部長將“AI”稱為“A1” 美網友:這就是教育

看看新聞Knews
2025-04-11 16:11:09
逆轉!加蘭26+13,布倫森27+2,東部前六誕生,尼克斯認清現實

逆轉!加蘭26+13,布倫森27+2,東部前六誕生,尼克斯認清現實

籃球大視野
2025-04-12 10:39:16
北京腫瘤專家關天瑜教授去世,發病到離世僅一周,專家號僅100元

北京腫瘤專家關天瑜教授去世,發病到離世僅一周,專家號僅100元

一桶漿糊要一統江湖
2025-04-12 07:47:46
華僑“鋼鐵大王”在菲被綁架撕票 知情人:懷疑熟人作案,家屬曾聯系道上的人談判|封面頭條

華僑“鋼鐵大王”在菲被綁架撕票 知情人:懷疑熟人作案,家屬曾聯系道上的人談判|封面頭條

封面新聞
2025-04-11 19:30:05
杜蘭特正式接受火箭1.2億合同,督促太陽盡快交易,還提出2個要求

杜蘭特正式接受火箭1.2億合同,督促太陽盡快交易,還提出2個要求

野渡舟山人
2025-04-11 10:56:19
最新確認!今天開始,影響青島!持續3天→

最新確認!今天開始,影響青島!持續3天→

魯中晨報
2025-04-12 07:59:08
網友:偷拍到導師電腦,人都要崩潰!可愛的小老頭還知道賄賂師母

網友:偷拍到導師電腦,人都要崩潰!可愛的小老頭還知道賄賂師母

火山詩話
2025-04-12 07:00:19
“吃定”一個女人,不是卑微討好,也不是頻繁聯系,而是:三個字

“吃定”一個女人,不是卑微討好,也不是頻繁聯系,而是:三個字

蓮子說情感
2025-04-11 10:14:08
大量美國游客因落地免簽、離境退稅涌入中國,開啟瘋狂購物

大量美國游客因落地免簽、離境退稅涌入中國,開啟瘋狂購物

億通電子游戲
2025-04-11 20:48:00
美媒爆特朗普突然改主意,因美債被大量拋售,日本:我們偷襲成功

美媒爆特朗普突然改主意,因美債被大量拋售,日本:我們偷襲成功

袁周院長
2025-04-11 11:40:08
比房價下跌更難受,3大信號出現,行家:房子正在成為負債

比房價下跌更難受,3大信號出現,行家:房子正在成為負債

巢客HOME
2025-04-12 09:10:04
中國人的語言攻擊能力簡直太強了!老外:中國人罵人像惡魔在低語

中國人的語言攻擊能力簡直太強了!老外:中國人罵人像惡魔在低語

奇特短尾矮袋鼠
2024-11-23 16:08:32
在深山徒步時,我與美艷驢友發生了關系,從此我的噩夢開始了

在深山徒步時,我與美艷驢友發生了關系,從此我的噩夢開始了

溫情郵局
2025-04-10 10:38:45
突然反轉了!蘋果開始做出改變,外媒:終究還是頂不住了!

突然反轉了!蘋果開始做出改變,外媒:終究還是頂不住了!

阿矗論古今
2025-04-07 09:35:23
黃金儲備差距:美國8133噸,俄羅斯2350噸,中國讓人“出乎意料”

黃金儲備差距:美國8133噸,俄羅斯2350噸,中國讓人“出乎意料”

魏家東
2024-12-15 09:45:11
為什么特斯拉用的是寧德時代,為啥還大老遠去用LG的電池?

為什么特斯拉用的是寧德時代,為啥還大老遠去用LG的電池?

車有梗
2025-03-11 06:30:17
美股巨震,特朗普竟炫耀朋友一天賺25億美元!購物小票已出現“關稅附加費”,美網友大對賬:“真的開始了!特朗普征稅,我買單”

美股巨震,特朗普竟炫耀朋友一天賺25億美元!購物小票已出現“關稅附加費”,美網友大對賬:“真的開始了!特朗普征稅,我買單”

每日經濟新聞
2025-04-11 14:19:08
天!57歲林憶蓮胖成這模樣了,大圓臉腰上游泳圈,都快認不出了!

天!57歲林憶蓮胖成這模樣了,大圓臉腰上游泳圈,都快認不出了!

草莓解說體育
2025-04-11 01:04:05
2025-04-12 11:44:52
量子位 incentive-icons
量子位
追蹤人工智能動態
10303文章數 176094關注度
往期回顧 全部

科技要聞

單臺年入20萬!首批人形機器人致富者來了

頭條要聞

牛彈琴:特別的客人來到北京 美國公開威脅"后果嚴重"

頭條要聞

牛彈琴:特別的客人來到北京 美國公開威脅"后果嚴重"

體育要聞

當意甲冠軍跌入意乙降級區 老男孩們坐不住了

娛樂要聞

25歲女歌手突然離世,和大S死因相似

財經要聞

造假累計數百億 揭秘東旭集團造假手法

汽車要聞

審美和深層次豪華 阿維塔06都辦到了

態度原創

家居
藝術
本地
健康
軍事航空

家居要聞

浪漫與優雅 不被定義的現代法式

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

本地新聞

華北將迎“歷史罕見”大風

在中國,到底哪些人在吃“偉哥”?

軍事要聞

普京與美國中東問題特使結束會談

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 嘉祥县| 泗水县| 惠东县| 朔州市| 乌恰县| 内乡县| 虞城县| 阳山县| 台中市| 密云县| 化州市| 丹寨县| 离岛区| 育儿| 沿河| 棋牌| 博乐市| 邯郸县| 永登县| 普安县| 会东县| 罗田县| 诸城市| 齐齐哈尔市| 河南省| 新巴尔虎右旗| 聂拉木县| 桐梓县| 顺昌县| 安图县| 遵义市| 威信县| 天长市| 丰原市| 晋州市| 沙湾县| 云和县| 大港区| 新化县| 枣强县| 什邡市|