99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

通才機器人新突破:統(tǒng)一世界模型 UWM;南大、字節(jié)提出解耦擴散 transformers|今日熱門論文

0
分享至


速覽熱門論文

1. 南大、字節(jié)提出解耦擴散 transformers

2. 復旦、階躍星辰提出多模態(tài) SVG 生成模型 OmniSVG

3. 快手:形式化推理的后訓練擴展

4. 通才機器人新突破:統(tǒng)一世界模型 UWM

5. 上海 AI Lab:免訓練、高分辨率文生圖框架 HiFlow

6. 南加大:自適應課程強化微調(diào) AdaRFT

1. 南大、字節(jié)提出解耦擴散 transformers

擴散 transformers 雖然需要較長的訓練迭代時間和眾多推理步驟,但已顯示出卓越的生成質(zhì)量。在每個去噪步驟中,擴散 transformers 對噪聲輸入進行編碼,提取低頻語義成分,然后用相同的模塊對高頻進行解碼。這種方案造成了固有的優(yōu)化困境:對低頻語義進行編碼就必須減少高頻成分,這就造成了語義編碼和高頻解碼之間的矛盾。

為了解決這一難題,來自南京大學和字節(jié)跳動的研究團隊提出了一種“解耦擴散 transformers”(Decoupled Diffusion Transformer,DDT),它采用解耦設計,將用于語義提取的專用條件編碼器與專用速度解碼器結(jié)合在一起。


實驗表明,隨著模型大小的增加,更多的編碼器可以提高性能。對于 ImageNet 256 × 256,他們的 DDT-XL/2 實現(xiàn)了 1.31 FID 的性能(與以前的擴散 transformers 相比,訓練收斂速度提高了近 4 倍)。對于 ImageNet 512 × 512,DDTXL/2 實現(xiàn)了 1.28 的 SOTA FID。此外,這一解耦架構(gòu)通過在相鄰去噪步驟之間共享自約束,提高了推理速度。為了盡量減少性能下降,他們提出了一種新的統(tǒng)計動態(tài)編程方法來確定優(yōu)化共享策略。

論文鏈接:https://arxiv.org/abs/2504.05741

2. 復旦、階躍星辰提出多模態(tài) SVG 生成模型 OmniSVG

可縮放矢量圖形(SVG)是一種重要的圖像格式,在圖形設計中被廣泛采用。生成高質(zhì)量 SVG 的研究一直受到 AIGC 界設計人員和研究人員的關注。然而,現(xiàn)有的方法要么產(chǎn)生非結(jié)構(gòu)化的輸出,計算成本高昂,要么僅限于生成結(jié)構(gòu)過于簡化的單色圖標。

為了生成高質(zhì)量和復雜的 SVG,來自復旦大學和階躍星辰的研究團隊提出了 OmniSVG,這是一個利用預訓練視覺語言模型(VLM)生成端到端多模態(tài) SVG 的統(tǒng)一框架。通過將 SVG 命令和坐標參數(shù)化為離散 token,OmniSVG 將結(jié)構(gòu)邏輯與底層幾何解耦,從而在保持復雜 SVG 結(jié)構(gòu)的表現(xiàn)力的同時實現(xiàn)高效訓練。


為了進一步推動 SVG 合成的發(fā)展,他們提出了一個多模態(tài)數(shù)據(jù)集 MMSVG-2M,其包含 200 萬個標注豐富的 SVG 資產(chǎn),以及用于條件 SVG 生成任務的標準化評估協(xié)議。

實驗表明,OmniSVG 的性能優(yōu)于現(xiàn)有方法,并證明了其融入專業(yè) SVG 設計工作流程的潛力。

論文鏈接:https://arxiv.org/abs/2504.06263

3. 快手:形式化推理的后訓練擴展

通過大語言模型(LLM)實現(xiàn)的自動化定理證明(ATP),凸顯了使用 Lean 4 代碼進行形式化推理的潛力。然而,ATP 還沒有因為 OpenAI o1/o3 和 Deepseek R1 展示的后訓練擴展而發(fā)生顯著變化。

在這項工作中,快手團隊研究了 ATP 的整個后訓練,旨在使其與自然語言推理模型的突破保持對齊。首先,他們用一個混合數(shù)據(jù)集繼續(xù)訓練當前的 ATP 模型,該數(shù)據(jù)集由大量 statement-proof 對和其他數(shù)據(jù)組成,旨在納入模仿人類推理和假設完善的認知行為。接下來,他們利用 Lean 4 編譯器返回的結(jié)果獎勵探索強化學習。

通過持續(xù)訓練和強化學習過程,他們成功改進了現(xiàn)有的形式化證明器,包括 DeepSeek-Prover-v1.5 和 Goedel-Prover,在 whole-proof 生成領域取得了 SOTA。例如,他們在 MiniF2F 上實現(xiàn)了 59.8% 的通過率(pass@32)。


論文鏈接:https://arxiv.org/abs/2504.06122

4. 通才機器人新突破:統(tǒng)一世界模型 UWM

模仿學習是制造通才機器人的一種有前途的方法。然而,由于依賴于高質(zhì)量的專家示范,針對大型機器人基礎模型的擴展模仿學習仍然具有挑戰(zhàn)性。與此同時,描述各種環(huán)境和各種行為的大量視頻數(shù)據(jù)容易獲得,它們提供了有關真實世界動態(tài)和 agent 與環(huán)境交互的豐富信息。然而,由于缺乏大多數(shù)現(xiàn)代方法所需的動作注釋,將這些數(shù)據(jù)直接用于模仿學習并不容易。

在這項工作中,來自華盛頓大學和豐田研究所的研究團隊提出了“統(tǒng)一世界模型”(UWM),這是一個可以利用視頻和動作數(shù)據(jù)進行策略學習的框架。具體來說,UWM 將動作擴散過程和視頻擴散過程整合到一個統(tǒng)一的 transformer 架構(gòu)中,其中每種模態(tài)都有獨立的擴散時間步。


研究表明,只需控制每個擴散時間步,UWM 就能靈活地表示策略、正向動力學、逆向動力學和視頻生成器。通過模擬和實際實驗,他們證明了:(1)UWM 可以在大規(guī)模多任務機器人數(shù)據(jù)集上進行有效的動態(tài)和動作預測預訓練,從而產(chǎn)生比模仿學習更普適和魯棒的策略;(2)UWM 通過獨立控制特定模態(tài),自然地促進了無動作視頻數(shù)據(jù)的學習。

論文鏈接:https://arxiv.org/abs/2504.02792

5. 上海 AI Lab:免訓練、高分辨率文生圖框架 HiFlow

文生圖擴散(diffusion)/流(flow)模型因提供靈活視覺創(chuàng)作的能力,引起了廣泛關注。然而,由于高分辨率內(nèi)容的稀缺性和復雜性,高分辨率圖像合成仍然面臨挑戰(zhàn)。

為此,上海 AI Lab 團隊提出了一個免訓練(training-free)、模型無關(model-agnostic)的框架——HiFlow,其可釋放預訓練流模型的分辨率潛力。具體來說,HiFlow 在高分辨率空間內(nèi)建立了一個虛擬參考流,它能有效捕捉低分辨率流信息的特征,通過低頻一致性的初始化對齊、結(jié)構(gòu)保持的方向?qū)R和細節(jié)保真度的加速對齊 3 方面為高分辨率生成提供指導。


通過利用這種流對齊指導,HiFlow 提高了 T2I 模型高分辨率圖像合成的質(zhì)量,并展示了其個性化變體的多功能性。實驗驗證,HiFlow 在實現(xiàn)高分辨率圖像質(zhì)量方面優(yōu)于目前 SOTA 方法。

論文鏈接:https://arxiv.org/abs/2504.06232

6. 南加大:自適應課程強化微調(diào) AdaRFT

強化微調(diào)(RFT)在增強大語言模型(LLM)的數(shù)學推理能力方面顯示出潛力,但通常在采樣和計算方面效率低,需要大量訓練。

在這項工作中,南加州大學團隊提出了 AdaRFT(自適應課程強化微調(diào)),這是一種通過自適應課程學習提高 RFT 效率和最終準確性的方法,可根據(jù)獎勵信號動態(tài)調(diào)整訓練問題的難度,確保模型始終在具有挑戰(zhàn)性但可解決的任務上進行訓練。這種自適應采樣策略能保持最佳難度范圍,避免在太容易或太難的問題上浪費計算,從而加快學習速度。AdaRFT 只需要對標準 RFT 算法(如 PPO)進行輕量級擴展,而無需修改獎勵函數(shù)或模型架構(gòu)。


在競賽級數(shù)學數(shù)據(jù)集(包括 AMC、AIME 和 IMO 類型的問題)上進行的實驗證明,AdaRFT 提高了訓練效率和推理性能。他們評估了 AdaRFT 的多種數(shù)據(jù)分布和模型大小,結(jié)果表明它減少了 2 倍的訓練步驟,并提高了準確性,提供了一個更具可擴展性和更有效的 RFT 框架。

論文鏈接:https://arxiv.org/abs/2504.05520

整理:學術君

如需轉(zhuǎn)載或投稿,請直接在公眾號內(nèi)留言

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
A股:預判還對!所有人都注意了,下周準備開啟降落傘了!

A股:預判還對!所有人都注意了,下周準備開啟降落傘了!

春江財富
2025-04-26 08:48:23
高曉松和華誼總裁王中磊罕見同框!56歲高曉松又胖了,眼里沒了光

高曉松和華誼總裁王中磊罕見同框!56歲高曉松又胖了,眼里沒了光

娛圈小愚
2025-04-26 09:30:23
黃金暴漲背后:你的錢正在被合法“搶劫”?

黃金暴漲背后:你的錢正在被合法“搶劫”?

流蘇晚晴
2025-04-18 18:51:37
盡管白宮否認正在物色新防長的人選,但赫格塞斯被換掉的概率極大

盡管白宮否認正在物色新防長的人選,但赫格塞斯被換掉的概率極大

止戈軍是我
2025-04-26 23:41:09
哪些八卦聽到后讓你三觀盡毀?網(wǎng)友:發(fā)現(xiàn)兩人時,身體還連著呢

哪些八卦聽到后讓你三觀盡毀?網(wǎng)友:發(fā)現(xiàn)兩人時,身體還連著呢

特約前排觀眾
2025-04-25 00:05:26
國行iPhone即將變身AI手機 iOS 18.5正式版在路上

國行iPhone即將變身AI手機 iOS 18.5正式版在路上

3DM游戲
2025-04-26 11:26:45
抽煙的人會短命嗎?國外醫(yī)生進行長達20年的調(diào)查,終于找出了真相

抽煙的人會短命嗎?國外醫(yī)生進行長達20年的調(diào)查,終于找出了真相

鬼菜生活
2025-04-25 07:06:24
盒馬歐包“16.9元一片”惹群嘲,天價網(wǎng)紅面包,正背刺中國年輕人

盒馬歐包“16.9元一片”惹群嘲,天價網(wǎng)紅面包,正背刺中國年輕人

青眼財經(jīng)
2025-04-25 16:37:01
葉珂生女黃曉明表現(xiàn)反常,娛記曝內(nèi)幕,葉珂母憑女貴的夢想破滅

葉珂生女黃曉明表現(xiàn)反常,娛記曝內(nèi)幕,葉珂母憑女貴的夢想破滅

娛貝勒
2025-04-25 11:39:02
大冷門!頭號種子1:3被淘汰,2大世界冠軍出局,張本美和晉級4強

大冷門!頭號種子1:3被淘汰,2大世界冠軍出局,張本美和晉級4強

國乒二三事
2025-04-26 12:55:22
振奮人心好消息!殲-35首次電磁彈射成功,2030年或有100架服役!

振奮人心好消息!殲-35首次電磁彈射成功,2030年或有100架服役!

說天說地說實事
2025-04-26 18:36:28
黃一鳴再曝與王思聰22年聊天記錄:孩子是我的,想生我也不阻止你

黃一鳴再曝與王思聰22年聊天記錄:孩子是我的,想生我也不阻止你

影視口碑榜
2025-04-25 15:10:29
重磅,一季度結(jié)婚人數(shù)僅181萬對,結(jié)婚登記全國通辦來了

重磅,一季度結(jié)婚人數(shù)僅181萬對,結(jié)婚登記全國通辦來了

曉風說
2025-04-26 08:43:10
印巴空軍激烈對峙,伊朗加強邊境戰(zhàn)備,這回沒準真要打起來了!

印巴空軍激烈對峙,伊朗加強邊境戰(zhàn)備,這回沒準真要打起來了!

凱撒談兵
2025-04-26 23:00:16
所長親戚打死人只判一年半?銷毀證據(jù)舉報5年無果,更多細節(jié)流出

所長親戚打死人只判一年半?銷毀證據(jù)舉報5年無果,更多細節(jié)流出

阿鳧愛吐槽
2025-04-26 14:22:16
美前副國務卿:特朗普政府誤判中國實力

美前副國務卿:特朗普政府誤判中國實力

上觀新聞
2025-04-26 15:29:10
63歲演員徐錦江已向兒子交代后事:去世后與妻子骨灰一起撒入公海

63歲演員徐錦江已向兒子交代后事:去世后與妻子骨灰一起撒入公海

白面書誏
2025-04-24 23:15:04
里弗斯談利拉德:他現(xiàn)在全靠意志力支撐,比賽中完全沒有節(jié)奏

里弗斯談利拉德:他現(xiàn)在全靠意志力支撐,比賽中完全沒有節(jié)奏

雷速體育
2025-04-26 13:55:18
比中韓更地獄的考試出現(xiàn)了。。。

比中韓更地獄的考試出現(xiàn)了。。。

西樓飲月
2025-04-26 14:51:31
不負眾望!國乒女單獨苗3:0大獲全勝,國乒1人晉級,日本7人晉級

不負眾望!國乒女單獨苗3:0大獲全勝,國乒1人晉級,日本7人晉級

國乒二三事
2025-04-26 12:26:59
2025-04-27 00:43:00
學術頭條
學術頭條
致力于學術傳播和科學普及,重點關注人工智能、生命科學等前沿科學進展。
1247文章數(shù) 5069關注度
往期回顧 全部

科技要聞

百度心響實測:“能用版Manus”開了個好頭

頭條要聞

馬斯克和美財長激烈爭吵細節(jié)披露:胸口相抵 狂飆臟話

頭條要聞

馬斯克和美財長激烈爭吵細節(jié)披露:胸口相抵 狂飆臟話

體育要聞

廣廈19分勝遼寧獲開門紅 孫銘徽13分3助崴腳

娛樂要聞

金掃帚獎出爐,包貝爾意外獲“影帝”

財經(jīng)要聞

韓國的"宇樹科技" 是怎樣被財閥毀掉的?

汽車要聞

充電5分鐘續(xù)航100公里 探訪華為兆瓦超充站

態(tài)度原創(chuàng)

教育
時尚
房產(chǎn)
數(shù)碼
軍事航空

教育要聞

家長說現(xiàn)在連小學生的題目,自己都整不明白了

她美得好邪乎,讓人又怕又愛

房產(chǎn)要聞

教育理念再進階!解碼新世界星輝如何構(gòu)筑「家校社成長生態(tài)圈」!

數(shù)碼要聞

AMD修補高危安全漏洞!歷代Zen架構(gòu)CPU 100%中招

軍事要聞

白宮爭吵后特朗普與澤連斯基"首度"碰面

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 尤溪县| 娄烦县| 皋兰县| 徐闻县| 通州区| 湛江市| 仁化县| 原阳县| 巨野县| 新沂市| 遂宁市| 湖南省| 台南市| 磐石市| 榆中县| 宿迁市| 禄丰县| 临汾市| 香格里拉县| 宁海县| 陆良县| 九台市| 钦州市| 新疆| 金华市| 巴青县| 依兰县| 宾川县| 象山县| 井冈山市| 剑河县| 皋兰县| 宣威市| 安乡县| 从化市| 拜泉县| 云梦县| 商城县| 聂荣县| 马尔康县| 永平县|