英偉達GTC2025 正式發布了GR00T N1,號稱世界首個開源的人形機器人通用模型!目標:讓物理AI人人可用
簡單來說,GR00T N1是一個通用的機器人大腦,只有20 億參數,卻擁有驚人的潛力
下面我們一起來扒一扒GR00T N1的細節,給大家劃個重點
GR00T N1 的硬核實力
GR00T N1 的強大,首先得益于它“吃”下的海量數據,NVIDIA 稱之為 “史上最多樣化的物理動作數據集”。這些數據來源非常豐富:
真實人形機器人遙操作數據:這是最直接、最寶貴的實戰經驗
大規模仿真數據:NVIDIA 慷慨開源了30萬+軌跡的仿真數據,助力研究社區
“幻覺”出的數據: NVIDIA 巧妙地運用了SOTA 視頻生成模型,創造出 “神經軌跡” 這種合成數據。這種數據在像素層面都遵循精確的物理規律,正如老黃所說,這簡直是 “系統性的無限數據”!
動作令牌提取:為了讓模型理解人類行為,NVIDIA 還開發了新算法,從真實人類視頻和神經生成視頻中提取動作令牌
GR00T N1 的核心架構也相當簡潔高效,它是一個 端到端的單神經網絡,直接從“光子”輸入到“動作”輸出,中間沒有復雜的層層堆疊:
視覺-語言模型 (System 2): 這部分是負責“思考”的系統,它基于 NVIDIA-Eagle 和 SmolLM-1.7B 構建,能夠像人的 “System 2” 一樣,通過視覺和語言指令來理解物理世界,進行環境和指令推理,最終規劃出合理的動作
擴散 Transformer (System 1): 這部分負責“執行”,它扮演著 “System 1” 的角色,將 System 2 的規劃 “渲染” 成流暢、精確的電機動作,頻率高達120Hz!
實戰效果:多場景性能提升顯著
GR00T N1 并非紙上談兵,NVIDIA 將其部署在了自家的 GR1 機器人、 1X Neo 機器人 以及大量的仿真基準測試中。結果顯示,在家庭和工業環境中,GR00T N1 在各種操作任務中實現了高達+30% 的性能提升。
更令人驚喜的是,GR00T N1 還支持跨具身 (cross-embodiment)能力。這意味著,它不僅能驅動人形機器人,還能通過微調適配到其他機器人平臺。例如,NVIDIA 就展示了 GR00T N1 在 HuggingFace LeRobot SO100 機械臂 上的應用,真正實現了 “開放的機器人大腦運行在開放的硬件上”。
GR00T N1 的預訓練策略
為了訓練 GR00T N1 這樣的通用模型,NVIDIA 采用了穩健的數據策略。他們構建了一個數據金字塔,充分利用各種數據類型的互補優勢:
底層:包含語言信息的 人工標注視頻數據集,捕捉人與物體的交互,提供自然運動模式和任務語義的洞察
中層:由 NVIDIA Omniverse 平臺 生成的 合成數據
頂層:通過各種平臺 遙操作收集的真實機器人數據,提供機器人能力的精確洞察
英偉達強調,他們使用了NVIDIA Isaac GROOT blueprint來實踐這一方法。僅用11 小時就生成了超過75 萬條合成軌跡,相當于6500 小時或9 個月的人類演示數據。將合成數據與真實數據結合,相比僅使用真實數據,GR00T N1 的性能提升了40%!
想上手?英偉達已經為你鋪好路
NVIDIA 不僅發布了模型,還貼心地提供了 “Get started today ” 指南,并開放了豐富的資源:
模型權重: GR00T N1 2B 模型已在 Hugging Face 上開源
代碼和數據集: Sample 數據集和 PyTorch 微調腳本可以在 NVIDIA/Isaac-GROOT GitHub 倉庫找到。開源物理AI數據集也已發布在 HuggingFace Datasets 上
硬件需求: 微調至少需要 NVIDIA RTX A6000 或 GeForce RTX 4090 GPU,更高級的需求可以選擇 NVIDIA DGX Spark 或 DGX H100 系統。推理可以使用 NVIDIA RTX A6000 GPU 或 Jetson AGX Orin。
性能實測:仿真與真實世界雙重驗證
為了全面評估 GR00T N1,英偉達在仿真和真實世界基準測試中都進行了驗證
仿真環境:使用了三個基準測試,包括 RoboCasa, DexMG, GR-1,結果顯示 GR00T N1 的平均成功率達到45.0%,顯著高于 BC Transformer 和 Diffusion Policy 等基線模型
真實世界:在 GR-1 人形機器人上進行了桌面操作任務測試,包括 “Pick-and-Place”, “Articulated”, “Industrial”, “Coordination” 等任務。使用完整數據集訓練的 GR00T N1,平均成功率高達76.8%,遠超 Diffusion Policy 模型
GR00T N1 白皮書:
https://research.nvidia.com/publication/2025-03_nvidia-isaac-gr00t-n1-open-foundation-model-humanoid-robots
開源代碼倉庫:
https://github.com/NVIDIA/Isaac-GR00T/
HuggingFace 模型:
https://huggingface.co/nvidia/GR00T-N1-2B
開放數據集:
https://huggingface.co/datasets/nvidia/PhysicalAI-Robotics-GR00T-X-Embodiment-Sim
參考:
https://developer.nvidia.com/blog/accelerate-generalist-humanoid-robot-development-with-nvidia-isaac-gr00t-n1/
?星標AI寒武紀,好內容不錯過?
用你的贊和在看告訴我~
求贊
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.