在3月18日舉行的英偉達GTC大會上,英偉達創始人兼CEO黃仁勛正式發布了人形機器人基礎模型GROOT N1,標志著人形機器人基礎模型領域再添重磅玩家。黃仁勛透露,該模型已經被多家機器人制造商采用,包括Fourier GR-01、Agility Robotics、Boston Dynamics等,助力類人機器人進入更廣泛的商業應用場景。
GROOT N1定位全球首款開源且可定制的通用人形機器人基礎模型。它采用了獨特的雙系統架構,靈感來源于人類的認知原理。其中,“系統1”是一個快速思考的行動模型,類似于人類的直覺和反射,能夠迅速做出反應;“系統2”則是一個慢速思考模型,用于進行深思熟慮的決策制定。這種架構使得GROOT N1能夠在復雜環境中靈活應對各種任務,例如抓取、雙臂搬運、單臂與雙臂協作,以及多步復雜操作,適用于物料搬運、包裝和檢測等場景。
此外,英偉達還推出了一系列模擬框架和方案,包括NVIDIA Isaac GROOT方案,用于生成合成數據,以及Newton——一款開源物理引擎。這款引擎由英偉達與Google DeepMind和迪士尼研究院共同開發,專門用于機器人研發。這些工具的發布,不僅為開發者提供了強大的技術支持,也為GROOT N1的廣泛應用奠定了基礎。
人形機器人模型頻繁發布
早前,Figure公司也發布了其人形機器人模型Helix。Helix基于視覺-語言-動作(VLA)架構,采用準分層式設計,首次實現了四大技術突破。
能力泛化:Helix能夠適應多樣化的應用場景,無論是工業物流還是倉儲管理,都能大展身手。精準控制:全身上半身的運動控制實現了更加穩定的動作執行,確保機器人的靈活性與準確性。協同作業:Helix支持兩臺及以上機器人協同操作,突破了以往單機作業的局限。低成本運行:Helix采用嵌入式GPU設計的“大小腦”架構運行,無需依賴云計算能力,顯著降低了部署和運營成本。
Helix模型的發布,標志著人形機器人在工業物流、倉儲管理等場景的規模化應用邁出了重要一步。
與此同時,中國的智元機器人也在人形機器人領域取得了重要進展。3月10日,智元機器人正式發布了具身智能大模型GO-1,并完成了其在本體機器人上的部署。這一模型基于創新的ViLLA架構,解決了圖像-文本輸入與動作執行之間的技術鴻溝,通過多模態數據訓練賦予機器人自主學習與場景泛化能力。
GO-1的核心在于其Vision-Language-Latent-Action(ViLLA)架構,該架構由多模態大模型(VLM)和混合專家模型(MoE)組成。相較于傳統VLA架構,ViLLA通過預測隱式動作標記,將感知與執行環節深度耦合,顯著提升了任務理解的連貫性和動作規劃的效率。這一突破使得人形機器人能夠更好地適應家庭和工業等多樣化場景。
分析認為,隨著各家基礎模型的發布,人形機器人技術的發展將不僅僅局限于硬件的升級,更將集中在軟件和算法的優化,以及跨領域的融合應用。隨著技術的不斷進步和應用場景的不斷拓展,人形機器人將在更多領域發揮重要作用,為人類的生活和工作帶來更多的便利和創新。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.