「全球首個一腦多能、一腦多機的通用具身智能平臺來了。具身智能在勞動自動化方面的進展正日益加快,并超出我們的預期。」
文|DeepAI 王欣
編輯 | 擎天柱
3月12日,北京人形機器人創新中心(以下簡稱:創新中心)發布了全球首個一腦多能、一腦多機的通用具身智能平臺「慧思開物」。
在這次發布會現場,《智駕網-DeepAI》看到,基于虛實結合的訓練模式和以技能庫為核心的運動執行方式,通過語音交互、APP直連,慧思開物就可以讓天工機器人完成在工業分揀、積木搭建、桌面清理和物流打包四個場景的真機操作。
近年來機器人技術發展有一句話很火——人類寫詩、機器人刷碗,還是機器人寫詩、人類刷碗?
這一說法源自近年來人工智能技術發展引發的社會討論,用來形容生成式AI(如作詩、繪畫模型)的快速發展與機器人實際應用場景的滯后形成鮮明對比,揭示了AI技術路徑與人類需求之間的錯位。
直至這次北京國家隊出手,具身智能在勞動自動化方面的進展正日益加快,并超出我們的預期。
01.
能分揀、搭積木,解放人類勞動力的時刻不遠了?
「慧思開物」就像具身智能機器人的中樞神經系統,集成了感知、決策、語言、學習及運動控制等高級認知功能,可以為具身智能機器人提供感知、決策與執行能力。
只需要人類一句語言指令,機器人就可以實現從任務理解、環境感知到執行的全流程智能化,具備處理多種場景復雜任務的泛化能力。
創新中心首席技術官唐劍向《智駕網-DeepAI》表示:「“慧思開物”作為機器人中樞神經系統,集成感知、決策、語言、學習及運動控制等高級認知功能,通過多專家智能體協同實現模型能力提升,增強機器人在復雜任務中的智能化與執行效率,同時通過低代碼方式降低機器人開發門檻,簡化開發流程。」
那么,都解鎖了哪些場景呢?
場景一:工業分揀
在工業分揀任務中,通過「慧思開物」APP直連,UR-5e機械臂能夠精準解析語音指令,將復雜的技術能力(如推理、規劃、技能調用)封裝為簡單易用的操作流程,并通過雙臂協同的方式完成分揀操作,顯著降低了用戶使用門檻。
同時,平臺支持自定義模型和技能的快速添加,能夠靈活適配不同場景的應用需求,為工業自動化領域提供便捷、高效的解決方案。并且這也是行業內首創的「APP+機器人」模式。
場景二:積木搭建
在積木搭建實驗中,「慧思開物」通過大模型思維鏈能力,首次實現了復雜任務的智能化拆解與執行。
當面對隨機組合的積木模型時,「天工」利用視覺大模型(VLM)對樣例進行拆解,首次讓機器人像人類工程師般完成"觀察-思考-執行"的完整閉環。不僅瞬間解析出目標模型的立體結構,還能自主推導出"先底層后上層、先支撐后裝飾"的最優搭建邏輯。
▲搭載「慧思開物」的「天工」完成積木搭建任務
測試中,"天工"機器人以毫米級操作精度,準確拾取相應積木,并按次序完成了3層積木的毫米級精準搭建。
場景三:桌面清理
在桌面清理場景中,人形機器人「天工」展現了端到端模型賦能下的雙臂協作的高效性與動態環境下的自適應能力,流暢地整理桌面餐具,將垃圾收進錫紙盤并放入垃圾桶。整個過程中,機器人在多次任意隨機的人為打斷和移位干擾的情況下,仍能自主糾錯、重新規劃并完成任務。
▲搭載「慧思開物」的「天工」完成桌面清理任務
當積木組件意外偏移時,天工僅用0.3秒便重新規劃運動軌跡,通過多模態感知實時調整抓取角度,最終以±0.1毫米的精度完成搭建。
這種將動態環境建模、多關節運動優化與即時糾錯融為一體的智能決策體系,也標志著全開放場景驗證的通用型學習框架正式落地。
場景四:物流打包
在物流打包場景,基于「慧思開物」平臺,「天工PRO」首次實現了全尺寸人形機器人物流打包全流程的自主作業。
通過上半身29個自由度的配合,「天工PRO」使用左右手分別拿起物品和掃碼槍,通過頭部相機確認物品條形碼位置,雙手協同完成掃碼、裝箱、封箱及粘貼快遞標簽等一系列操作。
▲搭載「慧思開物」的「天工」完成物流打包任務
現在,創新中心正在將這些能力逐步實現商業化落地。創新中心首席技術官唐劍稱,「現在主要探索的方向為教育科研、健康養老、特種作業以及工業制造。」
據《智駕網-DeepAI》在發布會現場了解,例如優必選的新產品「天工行者」,將基于「天工」平臺重點應用至教育領域。
「天工行者」是優必選聯合創新中心當天發布的全尺寸科研教育人形機器人,售價僅需29.9萬元,是業內首款30萬元以下的全尺寸科研級人形機器人。
天工行者搭載了創新中心搭載了創新中心「慧思開物」通用具身智能平臺,能為高校及科研機構提供完整的人形機器人研究解決方案。
據介紹,機器人擁有170cm仿人身高,高度仿生的軀干構型和擬人化的運動控制能力,全身多達20個自由度,能以10km/h的速度穩定奔跑,具備在山坡、臺階、沙地、雪地等復雜泛化地形平穩移動、抗沖擊干擾等運動功能。
目前天工行者已開放預訂,并將于二季度開始交付。
02.
人形機器人,配上更強的大小腦
根據著名的莫拉維克悖論:對機器人來說,簡單的動作比復雜的推理更難以實現。
為什么?因為簡單的動作可能需要「多腦」配合。
能讓機器人在多領域全才開花的「慧思開物」,由兩大部分組成:具身「大腦」先進行任務規劃,再調用具身「小腦」技能庫執行具體動作,并將執行反饋傳遞給具身「大腦」,形成任務閉環。
慧思開物的具身大腦:
作為認知決策中心,由AI大模型驅動的大腦負責高階認知任務,具備自然交互、空間感知、意圖理解、分層規劃和錯誤反思等能力。
任務規劃:通過自然語言交互解析指令,結合空間感知和意圖理解能力,將復雜任務拆解為可執行的子任務序列。
動態路徑規劃與糾錯:實時監測環境變化,通過強化學習和自適應機制優化任務執行路徑,應對突發干擾。
錯誤反思與學習:失敗時自動記錄并分析原因,通過模擬訓練更新模型,提升泛化能力。
數據驅動的端到端技能執行具身「小腦」:
具身「小腦」分為具身操作和具身運控兩個子平臺:具身操作涵蓋元技能庫、泛化抓取、技能拆解和錯誤處理等功能。
而具身運控負責實現全身控制、雙臂協作、穩定行走和移動導航等任務。
基于具身「大腦」與具身「小腦」架構,「慧思開物」可以精準解析自然語言交互指令,通過多模態信息融合與上下文理解,將復雜任務分解為可執行的子任務序列,并在任務執行過程中實時監測狀態,通過自適應糾錯機制和動態路徑規劃,確保任務的高效推進與準確完成。
同時,「慧思開物」還內置多場景適配引擎,支持從工業制造到家庭服務等多種場景,結合資源調度與并行計算能力,能夠精準滿足特定場景下的工作節拍與精度標準,為機器人在復雜場景的應用提供可靠的技術保障。
除了具身「大腦」和具身操作能力,基于「慧思開物」,「天工」機器人的具身運控能力也在持續升級。
發布會現場,搭載「慧思開物」的「天工」機器人穩健地走上舞臺,并與唐劍進行了多輪流暢對話,而這背后,離不開慧思開物」平臺在感知、決策與執行一體化方面的能力展現。
▲「天工」與創新中心首席技術官唐劍共同上臺并完成多輪對話互動
「大腦」和「小腦」提供的感知、決策與執行能力背后,是一套高質量的具身智能數據在支撐。
據了解,「慧思開物」依托創新中心構建的具身智能數據全鏈路解決方案,以及行業首個標準化通用具身智能數據集和Benchmark RoboMIND,實現了對多模態數據的高效利用與精準學習。
RoboMIND覆蓋工業、家庭、辦公等多場景任務,具備高度的通用性和可擴展性,作為業內首個經由多類視覺語言動作(VLA)及端到端模型充分驗證的跨本體標準化大規模數據集,為「慧思開物」提供了從任務理解到執行的全流程數據支持。
「慧思開物」平臺的技術突破與多場景應用能力,也為生態合作與產業賦能奠定了堅實基礎。
除了此次慧思開物搭載至優必選最新發布的天工行者人形機器人,不久前,優必選在全球范圍內首次實現把群腦網絡(BrainNet)用于人形機器人執行整條產線的工業級任務。
不難看出,優必選通過「慧思開物」平臺與「群腦網絡」技術的耦合實踐,也標志著具身智能技術從單機智能向群體智能、從實驗室驗證向工業級落地的關鍵跨越。
通過通用平臺兼容多本體(機械臂/人形機器人)、多場景(工業/家庭),解決了行業長期存在的「場景碎片化-系統專用化」惡性循環,大幅降低了規模化部署成本,這也是產業一直以來亟待解決的痛點。
創新中心總經理熊友軍熊友軍向坦言,具身智能在「智能化」方面仍處于初級階段,行業亟需一個具備多本體兼容性、多場景適應性和強大泛化能力的通用智能平臺。
而這次,為了替具身智能產業補上通用軟件系統這塊重要拼圖,創新中心研發的全球首個支持多本體多場景應用的通用具身智能平臺「慧思開物」,就是最好的例子。
03.
北京爭奪具身智能第一城
作為國家科技創新的核心城市,北京市人工智能產業的發展一直處于全國領先地位,隨著具身智能熱度攀升,北京近期出臺了多項推動具身智能產業發展的相關政策。
2月28日,北京市科學技術委員會、中關村科技園區管理委員會等部門發布了《北京具身智能科技創新與產業培育行動計劃(2025—2027年)》提出,北京將利用三年時間,力爭突破百余項關鍵技術,推動萬臺具身機器人規模落地,培育千億級產業集群。
同時,該行動計劃還提到,到2027年,具身智能芯片、全身運動控制等方面突破不少于100項關鍵技術,產出不少于10項國際領先的軟硬件產品,具身智能上下游產業鏈基本實現國產化。
此外,在2025年國務院政府工作報告中也明確提到了具身智能:要建立未來產業投入增長機制,培育生物制造、量子科技、具身智能、6G等未來產業。同時,報告還強調,要持續推進「人工智能+」行動,大力發展智能網聯新能源汽車、人工智能手機和電腦、智能機器人等新一代智能終端以及智能制造裝備。
現在,北京正通過「核心攻關+場景驅動+資本助推+生態協同」的組合政策,構建具身智能產業的全鏈條支持體系。
這些政策的推出與當年新造車運動的興起有相似之處,即國家等相關政府機構通過政策激勵,在具身智能尚缺乏相應的商業落地場景之時,吸引資本流入,通過激活產業,慢慢實現從政策驅動過渡到市場驅動。
而當下北京人形機器人創新中心即起到了類似的作用,這不僅可以強化技術的自主性,也可以創造相應的場景開放加速商業化落地,為全國具身智能發展提供「北京范式」。
而市場,特別是資本市場也在呼應這一趨勢,AI與具身智能也正在資本市場成為中國價值重估的代表。
end.
【關注智能出行,關注智駕網視頻號】
關注汽車的智駕時代上智駕網(http://autor.com.cn)
合作or新聞線索提供,聯系郵箱:editor@autor.com.cn
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.