作者| 金旺
自2024年5月深入具身智能領域后,英特爾走訪了近20家人形機器人企業,他們發現,在這個市場中,無論是初創團隊,還是老牌自動控制或機器人團隊,都在積極發力具身智能。
“這是一個雙向積極投入的行業,”英特爾內部調研團隊當時得出如是結論。
作為具身智能的終極形態,當時國內人形機器人產業隨著全球人形機器人熱潮得到了空前發展,人形機器人政策相繼推出,人形機器人初創團隊不斷涌現。
來自GGII統計數據顯示,2024年國內人形機器人銷量為2400臺,這個數據到2030年預計將達到16.2萬臺。
如果將這一數據放到與當前產業結合度更高的具身智能領域來看,國內十萬量級、乃至百萬量級的機器人都在經歷著一場具身智能變革。
01 具身智能≠人形機器人
什么是具身智能?
艾倫·圖靈在上世紀五十年代就曾提到,”具身智能是通過與環境交互獲得知識并泛化應用能力。“英偉達創始人黃仁勛則指出,”具身智能是能夠感知、推理并與物理世界互動的智能系統。“
不難發現,具身智能不僅僅是指人形機器人,而是有著更廣泛的定義。
浙江人形機器人創新中心首席科學家、浙江大學求是特聘教授熊蓉在近日的2025英特爾具身智能解決方案推介會上就指出,“人形機器人代表的是一種通用形態,具身智能代表的是一種通用的行為智能,二者結合能實現取代專用機器人的多功能機器人,有更廣闊的應用市場。”
不過,在英特爾的前期調研中,他們發現,短期內,具身智能和人形機器人的發展還難以實現洗碗、疊衣服、收拾房間、照顧老人等大家都很期待的生活化功能。
具身智能和人形機器人的發展將會有明顯的階段劃分:
首先會在工業領域落地發展,例如特斯拉計劃將機器人率先在工廠中落地應用,國內具身智能團隊同樣主要集中在推動具身智能機器人在制造業應用落地。
未來在在制造業得到驗證后,具身智能和人形機器人將會進一步推向服務行業,最終才是進入大眾生活場景。
這是具身智能和人形機器人的應用路徑,具體到現階段具身智能產業化探索時,率先推動具身智能應用落地的制造業企業在梳理工廠中遇到的問題、找出需要投入大量人力并嘗試通過具身智能進行改造時發現,他們需要的機器人的形態不一定通過雙腿行走的人形。
英特爾技術專家根據實際調研結果解釋稱,“工廠中有些固定工位面臨操作復雜、靈活度高的任務難以用傳統方式解決,有些場景則需增加移動能力來更好地落地應用,我們認為具身智能不等于人形機器人。”
就制造業而言,據IFR統計數據顯示,截至2023年底,中國工業機器人保有量達175.5萬臺,2023年裝機量達到27.6萬臺,占全球裝機量高達51%。
其中,機械臂和AGV/AMR應用尤為成熟,2024年國內新增機械臂29.4萬臺,新增AGV/AMR 19.3萬臺,這些機器人的質量和精度都已經很不錯,但智能性有待進一步提升。
這樣的需求同樣是具身智能在制造業場景落地中的實際應用需求,不過,要滿足具身智能的廣泛應用需求,依然面臨著諸多難題。
02 具身智能需要怎樣的算力?
過去三十年里,隨著中國制造業的快速發展,機器人,尤其是工業機器人在國內得到了充分的應用和發展,而作為自動化領域的集大成者,機器人一直在追求智能化。
由大模型帶來的具身智能技術突破,為機器人帶來進一步智能化的可能。
熊蓉指出,“傳統機器人研究會把傳感器獲取的關鍵驅動執行過程拆解為一系列問題,并對每個問題進行建模,尋找合適的數學方法求解,最優化理論、概率推理等方法在其中發揮了重要作用。如今的具身智能是由專家建模求解轉為數據驅動學習訓練,由模塊解耦分離轉為感控一體端到端。”
大模型的技術發展,VLA端到端模型的持續研究,讓感控一體端到端、大小腦融合成了具身智能機器人如今的一大技術發展趨勢。
這樣的技術發展趨勢,又將為機器人技術研究和產業應用帶來怎樣的好處呢?
在接受媒體采訪時,熊蓉進一步指出,“現在的小腦不再只是一個執行的控制,我們希望它具備像視覺伺服、視力伺服等能力,能夠對作業對象形成控制。如果大小腦分開的話,一些傳感器基于大腦控制,下傳就會出現信息過大,不僅對網絡帶寬提出了很高的要求,也會帶來延時問題,因而大小腦在硬件上的分離使我們很難做多種傳感器融合,大小腦融合很好地解決了這些問題。”
然而,端到端系統、大小腦融合對算力同樣提出了“融合”需求。
具身智能現階段主流計算方案中,通常是以英特爾酷睿、凌動系列芯片進行小腦控制,以主流GPU芯片進行大腦控制,這樣的大小腦雙系統架構解決了具身智能專用算力問題,但也帶來了硬件成本高、功耗與尺寸優化空間有限、網絡通信延時不可控、軟硬件研發成本上升等問題。
如何為具身智能機器人定制一個大小腦融合的專用計算解決方案,這時就顯得尤為關鍵。
近日,英特爾正式對外發布了其具身智能大小腦融合方案。
早在2023年12月,英特爾正式對外發布第一代酷睿Ultra處理器,和英特爾以往發布的處理器不同的是,英特爾酷睿Ultra系列處理器不再僅僅是一顆CPU,而是一顆集成了CPU、GPU,以及低功耗、高性能的NPU的處理器。
這樣的計算架構不僅讓英特爾開啟了AI PC時代,也為其在具身智能領域應用奠定了基礎。
據英特爾中國網絡與邊緣技術與產品總監王景佳在發布會上透露,“我們今天推出的英特爾酷睿Ultra 200H系列處理器方案總AI算力已經達到96TOPS,而今年下半年即將發布的基于18A制程的下一代英特爾Panther Lake總算力將超過180TOPS。”
在基于英特爾酷睿Ultra 200H系列處理器的具身智能解決方案中,CPU支持具身智能方案進行復雜的運動控制,英特爾銳炫GPU用于具身智能處理環境感知、任務識別、任務規劃、大語言模型、視覺語言模型和端到端模型等復雜任務,NPU則用于承載語音識別、實時視覺處理、傳感器數據分析等需長時間運行的AI任務。
具體到實際應用場景中,熊蓉指出,“我們發現,在訓練階段,機器人系統對GPU的性能有一定要求,但在實際的探索和推理過程中,對CPU的性能要求更高,這也是我們為什么會采用CPU+GPU方案的原因。”
03 機器人的具身智能升級路徑
從本田的ASIMO、波士頓動力的Atlas,到特斯拉的Optimus、宇樹的H1,人形機器人進入大眾視野已有二十多年。
在這二十多年里,英特爾技術專家認為,機器人經歷了工業自動化、大模型、端到端模型三個階段,在這三個階段中,分別對算力提出了不同需求:
工業自動化階段,機器人依賴傳統計算機視覺、3D點云計算或深度學習網絡來獲取視覺信息,利用3D SLAM技術實現定位導航,并通過Moveit等運動軌跡規劃庫實現雙臂控制。全身平衡和步態控制則依賴于WBC、MPC等傳統控制算法,實時控制和更高頻率的電機控制計算仍然是關鍵。
大模型階段,大語言模型和視覺大模型增強了具身智能的泛化能力,大語言模型可以直接和機器人交互,實現任務編排,視覺大模型則通過視覺泛化能力提升了機器人對環境的理解能力,并為機器人操作提供關于未知物體的輔助信息。
端到端模型階段,從去年下半年至今,學術界和產業界對端到端模型的研發投入了大量資源。此前大模型體現出的泛化能力主要集中在語言和視覺層面,而要真正實現機器人操作能力的泛化,需要將運動維度的數據納入訓練數據集中,從而訓練出一個統一的大模型。
英特爾技術專家認為,工業自動化、大模型、端到端三個階段并不是互相替代的關系,不同架構面對不同應用場景和負載需求時有著自身優勢和性價比。
就具身智能落地應用而言,英特爾也針對性提出兩種解決方案:
針對以大量運動控制為主的工業機器人或具身智能機器人本體,原本只用到了英特爾酷睿或凌動實現運動控制的機器人,用戶可以將傳統的英特爾酷睿處理器更新為英特爾酷睿Ultra處理器,將原有工作負載直接部署到酷睿Ultra CPU上,同時基于GPU、NPU將大語言模型、視覺模型,乃至端到端VLA模型引入,從而將傳統工業機器人提升為具有交互能力、任務生成能力,甚至操作泛化能力的具身智能機器人。
針對現在采用雙系統架構的機器人,可以將原有CPU升級為英特爾酷睿UItra,并借助英特爾工具將AI負載遷移到iGPU上,從而實現一體化具身智能解決方案。
與此同時,在本次發布會上,信步科技還推出了搭載英特爾酷睿Ultra 200系列處理器和英特爾銳炫B570顯卡的具身智能硬件開發平臺HB03。
據信步科技副總經理葉志輝介紹,“信步具身智能硬件開發平臺HB03采用便于開發定制的模塊化設計,有帶顯卡和不帶顯卡兩個型號,帶顯卡版本機身厚度為78mm,算力高達300TOPS。”
此外,浙江人形機器人創新中心打造的“領航者2號NAVIAI”人形機器人,同樣基于英特爾酷睿處理器,實現了可泛化高精準視覺伺服、多行為聯合學習的長序列行為規劃、視力融合的操作行為學習等技術突破。
這些技術突破也將推動具身智能,乃至人形機器人在工業場景落地應用
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.