智東西
作者 ZeR0
編輯 漠影
智東西4月22日報道,近日,在2025英特爾具身智能解決方案推介會上,英特爾正式發布其具身智能大小腦融合方案(下稱具身智能方案)。
該方案基于英特爾酷睿Ultra處理器以及全新的具身智能軟件開發套件和AI加速框架打造,憑借創新性的模塊化設計,能夠兼顧操作精度和智能泛化能力,且性價比出色,可滿足不同領域需求。
現在具身智能產品處于小批量階段,不同應用場景對IO接口、傳感器、算力有不同的需求。如何打造能夠快速適配不同需求的靈活計算平臺,是一個關鍵挑戰。
許多具身智能大小腦方案采用雙系統來實現。而英特爾推出的具身智能應用解決方案采用一體化單系統設計,能夠以較低的總成本,實現高效靈活的工作負載分配。
硬件上,該方案搭配英特爾酷睿Ultra CPU核心板。英特爾酷睿Ultra 200H CPU可提供90 TOPS性能,下一代Panther Lake算力可達到180 TOPS。
其硬件方案采用模塊化設計,可針對不同具身智能應用場景進行靈活搭配,包括支持MxM嵌入式顯卡插槽,可擴展接入英特爾銳炫獨立顯卡;攝像頭轉接板,接入多路MIPI/GMSL嵌入式攝像頭,擴展感知能力;獨立的IO載板,擴展各類接口。
軟件上,該具身智能方案提供全棧式軟件平臺,包括底層的BSP、算法模型、加速庫、參考示例等,附文檔和開發教程;還提供實時調優BKC、RT Linux內核和優化的EtherCAT IgH主站協議棧示例,以更好支持實時運動控制。
算法方面,英特爾在CPU對傳統運動規劃和視覺算法進行優化,通過iGPU和NPU加速基于深度學習、大模型的感知和操作。
還有各種軟件工具,包括實時性能調優工具和Debug工具,有助于降低學習成本和開發部署成本。
英特爾可擴展產品組合豐富,提供了從入門級到1000TOPS以上的AI算力,以及從低到高的CPU算力產品組合,并在開發工具等方面實現了統一,可用于構建覆蓋各種類型的具身智能解決方案。
例如酷睿、凌動非常適合做本體運控小腦。云端或邊緣側大腦可接入酷睿、至強、銳炫獨立顯卡。無論是傳統機器人智能化改造,還是人形機器人大小腦融合,或是將傳統運控小腦升級成AI運控小腦,都可以利用酷睿UItra實現。
浙江人形機器人創新中心已基于英特爾酷睿處理器,打造出“領航者2號NAVIAI”人形機器人,實現了可泛化高精準視覺伺服、多行為聯合學習的長序列行為規劃、視力融合的操作行為學習等技術突破,能夠使其在工業場景中執行復雜任務,也可以在服務場景中完成人機交互和輔助等任務。
一、具身智能需要單系統方案:低成本、低延遲、低功耗
隨著具身智能從人工設計算法逐漸轉向到數據驅動的模型,具身智能計算負載需求的發展趨勢,也從以CPU為主計算發展到CPU、GPU并重,乃至需要云端算力的輔助。在不同場景、不同應用需求下,不同架構各具優勢和性價比。
據英特爾技術專家介紹,目前主流計算架構是大小腦融合架構。小腦部分以x86為主,包括英特爾12、13代酷睿,還有凌動N97、N305,用小板子實現功耗和尺寸的優化;大腦部分的主流方案以其他廠商的產品為主。兩個系統通過網絡進行通信,最終實現雙系統方案。
由于市面上沒有單系統能夠同時提供CPU和GPU算力,因此很多時候不得不采用雙系統方案來解決現有問題。這樣的架構帶來很多設計挑戰,帶來研發、維護等成本的提升,對整個計算平臺的功耗、尺寸、結構優化都有很大限制,無法像單系統那樣進一步做極致優化。
另外,兩個系統通過網絡進行通信,無論是雙系統時間同步,還是之間的信息交互,都會有帶寬限制和延遲。
因此業界需要采用更好的單系統方案解決這些問題。
英特爾酷睿Ultra產品線把CPU、GPU、NPU封裝在一個SoC里,讓低功耗SoC可提供強勁的CPU算力、AI算力,滿足了具身智能在絕大多數場景需求。
不同系統之間通過共享內存來通信,無論是網絡通信還是CPU內存和獨顯的顯存通信,共享內存方式會更穩定、更快速。
此外,單系統方案可幫助顯著降低整體計算成本。在能效方面,酷睿UItra支持28W-65W,以便用戶根據實際需求匹配功率實現更好的功效和續航。單系統配合ODM設計也可以實現更小巧的尺寸,以及更靈活的接口。
二、以大小腦融合為亮點,處理具身智能復雜任務
英特爾具身智能方案以大小腦融合為亮點,能夠使感知、交互、任務規劃和運動控制在統一的系統中實現高效整合。
作為其中的算力中樞,英特爾酷睿Ultra處理器通過CPU 、集成的英特爾銳炫GPU與NPU協同運行,以高性能異構算力和高精度實時性能,支持具身智能的多樣化負載穩定運行,同時也大幅提升具身智能系統的整體效率和響應能力。
其中,通過CPU可以支持具身智能方案進行復雜的運動控制,集成的英特爾銳炫GPU可處理具身智能處理環境感知、任務識別、任務規劃、大語言模型(LLM)、視覺語言模型(VLM)和端到端模型等復雜任務,NPU則承載語音識別、實時視覺處理、傳感器數據分析等需長時間運行的AI任務。
據英特爾中國網絡與邊緣技術與產品總監王景佳分享,酷睿Ultra系列處理器的架構符合當前異構計算的趨勢,不僅適用于AI PC消費類場景,而且為具身智能場景提供了理想的解決方案。
英特爾也在顯卡市場持續投入。王景佳談道,去年底發布的英特爾銳炫B系列顯卡在市場上廣受好評,對于具身智能場景而言,它可能是性價比或性能功耗比最佳的產品。
另據英特爾技術專家分享,酷睿Ultra處理器可持續提供強勁的x86算力,實現實時的運動控制。CPU采用大小核架構,擁有多達16個CPU核心,運行主頻最高可達5.1GHz;在AI工作負載下,其實時確定性可達到20微秒抖動,為運動控制提供更好的確定性保障。
新推出的英特爾酷睿Ultra 200H系列處理器方案,總AI算力已達到90 TOPS。基于Intel 18A的下一代英特爾Panther Lake總算力將超過180 TOPS。
NPU的能耗表現尤為出色,可在2W功耗下提供13 TOPS的AI推理能力。
集成顯卡GPU部分單獨可達到77 TOPS的算力,支持各類視覺模型、大語言模型、端到端大模型,通過OpenVINO和IPEX-LLM,能夠對傳統的卷積神經網絡模型和大模型進行優化。
英特爾也在集成顯卡(iGPU)上進行了具身智能相關算法的測試。例如,對于機器人在物體檢測中常用的YOLO v8算法,在2048×2048高分辨率下,使用FP16的網絡精度進行測試,推理效率可達108 FPS。
如果使用該集成顯卡運行6-9B參數規模的小尺寸大語言模型,能夠達到約800毫秒的首個token生成時間,后續平均token生成時間為50-80毫秒,效率很高。
英特爾具身智能方案搭載了最新一代的英特爾銳炫B系列顯卡(Battlemage)。該獨立顯卡采用Xe2架構核心,相較上一代產品效率提升顯著,每個Xe核心的性能提升高達70%,每瓦性能也提升了50%。
英特爾在此方案中采用的是銳炫B570。該顯卡具有18個Xe核心,每個Xe核心配備8個AI計算單元,總計144個AI計算單元,整體AI算力可達200+ TOPS,從而進一步擴展了AI能力。
英特爾在獨立顯卡上進行了大量的大語言模型推理測試。以6B-9B參數規模的大模型為例,在銳炫B系列顯卡上,首個token的生成時間約為100毫秒,后續token的生成時間約為10-15毫秒,可用于具身智能應用中的人機交互、內容生成以及通過大語言模型進行動作編排。
VLA大模型通常包含三個部分:一個運行頻率約為10Hz的慢思考視覺語言大模型,一個運行頻率為200Hz的動作大模型,以及一個需要實時處理總線信息和模型運動控制的實時系統。2B-7B VLM大模型適合在酷睿Ultra內置的銳炫GPU上運行,NPU上則適合運行如ACT算法等。
三、提供具身智能軟件開發套件,縮短評估和開發時間
同時,英特爾推出了具身智能軟件開發套件,通過包括OpenVINO工具套件、英特爾oneAPI工具包、Intel Extension for PyTorch-LLM(IPEX)、英特爾工業邊緣控制平臺(ECI)、基于開源機器人操作系統的庫、中間件和示例應用程序,使代碼實現一次開發多平臺部署,縮短評估和開發時間,加快客戶應用程序的部署以及算法和應用的運行。
▲英特爾具身智能軟件開發套件
在軟件框架和加速器的基礎上,英特爾開發了一系列參考用例,例如視覺伺服、模仿學習、優化運動控制、以及基于大模型的運動規劃。這些參考實踐代碼旨在幫助開發者更好地理解如何基于軟件平臺實現各種具身智能應用。
英特爾亦提供跨平臺AI模型優化工具以及端到端流程加速方案,以簡化方案搭建過程,加快產品上市。
該軟件開發套件能夠將不同類型的工作負載均勻地分配到CPU、NPU、集成顯卡,甚至獨立顯卡上進行協同運行,從而更充分地利用整體計算資源。
例如,傳統的運動規劃庫和MPC運動控制算法,因其軟件特性,在CPU上能夠獲得更高的運行效率,因此可以將其調度到CPU上運行。而CNN視覺模型在iGPU或NPU上可能運行效率更高,因此可以將其調度到NPU上運行。對于需要更多AI算力的大模型,則可以將其分配到集成顯卡或獨立顯卡上運行。通過這種方式,整個系統能夠得到更高效的利用。
在使用上,英特爾具身智能軟件開發套件旨在最大程度地降低用戶使用成本,把SDK大部分的軟件包打包,將英特爾提供的代碼庫添加到APT源中,然后安裝Deb包、下載源碼,就可以通過英特爾在線APT代碼庫進行下載和部署,軟件包支持Ubuntu 22.04 LTS版本。
此外,用戶可使用在線文檔教程快速入門,獲取相關信息及原文件下載。
四、與本體生態伙伴深度合作,探索具身智能全鏈路協同
在持續推動具身智能軟硬件創新的同時,英特爾亦與本地生態伙伴展開深度合作,探索從技術研發到場景落地的全鏈路協同模式,構建起協同共進的產業生態格局。
其中,信步科技推出的具身智能硬件開發平臺HB03,搭載英特爾酷睿Ultra 200系列處理器和英特爾銳炫B570顯卡,能夠提供強大且靈活的算力,并實現極強的控制實時性。
信步HB03平臺通過緊湊結構、擴展接口與工業級可靠性設計,具有性能更強、尺寸更小、可靠性更高、靈活配置等優勢,為具身智能“大小腦”融合構建了有力的硬件支撐。
HB03有4個顯著優勢:
(1)更強大:采用了英特爾酷睿Ultra 200系列處理器,支持96 TOPS算力;采用了板貼內存方式,提高了可靠性,也旨在實現CPU和內存之間更高的數據帶寬。96 TOPS的本體算力加上英特爾顯卡,整個HB03最高支持300 TOPS算力。
(2)更緊湊:HB03有兩個型號:支持顯卡,算力達300 TOPS的版本,厚度為78毫米;不帶顯卡,本體算力為96 TOPS的版本,厚度僅為53毫米。不同型號能夠適配不同尺寸、不同形態的具身機器人。
(3)更可靠:對所有對外接口都采用了加固設計,解決傳統USB標準接口和RJ45水晶頭在運動過程中容易脫落、線纜過粗、不易整理等問題。
(4)更靈活:采用模塊化開發理念。屏幕上展示的所有接口都可以自由定制和靈活配置,幫助用戶快速實現項目落地和產品銷售。
HB03支持寬電壓輸入,最高耐壓輸入可達75V,可直接連接到電池模組上,無需額外配置200W的電壓模塊,令使用更加便捷可靠;散熱方面,采用了CPU和GPU分別放置在兩側的設計,以解決熱量集聚的問題,每個單元都采用了銅管和渦輪風扇散熱,盡可能將熱量導出。
結語:以高性價比軟硬全家桶,助攻具身智能規模化、場景化應用落地
具身智能產業的快速發展,正在帶動算力基礎設施需求之變。英特爾具身智能方案憑借大小腦融合架構的創新,帶來功耗、成本、算力的平衡,為高效構建具身智能系統提供了一個高性價比的選擇。
英特爾市場營銷集團副總裁、中國區OEM & ODM銷售事業部總經理郭威談道:“以人形機器人為代表的具身智能行業正迎來前所未有的發展熱潮,然而,系統架構的非一致性、解決方案的泛化能力不足、場景適配的復雜性等挑戰,正在制約其大規模商業化的進程。基于此,英特爾攜手生態伙伴,通過大小腦融合的方式,打造更高效、更智能的解決方案,以基礎通用大模型與硬件技術的協同突破,以及開放生態所帶來的加速效應,推動具身智能向實踐應用場景的邁進。”
未來,英特爾計劃持續深化技術創新,與生態伙伴拓展其在醫療、教育、養老等關鍵領域的應用場景,共建開放、協同的具身智能生態體系,使具身智能真正賦能千行百業,為社會的高效運轉與可持續發展提供助力。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.