作 者
先進制造業研究中心
具身智能體通過物理實體和環境的動態交互,實現感知、認知、決策和行動一體化,較為典型的具身智能體包括智能機器人、自動駕駛汽車、自動飛行無人機等,它們顛覆了傳統人工智能“離身性”局限,推動人工智能從虛擬走向物理操作。具身智能體不僅是技術革命的“領航員”,更是國際競爭新賽道的核心內容,其發展水平將深刻影響國家綜合實力與全球科技治理格局,成為塑造未來社會形態的關鍵力量。
01
美國具身智能體發展步入快車道
美國多維度政策聯動推動具身智能體發展
美國聚焦技術、倫理規范等領域,通過政策、基金等方式助推具身智能體發展。從技術層面來看,2023年,美國更新《國家人工智能研發戰略計劃》,仍重點聚焦機器人、人工智能等具身智能體關鍵環節,重點關注人工智能交互和協作的的新范式等內容。從倫理規范來看,2023年,美國發布《關于安全、可靠和可信的AI行政命令》,主要為規避AI系統潛在風險,主要內容包括制定標準、工具和測試,以確保AI系統安全、可靠、可信,解決算法歧視問題。從基金資助層面來看,2024年,美國國家科學基金委(NSF)資助多項人工智能、機器人、邊緣計算等領域研發。
美國實驗室聚焦基礎研究及跨學科深度融合持續為具身智能體提供核心驅動力
斯坦福大學、哈佛大學、麻省理工學院、加州大學圣地亞哥分校、卡內基梅隆大學、加州理工學院、加州大學伯克利分校、賓夕法尼亞大學等多所高校建設具身智能領域實驗室,對于前瞻性、創新性強,甚至具有顛覆性、變革性技術可獲美國國家科學基金委(NSF)探索性研究基金資助,容錯率較高,該類實驗室主要尋求物理交互建模、多模態感知融合等基礎研究突破,構建具身智能體感知層及執行層的基礎邏輯。同時,美國高校多所實驗室聚焦跨學科協同研究,將人工智能、神經科學、材料學、心理學等進行深度融合,重點研究自修復軟體機器人、基于深度學習的情感感知傳感器、智能探索、具有社會情感智能的社交機器人等領域項目。
表1:美國部分具身智能體領域實驗室
美國以全球領先的具身智能體技術塑造產業競爭力
美國具身智能體技術全球領先,尤其是在基礎理論、算法創新及硬件領域競爭力強勁。在基礎理論領域,美國高校通過心理學與AI交叉研究,揭示物理交互對智能涌現的影響,為機器人自主決策提供更接近人類認知的框架。在算法創新方面,美國高校的Dense Fusion算法通過視覺與觸覺的結合,大幅提升多模態目標檢測精度,擴散引導控制模型提高機器人在復雜環境中的動作規劃效率,支持全身靈巧機器人的開發。在硬件領域,美國GPU、NPU等芯片產業生態成熟,有效支撐美國具身智能體發展。
美國具身智能體領域投融資活躍加速其商業化
美國具身智能體的蓬勃發展與其活躍的投融資生態密不可分,資本、技術、市場的高效聯動快速推進美國具身智能體商業化進程。目前,美國具身智能體已吸引超百億美元投融資,Figure AI等企業單輪融資超過5億美元。Figure AI成立于2022年,融資總額已超8億美元,在第二輪投資6個月后,Figure AI發布機器人沖咖啡視頻,已具備自主學習和任務執行能力,三輪融資后,Figure AI機器人語言交互能力、任務執行能力大幅提升。
表2:美國部分具身智能體領域公司主要投融資情況
02
具身智能體整體發展面臨多重挑戰
技術維度:感知、交互、決策執行的“三重困境”
具身智能體作為新興技術,已在多個細分領域取得顯著進展,但其相關技術仍面臨諸多挑戰。一是環境等感知精度不足,例如在復雜光照、遮擋或動態場景中,現有感知技術存在顯著誤差,同時,對于多模態感知融合技術,視覺、聽覺、觸覺等跨模態對齊仍需要持續突破。二是交互能力有限,目前具身智能體的大模型能夠處理的任務相對固定,在多樣化、復雜場景中的泛化能力有限,且目前具身智能體控制系統延遲時間遠超人類神經系統。三是決策執行仍需突破,在高頻交互的場景下,目前算法的決策速度無法滿足需求。
應用維度:落地應用的“理想與現實差距”
具身智能體應用場景廣泛,但其落地仍存在一定問題。一是從仿真到現實的遷移難度較大,具身智能體的仿真環境與現實環境之間仍存在較大差異,且仿真環境缺乏真實物理世界的高質量動態數據,導致具身智能體在仿真環境中表現良好,但在現實環境中表現不佳。二是需求碎片化,具身智能體在工業、醫療、物流、商業、教育、娛樂、安防等應用場景需求差異較大,單一產品難以覆蓋,需高度定制化,研發周期較長。三是消費者預期較高,目前具身智能體產品成熟度不足,例如,家庭清潔機器人僅能完成基礎清潔,養老陪護機器人方言識別能力較弱,應對突發情況能力不足,難以滿足消費者的實際需求。
監管維度:隱私、倫理偏見的“治理真空”
具身智能體的快速發展帶來了顯著的隱私、倫理偏見挑戰,成為制約其健康、可持續發展的重要因素。一是存在數據安全和隱私風險,具身智能體存在隱蔽收集用戶數據可能性,例如,具身智能體通過攝像頭等在家庭應用場景中收集用戶數據。二是數據、算法等導致潛在的偏見問題,數據來源不均衡、數據標注不準確等數據偏見、算法偏見等都可能導致模型對某些群體的偏見,從而導致歧視性決策。三是人機權力關系失衡,自主性邊界不清晰,具身智能體過度自主可能剝奪人類選擇權,如養老機器人強制安排作息,同時,還存在情感操縱風險,兒童教育機器人通過個性化交互誘導用戶行為,如過度依賴或消費引導。
03
具身智能體發展的幾點啟示
系統性與協同性共生,打造蓬勃產業生態
生態軟實力是具身智能體發展的重要基礎,以系統性布局構建產業生態,以協同創新突破核心技術,推動具身智能體從實驗室走向千行百業。一是搭建公共平臺,例如開放數據集與仿真平臺,加速訓練迭代,打造數據標注、存儲、分析平臺,促進數據流通與價值挖掘。二是構建產業創新聯合體,整合硬件、算法、應用方等產學研資源,支持強化算法-硬件協同創新。三是設置倫理容錯機制,構建責任認定與補償機制,設定一定程度的合規緩沖期。四是提前布局基礎設施,建設智算中心等算力新基建,進行5G專網覆蓋,重點園區實現μs級延遲。五是構建政府引導基金、產業資本、風險投資、債券融資等多元創新金融支持體系,探索技術期權貸款,按研發專利潛在價值授信。
技術與市場雙輪驅動,加速商業化落地
具身智能體的商業化需以技術突破為根基,以市場需求為導向,深化應用場景,最終實現具身智能體在工業、醫療、家庭等領域的全面滲透。一是制定核心技術突破優先級矩陣,率先突破高精度執行器、仿生觸覺傳感、仿生驅動關節、輕量化材料、具身認知算法、邊緣計算芯片等關鍵核心環節。二是打造測試認證體系,建立具身智能體測試認證平臺,對認證體系進行分層設計,培育第三方認證機構,提供市場化檢驗服務。三是打造垂直場景標桿案例,在工業、醫療、家庭等場景率先打造示范工程,通過高復雜度場景壓力測試加速技術成熟,形成“技術研發-場景驗證-市場反饋-迭代升級”的正向循環,通過示范工程實現技術落地及市場需求挖掘培育。
倫理與標準先行,構建風險可控國際化發展框架
具身智能體作為鏈接虛擬與物理世界的重要載體,其倫理規范和標準是具身智能體可持續發展的前置要求。一是構建政府監管框架,實施“動態監管沙盒+負面清單”組合管理,在限定區域測試高風險應用,實時監測社會影響構建跨部門數字監管中臺,建立類似藥物臨床試驗的AI倫理委員會,強制關鍵場景,例如醫療、教育等進行審查。二是進行技術糾偏,開發偏見檢測工具,量化評估具身智能體的決策偏差,合成數據增強,用生成對抗網絡(GANs)補充少數群體數據,研發倫理嵌入型芯片,在算法底層植入可解釋性模塊。三是提前布局標準國際化,積極牽頭制定人機交互安全標準、環境適應性標準等國際標準,爭取國際話語權。
滑動查看報告全文
更多行業案例及其特點,請掃描下方二維碼關注“賽迪顧問”公眾號,獲取最新動態。
微信號:ccidconsulting
本公眾號提供的內容用于個人學習、研究或欣賞,不可用于其他商業用途。如有關于作品內容、版權及其它問題,請及時在公眾號留言。
如果獲得轉載授權,請注明作者姓名和轉載的出處,不修改文章的標題、文字、圖片或者音視頻,以免曲解原文意思。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.