人形機器人,是科技領域的熱門話題,尤其是近期,某國產機器人更成為輿論和公眾新寵,風頭一時無兩。
但圖靈獎得主、Facebook首席人工智能科學家和紐約大學教授楊立昆的“大嘴巴”又來了。楊立昆近期在一檔播客節目中表示,“很多人形機器人演示令人印象深刻,但實際很蠢,不少機器人公司都在豪賭未來3到5年AI會突飛猛進。”言辭之間,是對當下人形機器人智能性的嚴重質疑。
智能機器人,機器是個殼,AI做靈魂。楊立昆對AI的批評由來已久。早在2024年5月,他就在社交媒體上質疑AI威脅論,認為當前AI大模型的智力水平甚至不如家貓,缺乏推理能力和對物理世界的理解。
同年10月,在《華爾街日報》專訪中,他再次強調AI威脅論是“胡說八道”,指出生成式AI僅擅長預測文本,缺乏真正的推理和常識。
他還批評馬斯克、奧特曼(Oenp AI創始人)等對通用人工智能(AGI)的樂觀預測,認為其缺乏科學依據。
2025年2月,在巴黎人工智能行動峰會上,楊立昆再次炮轟生成式AI,稱其“無法達到人類智慧水平”,并呼吁學術界轉向研究“聯合嵌入預測架構(JEPA)”,以構建能理解物理世界的AI系統。
楊立昆(Yann LeCun)何許人也?
這位是人工智能領域的大拿之一,其核心成就包括發明卷積神經網絡(CNN)并推動其實際應用。他于1987年提出CNN概念,1998年開發的LeNet-5成為首個成功應用于手寫體識別的CNN模型,奠定了現代計算機視覺的基礎。還在深度學習領域持續突破,改進反向傳播算法,推動無監督與自監督學習研究,減少對標注數據的依賴,并提出能量模型等理論框架。
2018年,他因在深度學習的突破性貢獻與辛頓、本吉奧共同獲得圖靈獎。
加入Meta后,他領導團隊將AI技術應用于社交、醫療等多領域,并主導開發開源大模型Llama系列。其數百篇頂級論文與合著的《深度學習》著作,系統構建了學科理論體系。
作為學界與工業界的橋梁,楊立昆培養了大批人才,推動AI從實驗室走向產業,被公認為計算機視覺與神經網絡研究的先驅。
所以,楊立昆對人形機器人及AI的批評,可不是外行人看熱鬧。
誠然,人形機器人是一大風口,這些年,執著在人形機器人下注的企業很多。
波士頓動力可能是大家最早了解人形機器人的代表性企業, 特斯拉的Optimus(擎天柱)人形機器人研發也在推進中。
而在國內,從優必選到宇樹科技、稚暉君創立的智元機器,在人形機器人領域的身影也分外活躍。
數據顯示,截至2024年12月底,全國共有45.17萬家智能機器人產業企業,注冊資本共計64445.57億元。這其中,哪怕只有百分之一的企業是專注人形機器人,其投入也是天文數字。
但與此同時,對人形機器人熱潮冷眼旁觀的不止楊立昆一人。
作為RT-X項目(一個旨在提升機器人智能和泛化能力的研究項目)參與者的Wolfram Burgard教授接受媒體采訪時指出,當下的基礎模型訓練方式有著能效上的巨大問題,它需要太多的算力和數據才能達到泛化的門檻。
他舉了個例子:在RT-X數據集項目中,雖然他們收集了超過100萬個片段,覆蓋了機器人的500多項技能和在16萬項具體任務上的表現,但當桌子高度稍有不同,RT-2就可能完全無法正確進行任務了。
機器人,到底要不要弄個人樣?技術分歧的背后是產業實踐的矛盾。
今年世界機器人大會上,人形機器人打詠春、跳熱舞的視頻刷屏社交網絡,但在家庭場景演示中,疊衣、擦桌等基礎任務頻頻失誤。
人性機器人能前后空翻,卻疊不好一件衣服?
原因在于,人形機器人需要通過傳感器感知自身的姿態和位置,然后通過控制系統調整機械結構來完成動作,其過程主要依賴于預編程的算法和模型,不需要對物理世界進行深入的理解和推理。
相比之下,疊衣服則是一個更加復雜的任務。它要求機器人對物體的形狀、質地、紋理等進行感知和理解,然后根據這些信息進行精確的操作。
上述現象稱為目標驅動與規劃能力缺失,是當前AI技術面臨的一個重大挑戰。
分層規劃是一種復雜的決策和執行過程,它涉及到將一個宏大的目標分解為一系列逐步細化的子目標,且這些子目標又可以進一步細分為具體的行動步驟。
人類和動物在日常生活中經常使用這種策略來解決問題或完成任務。例如,一個人想要做一頓飯,這個大目標可能被分解為準備食材、烹飪不同的菜肴、布置餐桌等多個子目標。每個子目標又包含更具體的動作,如切菜、調味、加熱等。
相比之下,現有的AI系統往往缺乏這樣的靈活性。盡管現代AI可以在特定領域內表現出色,例如圍棋或象棋中的決策制定,但在面對復雜多變的真實世界任務時,它們的表現就顯得力不從心了。
家務活動就是一個很好的例子,看似簡單但其實包含了無數細微的動作和判斷。例如,清理桌子不僅涉及物理上的移動物品,還需要決定哪些物品應該放在哪里,如何避免打翻水杯等。這些都需要對環境有深刻的理解以及靈活應對的能力。
現有AI系統的局限性,在于它們通常依賴于預設的算法和大量訓練數據來執行特定任務,而不是像人類那樣基于經驗進行即時調整。
如此意味著,當面對未曾見過的情況或者需要跨多個領域綜合考慮的問題時,AI可能會感到“困惑”。
此外,由于缺乏對因果關系的理解,AI難以預測其行為可能帶來的長期后果,這也是導致其規劃能力受限的重要原因之一。
人是造物主的杰作。人手共有22個自由度,而當前大多數機械手,如夾爪形態(8個自由度)、6自由度仿人手機械手(同樣8個自由度),以及全驅動靈巧手(如Shadow hand,超過20個自由度),均無法完美復刻人手的功能。
此外,能源與硬件的“不可能三角”進一步制約發展。人形機器人需在有限體積內平衡動力、續航與成本。高能耗傳感器和復雜機械結構,導致現有電池技術難以支撐長時間自主運行。
稚暉君創立的智元機器近日爆紅,但講到機器人的性能時,相關工作人員承認,目前只能達到人類效率的20%-30%,而且電池續航僅有兩個小時。續航短也是業內人形機器人的普遍問題。
用一個通俗的比喻,當下人形機器人就像垂垂老矣的白發翁,每做幾個動作,就得停下來充電。
機器人行業突圍,需正視三大現實。
首先是放棄“通用幻想”,深耕垂直場景。藍橙實驗室與清華大學合作的五軸并聯加工機器人,專攻航空發動機葉片打磨,通過限定工作場景將精度提升至微米級;華中科技大學吸附式移動機器人聚焦船舶曲面焊接,放棄人形設計換取更強環境適應性。
其次是重構技術路線圖。哈工大教授朱延河團隊建立工業機器人開源架構,允許廠商共享運動控制算法,避免重復造輪子。
相關探索雖未突破根本,但指向更務實的技術迭代路徑。
最后是重新定義“智能”標準。智能與否不看動作復雜度,而看任務泛化能力。工業機器人若實現自主更換夾具的模塊化設計,或許比執著人形更易打開市場。
顯然,圍繞人形機器人的爭論,是技術路線之爭,更是對機器人及AI的認知之爭。一方堅持“人形是通用智能最佳載體”,認為雙足移動與人類環境天然兼容;另一方主張“形態服務于功能”,認為輪式、臂式或模塊化設計更易商業化。工業機器人歷經60年發展,從Unimate機械臂到現代協作機器人,技術突破均圍繞專用場景展開。人形機器人若執著于“通用性”標簽,可能重蹈早期自動駕駛企業盲目追求全場景的覆轍。
機器人產業的終極目標不是創造“人造人”,而是拓展人類能力的邊界。向左,是繼續追逐“像人”的幻想,向右,是擁抱細分場景的實用主義。選擇哪條路徑,將決定這個行業是真正走向為人所常用,還是又一場資本狂歡的泡沫。
作者簡介
當你關注財經和時事熱點時,我愿和你分享背后的故事和觀點
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.