近日,逐際動力創始人張巍久違地露面,在公開場合首次發表了一場演講。除了明確逐際動力的定位和產品方向外,他對當下機器人、無人駕駛行業的主流技術、商業化路徑也進行了分析。
RoboX對其演講內容進行了如下摘要整理:
“機器人永不會代替人”
張巍認為,具身智能是當下最火的一條賽道,盡管它目前仍面臨很多問題和質疑,但背后還是有一個共識——具身智能是未來十年人類最重要的科技革命。
如果機器人的定位是「代替人完成可以改變物理世界的任務」,這其中就有兩個關鍵詞——「代替人」和「任務」,它們看似簡單,其實往往是巨大的陷阱——如果不理解透這兩個詞,具身智能落地就會變得異常復雜。
他表示,逐際動力(以下簡稱「逐際」)的觀點和定位,并非是讓機器人去代替人,而是Empower人——“機器人永遠都不會代替人,它背后的邏輯是很復雜的。”
首先,張巍用兩個具身智能類型,分析了其背后的商業化難點。
1、機器人+AI:他表示,上一代的機器人+AI模式已經做很長一段時間,這是商業化最難的方向,它其實可能只是「海市蜃樓」。
此類機器人能在工廠里能完成非常復雜的分揀任務,或者快遞包裹分揀。但是它們在真正的商業閉環上,還是有很多挑戰的:“沒準賣出去的那一剎那,就是賠錢的開始。”
2、無人駕駛:在張巍看來,從2016-2024年,無人駕駛已經發展了很長時間,卻仍難以評判其成熟度——“當感覺找到「技術開關」時,卻還是有「最后的10%」的難度是無法估計的,恰恰就是這10%,是影響整體發展的關鍵。
”同時,其商業價值也很難判斷。因為代替人,和協助人,這兩件事是有本質區別的,它們有著不同的商業模式,也會帶來不同的產品,這兩種產品所經受的打擊是完全不一樣的。
讓機器人「用起來」其實非常簡單,可是形成商業閉環卻非常難。現在上路的無人車,或者配送車的本體,都不是主角,在整個商業價值鏈條里占比不到10%。
同樣的,機器人產品本身也只占商業鏈條的不到10%,剩下的部署維護、改造場景,協作關系等部分才是最大的開銷。所以機器人不光有好的本體,還一定要有數據工具、訓練工具、部署工具,以及維護工具,這一整套的效率體系才是競爭力,而非本體。
同理,如果想讓機器人代替人,并非改變本體的問題,而是要改變一整套協作關系。
大語言模型,能做的仍很有限
現在提到具身智能,都會聯想到與大語言模型的結合。
例如,要想將人類的意圖告訴機器,就需要task encoding或者embedding(任務編碼或嵌入),大腦要先對task進行處理和決策,再由小腦去執行運動。
對比起來看的話,無人車是非常簡單的具身智能任務,因為其任務定義很明確,唯一目標就是到達目的地,在結構化的道路上移動。而且,無人車的「小腦」就是底盤和域控制器,如今也已經非常成熟。
即便如此,張巍也不認為目前的無人駕駛可算作「完全替代人」:“它本質上還是AI+人。我不覺得目前有完全交給AI的無人駕駛,只是用技術改變了人開車的方式。”
而對于具身智能來說,完全代替人類更加困難。
張巍用一個很簡單的任務舉例:給我收拾一下桌子。可這樣的任務卻很難被拆解和執行。
“如果沒有大語言模型,大家甚至都不太敢想這樣的任務。但現在只是敢想,具體怎么做還不清楚。”
應當「押寶」哪種本體?
理想化的想法,是用數據堆出一個「具身大腦」,同時也有通用小腦+通用本體,就能完成各種任務。
但是張巍認為,采用一致的通用本體形態,是沒有必要的。對此,他總結出現有的四大本體類型:
- 1、機械臂,它的控制器小腦極其成熟。
- 2、輪式底盤+雙臂,它的控制器也相對成熟。
- 3、人形+人形特有的小腦。
- 4、人形的下半身,只有雙腿或四腿,主要完成locomotion(移動能力)的任務。
(逐際動力 - 人形機器人CL)
本質上機器人就在做兩件事:代替雙手、代替雙腿。他認為,在行業發展過程中,創造最大價值的應該是這兩類本體,所以逐際也是選擇做這兩類。
“押寶押哪一個,去做哪種本體?我認為這不是一個好問題,好的問題是‘這個行業還需要發展哪一種本體’。”
在他看來,要想做高價值的本體,需要3個條件:1、目前在物理世界中尚不存在;2、原理上可支持被做出來;3、未來一定是機器人形態中的一種。
模型就像牛頓定律
只是歷史數據的壓縮
“大家希望用一個大模型,就做成整個大腦。其實這是個不切實際的想法,其實要好多大腦。而且現在我們不缺某個領域里的大腦,我們缺的是學習的能力,也就是對數據高效處理的能力。”張巍說道。
不可否認的是,仿真是一種對模型的使用方式,且仿真和模型對數據的發生和產生都有巨大幫助。但是模型是歷史數據的壓縮,就像牛頓定律是對所有運動物體的數據的一個壓縮,只不過壓縮得比較好。
“牛頓定律和大語言模型沒有任何本質的區別,它只是這一類數據中最好的壓縮方式。所有壓縮好的數據,都可以用來作為數據的生成,產生新的數據,幫助推進泛化。”
他指出,操作的泛化性有好多種,有分模塊的,有端到端的,它們本質是對數據的利用和假設的不同方式。
“但是當前,我們的所有數據處理方法都難以達到理想中的功能需求。所以現在不能盲目地要追求在一種方法上去堆數據提升性能,而是要找到我們認為的‘曲線D’,也就是我稱之為‘性能數據比’或者‘數據性能轉化率’的一條曲線,現在還不是一個堆數據的時候。”
那么,怎樣才能找到更好的數據利用率?張巍表示,其實從容易獲得的規則數據中,還是有很多信息能幫助我們指導操作的泛化性的。
他展示了一個逐際動力的案例——不利用數據,完全通過text prompt,讓大模型生成人類操作的視頻,就能指導協作機械臂完成操作任務。
“我們的數據利用率,可達當前算法的100倍。”張巍說道。
他表示,逐際之所以做人形本體加全控小腦,是希望將「未來一定有用,現在還沒有做得很好」的這一類東西做好。
同時,逐際也在研發低成本的具身大腦工業母機,探索一種新型的學習訓練方式,以求可以在任意領域中以更高的效率去完成可泛化的任務。
張巍強調稱,逐際動力的核心的定位一直都是Empower innovators:“我們不直接進工廠,我們的定位是希望做具身智能的英偉達,將具身智能創新、落地的效率提升百倍千倍。”
據他透露,目前逐際的人形機器人(大負載全身搬運)已經用最低成本的方式完成了原理驗證,而且是在驗證目標沒有被取舍掉的前提下。
同時,逐際還即將發布第一款全尺寸人形機器人,能夠原地起立、直膝行走。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.