在本次2024世界機器人大會上,有一場十人對談,堪稱人形機器人「史上最大Penal」,其中干貨量巨大,適宜業(yè)內外共同了解這一新行業(yè)的發(fā)展現狀。
這十人包括:
主持:張建偉(中國工程院外籍院士,德國國家工程院院士,德國漢堡大學教授)
對話嘉賓:
甘中學(智昌科技集團股份有限公司董事長兼總經理,復旦大學教授)
任雷(月泉仿生公司聯合創(chuàng)始人,吉林大學唐敖慶講席教授)
許多(小米集團技術委副主席、手機部副總裁、機器人公司總經理)
程昊(加速進化科技有限公司董事長)
張世璞(Noetix Robotics聯合創(chuàng)始人、首席執(zhí)行官)
冷曉琨(樂聚(深圳)機器人有限公司董事長)
郭彥東(智平方創(chuàng)始人兼首席執(zhí)行官)
李博陽(大連蒂艾斯科技發(fā)展股份有限公司聯合創(chuàng)始人、總裁)
趙同陽(眾擎機器人創(chuàng)始人兼首席執(zhí)行官)
以下為RoboX提煉出的討論內容,本期主題主要圍繞中外差距、產學研問題,以及1-5年預測。
產學研融合需求
張建偉:要想獲得不斷的技術源泉,靠企業(yè)自身的研發(fā)肯定是遠遠不夠的。我們應如何促進產學研更有效地合作,使得人形機器人這么復雜的系統(tǒng)能夠源源不斷的獲得技術支撐?
甘中學:產學研合作很難,現在做大模型也好,未來做算力也好,有點跟隨性的做法。大模型,還有算力、TPU等等,我覺得中國要想要在這方面走出自己的路來,一定要換一換研發(fā)思路。
建議一:要把大算力和算法的創(chuàng)新結合起來,必須是算力和算法并行進行,才能找到一個多快好省的辦法,去和國外競爭。
建議二:具身智能目前正在開發(fā)當中,大語言模型我們已經不如國外先進,希望可通過具身智能的「知行合一」實現突破。
任雷:產學研融合是一個大趨勢,因為人形機器人是高度復雜、集成的系統(tǒng),它不光包括了感知、驅動、材料,結構,還是綜合的多學科交叉的攻關項目。
目前,很多基本的科學問題還有待解決。首先我認為學校可以主要負責類似創(chuàng)新結構設計的工作,尤其是仿生的設計。另外新型的感知材料、驅動材料等,也應考慮在人形機器人上應用。
另外,學校也非常需要企業(yè)。因為學校有時更偏重于發(fā)論文,出專利。但是有可能這些技術只考慮性能,不考慮成本和工藝問題,這就脫離了批量生產的需求。
還有一件很重要的事:企業(yè)不能光去整一些炫酷的Demo,而是應該真正了解應用方的場景需求和任務需求,這是未來需要產學研融合去做的事情。
許多:針對一些尚未突破的科學問題,我們會和高校一同合作,進行科學范式的探索。而有些從其他行業(yè)遷移過來的成熟技術,則會由我們去做產業(yè)化。
在整體構型上,我們既要基于科學和高校、研究機構合作,也要基于應用去做產業(yè)的深度開發(fā),最后把這兩者在一個軟件平臺上、仿真平臺上深度的融合,去加速應用。
我建議大家選擇要做的東西時,還是要把這個產業(yè)堅決地做透。例如目前,一體化電機的MCU還是用英飛凌的,價格還是很高的,國產化也不充分。再比如,電機里面的編碼器,國產做得也還是有非常大的差距。
人形機器人的市場規(guī)模是會比機械臂市場擴大到若干倍,過去那些做零部件的企業(yè)需要去重新思考,如何在更大的體量中做到更好。
(圖片來源:波士頓動力創(chuàng)始人Marc Raibert演講素材)
程昊:現在這個階段,有點像70年代信息革命剛開始的時候,硅谷作為發(fā)源地,其特點就是有斯坦福、伯克利,再加上政策推動,孵化出了很多企業(yè)。
創(chuàng)新是失敗率很高的事情,100個創(chuàng)業(yè)團隊可能最后只能活一到兩個。但如果這些創(chuàng)新放在學校里,學生、老師用經費去做,試錯壓力會小一點。
在高校創(chuàng)新,然后在公司里去做商業(yè)化,再把賺來的錢回來反哺學校,就能形成一個非常好的循環(huán)。
張世璞:近兩年,我們發(fā)現了非常多炫酷的Demo,其實背后都是在讀博一、博二非常優(yōu)秀的00后年輕人去做出來的。
現在技術發(fā)展迭代的速度非常快,甚至是按月來計。我們作為企業(yè)能夠讓這些優(yōu)秀的年輕人拿到基礎設施以后,快速驗證自己的想法,讓POC得到快速迭代。
冷曉琨:產學研結合是樂聚一直都在做的事情。2016年,我們10個哈工大師兄弟成立樂聚的時候,都在讀書。我那時是博一,剩下的都是研一或本科生。
人形機器人是一個集成度特別高的產品,一個高校、一個實驗室很難聚集這么多的技術來做這件事情,但是企業(yè)適合做這種大工程性的工作,并且進行產業(yè)化落地。
郭彥東:有一本書是《科學無境的前沿》,雖然是70多年前的思考,但也很好地分析了如何用創(chuàng)新來驅動經濟發(fā)展。
其實科研呈現非常典型的紡錐型,它對于結果不那么敏感,更適合進行更長期的、更高遠利益的投入,我覺得這個是真正的源頭。
不管人形機器人創(chuàng)業(yè)有多么的火爆,都不應把這個源頭的重要性忽視掉,我們還是有非常多的硬核科學問題,等著教授們去解決。
李博陽:我覺得現在高校老師手里還有很多好東西沒有被挖掘出來,有一些項目在初期,可能并不是專為人形機器人做的,但那些技術可以去跟人形機器人做結合。
所以我覺得可以在體制的設計上更加開放,使高校的科研成果讓更多企業(yè)接觸得到,這樣當我們打造機器人的硬件也好,應用場景也好,都可以到學校中去選擇覺得適用的,然后經過進一步的轉化應用產品中來。
另外還有人才方面的問題,有一些非常優(yōu)秀的博士、碩士到了人形機器人企業(yè)中來,他很難馬上上手,也不能馬上融入到交叉學科的環(huán)境中來。所以我覺他們在校期間,除了老師帶領做項目之外,企業(yè)也可以提供更多的前沿項目。
趙同陽:我們2016年創(chuàng)業(yè)到2018年期間,碰到了很多關于算法的問題,第一個想到的就是學校。2018年到2019年年初的時候,我們的本體做出來了,但是在國內力控算法都還沒有。當時有一個契機是MIT開源,也是學校的力量,但是開源之后,國內真正能玩起來的沒有幾個人。
當初為了把這套算法引入國內,我找到了山東大學控制學院的李老師,他們的學生還是比較厲害的。他們告訴我,可以把算法搞定,但是結合本體硬件可能需要6個月的時間,后者恰恰是我們企業(yè)的能力范疇。
我記得用了不到6周的時候,我就把本體給做出來了,結合他們的軟件沉淀和積累,把MIT的那套算法在國內復現,并且把它分享出來,成為一個開源項目。所以國內現在很多做力控算法的,在這方面都得益于那套算法。
另外在合作過程中,我也發(fā)現一些問題,鐵打的學校,流水的學生,一代一代的沉淀和積累,系統(tǒng)性并不強,這會造成人才斷鏈的問題。當我在今年重新做人形的時候,我發(fā)現這樣的人才仍然是非常稀缺的,第一個想法仍然是求助于高校。
高校在算法上一直處于行業(yè)前沿,但他們落地有非常大的難度,尤其很多高校在仿真環(huán)境中做得非常棒,但一落到實物上都一塌糊涂。因此它需要和企業(yè)聯合起來去解決Sim2Real,甚至技術到工程落地的gap問題。
另外,關于企業(yè)和高校他們之間利益的問題:很多高校需要發(fā)表paper,我們可以協助他們來做。企業(yè)需要有些知識產權還有商業(yè)上的成功,兩方面可以互利互惠。
最后一點是關于教育體系:我發(fā)現很多課程的內容還是比較傳統(tǒng)、比較老的知識,對企業(yè)現在所需要的先進算法還有差距。因此希望高校可以隨時更新課程,這樣能保證企業(yè)和高校時刻處于行業(yè)前沿。
短期趨勢預測??
張建偉:在倫理約束下,你們現在的best seller是什么,你們對未來1-5或者2B、2C的預測是什么?
甘中學:我們除了要研究通用人工智能的智能水平,同時還應該研究機器人智能向善的問題。這個問題不解決,時間長了就會造成禍害。
至于預測,中國現在這么大的人群群體來做人形機器人,我們產業(yè)化的速度肯定比任何其他國家都高。
比如說現在第一年像宇樹科技等等已經開始進行量產,當然范圍可能是在科研領域,或者展覽館。但是逐漸三年會到服務行業(yè),五年可能到工業(yè),我認為完全有可能。
任雷:我不做時間預測,先談一下可能落地的先后順序——人形機器人如果落地,很可能會是在產線的某些特殊崗位,或者特種機器人,比如巡檢、維修這塊。因為其場景相對簡單,是一種結構化場景,識別起來相對簡單。
我反倒覺得家庭家務、養(yǎng)老護理有可能是最后落地的。因為家里環(huán)境看著可能簡單,實際上是高度非結構化場景,而且還在動態(tài)變化。
另外,這其中還包括了倫理問題:先不談復雜倫理,單說之前提到的人機物理接觸安全性問題,比如機器人要是摔倒的話,有可能把孩子砸著,這種情況如果一旦發(fā)生,這個由誰負責?
(圖片來源:宇樹科技創(chuàng)始人王興興演講素材)
許多:人形可能還需要很長很長時間,我認為這要看接觸精度。它包含移動精度、定位精度、抓取精度、放置精度、語義精度、反饋精度等等一系列精度,要看綜合場景對所有精度的需要。
在工業(yè)簡單場景包括物流場景里,人形機器人可能會優(yōu)先落地,其他的可能還是要花很長時間。因為它和環(huán)境的連續(xù)性接觸精度問題怎么解決,這還是一個科學問題,需要很長時間研究。
冷曉琨:對于人形機器人,樂聚這邊基本原則是三步走,沿途下蛋。今年一百多臺主要核心還是定位在高校、科研和展廳行業(yè)。
同時,這半年時間中,我們一家不落地走訪了國內所有車廠,并且選擇兩家簽了協議開始落地。它來解決的就是工業(yè)生產的最后一公里,非高精度的場景。并且雙方聯合高校已經開始做了,預計明年上半年已經可以算得過來ROI,進入投產了。
如果一個場景中人形機器人包括輪臂機器人,合起來能過500臺產量的話,基本上代表人形機器人可以用到工業(yè)場景中來了,我認為這就是明年我們使勁的地方。
未來三年核心肯定還是工業(yè)為主,進入家庭、進入康養(yǎng)這部分,現在和海爾、中國移動都在合作,但是我認為還需要3-5年甚至更久的時間段。
李博陽:最先落地的可能是一些工業(yè)場景和特種場景,但我認為最先落地的不一定是完全形態(tài)的人形機器人,可能是另外一種形態(tài),比如剛才說到的輪式或者手部不是完全五指的狀態(tài),這種場景我覺得在短期內就可以有很多落地的應用了。而且我覺得這個賬也能算得過來,它真的是可以提高效率或者完成一些實際工作的。
未來真正能夠迎來機器人大爆發(fā)的階段應該是2C端的應用,特別是服務場景或者是生活娛樂場景。
趙同陽:以目前的技術,3到5年內人形不可能大規(guī)模地進入工廠和進入家庭,這點應該在座各位都有相同感受。
接下來關于工業(yè)和家庭使用,路很長,先進去再改善,才能進行用戶反饋,進行下一步的改進,我認為還需要3年的時間。
張建偉:今天的這場對話,是ChatGPT絕對做不出來的。我一直說人形機器人對人類來講是「最后一個夢」——把我們自己復制出來,然后理解我們的認知、行為、交互。
另一方面,它也有巨大的應用場景,目標設的非常高,只有協同合作、長期支持才能把這個賽道可持續(xù)的做下去,風景無限。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.