出å“|虎嗅科技組
作者|宋æ€æ
編輯|苗æ£å¿
é 圖|電影《模仿游戲》
回國兩個月åŽï¼Œç¾…åŠåµåŠ 入智元。這是他探索國內具身智能的一個起點。
從機器人ä¸å†ç¨±ä¹‹ç‚ºâ€œæ©Ÿå™¨äººâ€ï¼Œè€Œæ˜¯è¢«å«åšâ€œå…·èº«æ™ºèƒ½â€é–‹å§‹ï¼Œé€™å€‹è³½é“也é€æ¼¸å¹´è¼•åŒ–。王興興ã€å½å¿—è¼ã€çŽ‹é¶´ã€æ¥Šè±ç‘œï¼Œå¦‚今國內的具身智能圈已經是90åŽã€ç”šè‡³00åŽçš„ä¸»å ´ã€‚ä¼¼ä¹Žæ›´åæ›å§“åŽï¼Œäººä¹Ÿè®Šå¹´è¼•äº†ã€‚和上述創æ¥è€…一樣,從伯克利回來的羅åŠåµä¹Ÿæ˜¯ä¸€ä½90åŽã€‚但ä¸åŒçš„是,他的野心ä¸åœ¨äºŽæ‹¿èžè³‡ã€å‰µæ¥ã€æ‰¾éŒ¢ã€‚ä¹Ÿè¨±æ˜¯æ€§æ ¼ä½¿ç„¶ï¼Œç¾…åŠåµå›žåœ‹åŽä¾ç„¶å …æŒäº†ä»–éŽå¾€çš„ç§‘ç ”è·¯ç·šã€‚
2015年,是羅åŠåµåœ¨æ©Ÿå™¨äººé ˜åŸŸç ”究更早的起點。在åŽçºŒçš„å年時間里,他有8年都在åšå¸è¡“ç ”ç©¶ï¼Œå…ˆåŽå°±è®€äºŽä¼¯å…‹åˆ©çš„åšå£«å’Œåšå£«åŽå¸ä½ã€‚而在é‡è¿”伯克利就讀åšå£«åŽä¹‹å‰ï¼Œä»–還有兩年的時間是在谷æŒåº¦éŽï¼Œåˆ†åˆ¥æ“”ä»»Google Xå’ŒGoogle DeepMindç ”ç©¶ç§‘å¸å®¶ã€‚在æ¤æœŸé–“ï¼Œä»–é‚„é ˜å°Žé–‹ç™¼äº†å…¨çƒé¦–個超人類的機器人真機強化å¸ç¿’系統。
ç›¡ç®¡åœ¨å…·èº«æ™ºèƒ½é ˜åŸŸï¼Œå°äºŽèµ° IL(模仿å¸ç¿’)路線還是 RL(強化å¸ç¿’)路線,分æ§å§‹çµ‚å˜åœ¨ï¼Œä½†ç¾…åŠåµå»æ˜¯ä¸€åå …å®šçš„ RL æ“è·è€…。他的主張是,除éžæ¨¡ä»¿å¸ç¿’準確率能é”到100%,å¦å‰‡åœ¨ç¾å¯¦ä¸–界的ä¸ç¢ºå®šæ€§æ˜¯æ¥µå¤§çš„。而實際情æ³æ˜¯æº–確率é”到99.9%都是幾乎ä¸å¯èƒ½çš„。
回到國內,羅åŠåµåœ¨åšç§‘ç ”èˆ‡å›žæ¸ç”¢æ¥ç•Œä¹‹é–“,é¸æ“‡äº†ä¸€æ¢æŠ˜ä¸çš„è·¯ç·šã€‚ä»–æ±ºå®šåŠ å…¥æ™ºå…ƒæ“”ä»»é¦–å¸ç§‘å¸å®¶ï¼Œå¹¶ç‰½é çµ„å»ºäº†â€œæ™ºå…ƒå…·èº«ç ”ç©¶ä¸å¿ƒâ€ï¼Œé‚„åšäº†ç¨šè¼å›çš„åŒäº‹ã€‚
與羅åŠåµå›žåœ‹çš„åˆè¡·ç›¸å»åˆï¼Œé€™å€‹â€œæ™ºå…ƒå…·èº«ç ”究ä¸å¿ƒâ€å¹¶éžå‚³çµ±æ„ç¾©ä¸Šçš„ç ”ç©¶æ©Ÿæ§‹ï¼Œè€Œæ˜¯ä¸€å€‹é€£æŽ¥åŸºç¤Žç ”ç©¶å’Œç”¢æ¥è½åœ°ä¹‹é–“çš„æ©‹æ¢ã€‚在羅åŠåµçš„å£ä¸ï¼Œâ€å®ƒå¹¶ä¸æ˜¯ç‚ºäº†ç™¼ paper 而å˜åœ¨çš„,這個事情ä¸éœ€è¦æˆ‘在智元åšï¼Œå…·èº«ç ”究ä¸å¿ƒå˜åœ¨çš„æ„義是用å•é¡ŒæŽ¨å‹•ç§‘ç ”ï¼Œå®ƒçš„å°Žå‘是去解決實際å•é¡Œï¼Œæœ€é‡è¦çš„æ˜¯ï¼Œåœ¨é€™å€‹ç ”ç©¶ä¸å¿ƒé‡Œï¼ŒåŸºç¤Žç ”究和產æ¥è½åœ°æ²’æœ‰åš´æ ¼çš„ç•Œé™â€ã€‚
而羅åŠåµå£ä¸çš„ç•Œé™ä¹Ÿæ£æ˜¯ä¸ç¾Žåœ¨å…·èº«æ™ºèƒ½é ˜åŸŸæœ€å¤§çš„å€åˆ¥æ‰€åœ¨ã€‚åŒæ™‚,它也是朱嘯虎å£ä¸å…·èº«æ™ºèƒ½å˜åœ¨æ³¡æ²«çš„æ ¹æºã€‚
我們ä¸èƒ½ç¸½æ˜¯åœ¨ä¸€å€‹å€‹æ¦œå–®å’Œè¦–é »çš„ demo 里看到具身智能的進æ¥ï¼Œå…·èº«æ™ºèƒ½åªæœ‰æ‡‰ç”¨åˆ°å…·é«”的產æ¥ä¸ï¼Œè½‰ç‚ºå¯¦éš›ç”Ÿç”¢åŠ›ï¼Œæ‰èƒ½è®“人感å—到它的進æ¥ã€‚沉浸在å¸è¡“界多年的羅åŠåµï¼Œä¹Ÿå¹¶ä¸æŽ’斥朱嘯虎的觀念。從æŸç¨®ç¨‹åº¦ä¸Šï¼Œæœ±å˜¯è™Žä»£è¡¨è‘—ç¾å¯¦ä¸»ç¾©ï¼Œä½†é€™ç¨®ç¾å¯¦ä¸»ç¾©ä¹Ÿæ°æ˜¯ç± ç½©åœ¨å…·èº«æ™ºèƒ½é€™ç¨®åŸºç¤Žç ”ç©¶èˆ‡ç”¢æ¥è½åœ°è„«ç¯€çš„ç¾å¯¦ä¹‹ä¸‹ã€‚
在與羅åŠåµå°è©±çš„éŽç¨‹ä¸ï¼Œä»–æµéœ²å‡ºäº†ä¸€ç¨®éžå¸¸ open 的態度。他說,“完全å¯ä»¥ç†è§£æœ±å˜¯è™Žä½œç‚ºæŠ•è³‡äººçš„ç«‹å ´â€ï¼Œä½†åŒæ™‚這并ä¸ä»£è¡¨æ‡‰è©²æ”¾æ£„åŸºç¤Žç ”ç©¶ã€‚ç•¶ä¸‹ï¼Œå¤§çœ¾å°æœ±å˜¯è™Žçš„觀點å˜åœ¨ä¸€ç¨®èª¤è®€ï¼Œç”šè‡³è§£è®€æˆå°å…·èº«æ™ºèƒ½çš„唱衰。實際上æ°æ°ç›¸å,他å而在æ醒ä¼æ¥ï¼Œå…·èº«æ™ºèƒ½é ˜åŸŸçœŸæ£éœ€è¦è§£æ±ºçš„æ˜¯åŸºç¤Žç ”ç©¶èˆ‡ç”¢æ¥è½åœ°ä¹‹é–“çš„ gap å•é¡Œã€‚
但這種 gap 在美國的具身智能圈è¦æ›´åŠ åš´é‡ã€‚“和國內ä¸åŒï¼Œç¾Žåœ‹çš„æ°›åœå¤ªéŽäºŽåé‡åŸºç¤Žç ”究,å¯èƒ½ä»–們ä¸å·å§â€ï¼Œç¾…åŠåµå°è™Žå—…說é“。但這åŒæ™‚也是國內具身智能的é…力所在,“國內有很多åšç¡¬ä»¶çš„å…¬å¸ï¼Œè€Œä¸”商æ¥åŒ–也會更快一æ¥ï¼Œé€™å¾ˆæœ‰åˆ©äºŽå¡«è£œåŸºç¤Žç ”究與產æ¥è½åœ°ä¹‹é–“çš„ gap。†羅åŠåµå‘Šè¨´è™Žå—…。
實際上,國內的具身智能圈,一直都縈繞著兩種氛åœï¼Œä¸€ç¨®æ˜¯èšé›†äº†UC伯克利和斯å¦ç¦ç‰äººæ‰çš„å¸è¡“派,一種是èšé›†äº†è¯ç‚ºã€å°ç±³ç‰äººæ‰çš„å¤§å» æ´¾ã€‚ä½†åœ¨ç¾…åŠåµèº«ä¸Šï¼Œå»æ—¢çœ‹å¾—到屬于å¸è¡“æ´¾çš„æµªæ¼«ä¸»ç¾©é¢¨æ ¼ï¼Œä¹Ÿæœ‰ä¾†è‡ªå¤§å» æ´¾çš„å‹™å¯¦é¢¨æ ¼ã€‚é€™æ¬¡å›žåœ‹ï¼Œç¾…åŠåµæ›´å¤šæ˜¯å¸¶è‘—å•é¡Œå›žä¾†çš„。
åœ¨å…·èº«æ™ºèƒ½é ˜åŸŸï¼Œç›®å‰æœ€å¤§çš„難題還是在 manipulation(æ“控)身上,通俗來講就是準確應å°å¤–部世界的無é™æ€§ã€ä¸ç¢ºå®šæ€§ã€‚這也是目å‰å„界都在攻克的é‡é»žã€‚
而在智元,羅åŠåµæƒ³ç”¨ä¸€ç¨®â€œä»¥å•é¡Œé©…å‹•ç§‘ç ”â€çš„æ–¹å¼ç¹¼çºŒå®Œæˆä»–çš„ç§‘ç ”å·¥ä½œï¼ŒåŒæ™‚é€™é‡Œä¹Ÿæ˜¯ä»–å¾žç§‘ç ”å›žæ¸åˆ°ç”¢æ¥ç•Œçš„開始。
以下為虎嗅與智元首å¸ç§‘å¸å®¶ç¾…åŠåµå°è©±å¯¦éŒ„,有刪改:
è™Žå—…ï¼šä½ åœ¨ä¼¯å…‹åˆ©æœŸé–“ï¼Œå°åœ‹å…§å…·èº«æ™ºèƒ½å…¬å¸æœ‰éŽæŽ¥è§¸å—Žï¼Ÿç•¶æ™‚ä½ æ€Žä¹ˆçœ‹åœ‹å…§é€™äº›å…¬å¸çš„?
ç¾…åŠåµ: 2016ã€17年的時候,那時產æ¥åŒ–處于比較早期階段,更多是硬件導å‘或者是åæœå‹™é¡žçš„機器人,真æ£é—œæ³¨å…·èº«æ™ºèƒ½å’Œé€šç”¨æ©Ÿå™¨äººçš„還并ä¸å¤šã€‚當時還沒有這個概念,普é都å«æ©Ÿå™¨äººã€‚
國外也åªæ˜¯æœ‰å¹¾å®¶æ©Ÿæ§‹åœ¨åšï¼ŒåŒ…括Google在內。當時大家å°äºŽæŠŠ learning 移到機器人上這件事一直是æŒæ‡·ç–‘態度的。那個時候國內å傳統一些,AIåšå¾—少。但這一兩年,國內至少從è²å‹¢ä¸Šçœ‹æ¯”美國è¦å¤§å¾—多。
è™Žå—…ï¼šæ˜¯å› ç‚ºå•†æ¥åŒ–çš„åŽŸå› å—Žï¼Ÿ
ç¾…åŠåµ: 國內å¯èƒ½æœƒæ¯”較關注這個詞。相比之下,國內更易ç²å¾—å ´æ™¯å’Œæ•¸æ“šï¼Œä½¿ç”¨æ•ˆçŽ‡ä¹Ÿæœƒç›¸å°è¼ƒé«˜ã€‚ä½†ç¾Žåœ‹æœƒæ›´å …æŒæŠ€è¡“的長期探索。
虎嗅:回國之åŽï¼Œç‚ºä»€ä¹ˆæ²’有é¸æ“‡è‡ªå·±å‰µæ¥ï¼Œè€Œæ˜¯åŠ 入到一家具身智能公å¸åšé¦–å¸ç§‘å¸å®¶ï¼Ÿ
ç¾…åŠåµ: 在產æ¥ç•Œåšç§‘ç ”éœ€è¦ä¸€å¥—è½åœ°çš„系統,這涉åŠåˆ°è·¨å¸ç§‘跨層級的系統性å”作。目å‰é€™å€‹éšŽæ®µï¼Œæˆ‘希望專注在我擅長的事情上,而ä¸æ˜¯ä¸€é–‹å§‹å°±é™·å…¥åœ˜éšŠå»ºè¨ã€èžè³‡ã€å·¥ç¨‹åŒ–這些事情上。
è™Žå—…ï¼šä½ èªªè·¨å¸ç§‘å”作。但國外跨å¸ç§‘會ä¸æœƒèµ°å¾—æ›´å¾€å‰ä¸€äº›ï¼Ÿ
ç¾…åŠåµ: 我倒覺得ä¸åœ‹å¤©ç”Ÿçš„åœŸå£¤æˆ–åŸºå› æœƒæ¯”è¼ƒå¥½ä¸€é»žï¼Œæ¯”å¦‚ç¾Žåœ‹ï¼Œç¬¬ä¸€ä»–æ²’ç¡¬ä»¶ï¼Œç¬¬äºŒç¾Žåœ‹AI 人æ‰å¯†åº¦éžå¸¸é«˜ï¼Œæ‰€ä»¥å¤§å®¶æœƒæ›´å¤šåŸºç¤Žåœ¨AIç ”ç©¶ä¸Šã€‚ä½†ç›¸æ¯”ä¹‹ä¸‹ï¼Œåœ¨åœ‹å…§æ°å¥½ç›¸å,國內更容易找到機器人所需è¦ç¡¬ä»¶æœ¬é«”ã€ç®—法ç‰ç‰ã€‚
虎嗅: 那智元最å¸å¼•ä½ 的點在哪?
ç¾…åŠåµ: 它是全棧的公å¸ï¼Œä¹Ÿå°±æ˜¯èªªç¡¬ä»¶ã€è»Ÿä»¶ã€ç®—法都是閉環的。這和我的ç†å¿µéžå¸¸ç›¸ç¬¦ã€‚
è™Žå—…ï¼šä½ çš„ç†å¿µæ˜¯ä»€ä¹ˆï¼Ÿ
ç¾…åŠåµ: 我覺得ç¾åœ¨å¾ˆå¤šæ©Ÿå™¨äººçš„å•é¡Œæ˜¯ï¼Œç¾åœ¨åœ¨ç¡¬ä»¶ã€è»Ÿä»¶ã€ç®—法上é¢å·¥ç¨‹å’Œç§‘ç ”æ²’æœ‰ä¸€èµ·è¿ä»£ã€‚ä½ ä¸èƒ½æŠŠå®ƒç•¶åšå…¶ä»–çš„ AI æ–¹å‘ï¼Œå°±æ˜¯ä½ æœ‰ä¸€å€‹ benchmark,有一個 datasetï¼Œä½ åœ¨ä¸Šé¢åˆ·åˆ·é»žï¼Œæ‰¾ä¸€å€‹å ´æ™¯ã€‚æˆ‘æ¯”ä½ å¥½10%就好了。這樣沒有åæ˜ å¯¦éš›çš„é€²å±•ï¼Œä¹Ÿä¸å®¢è§€å…¬å¹³ã€‚
è™Žå—…ï¼šä½ åœ¨æ™ºå…ƒç‰½é çµ„å»ºçš„â€œæ™ºå…ƒå…·èº«ç ”ç©¶ä¸å¿ƒâ€ï¼Œé€™å€‹ç ”究ä¸å¿ƒæ˜¯æ€Žæ¨£çš„å˜åœ¨ï¼Ÿæ¯”如它的組織架構和ç¨ç«‹æ€§ã€‚
ç¾…åŠåµï¼šç›®å‰é‚„在æŒçºŒæ‹›è˜ã€‚å®ƒæ˜¯ä¸€å€‹é€£æŽ¥åŸºç¤Žç ”ç©¶ï¼Œåˆ°çœŸæ£å¯ä»¥è¢«éƒ¨ç½²åˆ°çœŸå¯¦ç³»çµ±çš„ä¸è‡ºã€‚ä»–ä¸æœƒåªç™¼è«–文,這å¯èƒ½åªæ˜¯ç›®æ¨™ä¹‹ä¸€ï¼›ä½†æ›´é‡è¦æ˜¯æŽ¨å‹•å…·èº«ç³»çµ±èƒ½åŠ›çš„演進,以åŠéƒ¨ç½²åˆ°çœŸå¯¦ä¸–ç•Œä¸ã€‚它是內嵌å¼çš„ç§‘ç ”ä¸è‡ºï¼Œå…·æœ‰ç›¸å°çš„ç¨ç«‹æ€§ï¼Œå¯ä»¥æŽ¢ç´¢æ–°çš„ç§‘ç ”èŒƒå¼ï¼ŒåŒæ™‚也會和我們產å“工程這類部門是ä¿æŒå¼·è¯å‹•ï¼Œé¿å…脫節。
è™Žå—…ï¼šé‚£åœ¨é€™å€‹ç ”ç©¶ä¸å¿ƒé‡Œï¼Œå®ƒçš„åŸºç¤Žç ”ç©¶å’Œè½åœ°æ–¹é¢æœƒæœ‰ä¸€å€‹æ¯”例嗎?
ç¾…åŠåµï¼šé€™æ˜¯å€‹å¥½å•é¡Œã€‚æˆ‘è¦ºå¾—æ©Ÿå™¨äººé ˜åŸŸæœ‰ä¸€å€‹æŒºå¤§çš„å•é¡Œï¼Œå°±æ˜¯åœ¨åˆ¥çš„é ˜åŸŸæ¯”èªªå¤§èªžè¨€æ¨¡åž‹ï¼Œæœ€æ–°çš„ç ”ç©¶æˆæžœæ˜¯å¹¾ä¹Žå¯ä»¥é¦¬ä¸Šè½‰åŒ–到商用上,大家å¯ä»¥çœ‹å¾—見摸得著,å¯ä»¥ç”¨èµ·ä¾†ã€‚ä½†æ©Ÿå™¨äººç ”ç©¶å»å¾ˆå¤šåœç•™åœ¨äº†ç´™ä¸Šï¼Œæ‹å€‹è¦–é »ç™¼åˆ°ç¶²ä¸Šèªªè‡ªå·±æ¯”åˆ¥äººå¥½10%,然åŽå°±æ²’有åŽçºŒäº†ï¼Œä¹Ÿæ²’æœ‰äººè² è²¬è½åœ°ã€‚
æ‰€ä»¥ä½ èªªçš„é€™å€‹æ¯”ä¾‹å•é¡Œï¼Œåœ¨æˆ‘å€‘çš„ç ”ç©¶ä¸å¿ƒé‡Œæˆ‘ä¸æœƒè¨ä¸€å€‹å°±éžå¸¸boundaryçš„ç•Œé™ï¼Œæˆ‘ä¸æœƒæŠŠåŸºç¤Žç ”究和è½åœ°åˆ†é–‹ä¾†ã€‚我覺得機器人作為系統性的å¸ç§‘,它是å¯ä»¥è¢«æœ€åŽ push 到真æ£æ‡‰ç”¨ä¸Šçš„,而ä¸æ˜¯ç•™åœ¨ demo 和論文,然åŽèª°ä¹Ÿä¸ç®¡çš„狀態,所以整體會是比較æµå‹•çš„狀態。
è™Žå—…ï¼šåœ¨åœ‹å¤–çš„è©±ï¼ŒåŸºç¤Žç ”ç©¶å’Œç”¢æ¥è½åœ°çš„這個界é™æœƒæœ‰å¤šé‡ï¼Ÿ
ç¾…åŠåµï¼šæˆ‘è¦ºåœ¨æ©Ÿå™¨äººé ˜åŸŸï¼Œåœ‹å¤–æ¯”è¼ƒå°·å°¬çš„ä¸€é»žæ˜¯ï¼Œä»–å€‘å¦‚æžœæƒ³è½åœ°æ¯”è¼ƒé›£æ‰¾å ´æ™¯ã€‚å—åˆ¶äºŽä¸€äº›å®¢è§€å› ç´ ï¼Œä»–å€‘çš„åˆ¶é€ æ¥å’Œæœå‹™æ¥ç›¸å°è¼ƒå°‘。這并ä¸æ˜¯ä»–們ä¸æƒ³åšã€‚還有一點是美國環境會包容一點,整個機制會更鼓勵大家去åšæ¯”較長期的探索,而且資本éžå¸¸å……裕,他們å°å¤±æ•—的容å¿çŽ‡ä¹Ÿæ¯”è¼ƒé«˜ï¼Œé€™ä¹Ÿå°Žè‡´äº†åœ¨å…·èº«æ™ºèƒ½é ˜åŸŸå¾ˆå¤šå•é¡Œæ²’有è½åœ°ã€‚
虎嗅: 所以,“用å•é¡Œé©…å‹•ç§‘ç ”â€é€™ä¹Ÿæ˜¯ä½ 回到國內è¦åšçš„主è¦äº‹æƒ…嗎?
ç¾…åŠåµ: å°ï¼Œæˆ‘è¦ºå¾—å¥½çš„æŠ€è¡“ç ”ç©¶èƒ½è½‰åŒ–ç‚ºç”Ÿç”¢åŠ›ä¹Ÿæ˜¯ä¸€ä»¶éžå¸¸æ¿€å‹•äººå¿ƒçš„事情。
虎嗅:DeepSeek這波熱潮之åŽï¼Œåœ‹å…§å¤–å°RL接å—度會更高嗎?
ç¾…åŠåµï¼šå°ï¼Œ DeepSeek 或 GPT-O1會讓大家看到 RL çš„æ½›åŠ›ã€‚ä¹‹å‰ RL ç«èµ·ä¾†é‚„是在2016å¹´AlphaGo é‚£æ³¢ï¼Œä½†å› ç‚ºåŽä¾†æ²’找到應用,åˆæ²‰å¯‚了一會。然åŽ2023年大家看到大語言模型的時候åˆå¥½äº†ï¼Œå†åˆ°ç¾åœ¨å¤§å®¶ä»¿ä½›åˆçœ‹åˆ°äº† RL 的潛力。今年圖éˆçŽä¹Ÿé ’給了 RL é ˜åŸŸçš„å…©ä½å®—師。
æˆ‘å° RL 的看法是這樣,它是一個æ¸ç´æ³•å’Œæ¼”繹法的å€åˆ¥ã€‚æ¸ç´æ³•æ˜¯ä½ ç¾åœ¨çœ‹åˆ°çš„ç¾è±¡ï¼Œä»–ç¾åœ¨æ˜¯ä»€ä¹ˆï¼Œä»¥åŽä¹Ÿå°±æœƒæ˜¯ä»€ä¹ˆã€‚ä½†æ¼”ç¹¹æ˜¯ï¼Œä½ æ ¹æ“šå®ƒåº•å±¤çš„é‚輯去推ç†ã€‚å› ç‚ºå¦‚æžœåªæ˜¯ supervise learning (監ç£å¸ç¿’)的話,沒有辦法åšå„ªåŒ–,也沒有辦法åšå¤šæ¥çš„推ç†ã€‚但RL 在原則上是一個比supervise learningæ›´åˆç†çš„framework(框架)。如果它出å•é¡Œäº†ï¼Œä¹Ÿä¸ä¸€å®šæ˜¯å®ƒæœ¬èº«çš„å•é¡Œï¼Œå³ä½¿çœŸæœ‰çš„話,我們應該讓它變得更好,而ä¸æ˜¯çœ‹åˆ°å•é¡Œå°±èªç‚ºå®ƒä¸è¡Œäº†ã€‚
虎嗅:ç¾åœ¨åœ¨å…·èº«æ™ºèƒ½é ˜åŸŸï¼Œå …æŒ RL 的會很多嗎?
ç¾…åŠåµ: 我覺得ç¾åœ¨åšlocomotion,也就是åšç§»å‹•çš„肯定用的比較多了。但manipulation (æ“控)的話,這個涉åŠåˆ°çœŸå¯¦ä¸–界,大家還在探索階段å§ï¼Œ
虎嗅:為什么會這么說?這個locomotionå’Œmanipulation具體體ç¾åœ¨ä»€ä¹ˆåœ°æ–¹ï¼Ÿ
ç¾…åŠåµ: å› ç‚º locomotion æ›´å¤šé—œæ³¨çš„æ˜¯ä½ è‡ªå·±çš„è¡Œç‚ºã€‚æ¯”å¦‚ç‹—å¾€å‰èµ°ï¼Œæ©Ÿå™¨äºº å¾€å‰èµ°ï¼Œä½ åªè¦æŽ§åˆ¶å¥½è‡ªå·±æ¨¡åž‹çš„準確性就å¯ä»¥äº†ã€‚但manipulation 更多關于外部世界,除éžä½ çš„ä»¿çœŸå™¨èƒ½å¤ æ¨¡ä»¿æ•´å€‹ä¸–ç•Œï¼Œä½†é€™æ˜¯å€‹å¾ˆé›£çš„äº‹æƒ…ã€‚
在éŽåŽ»äºŒä¸‰å年的機器å¸ç¿’的經驗和教訓ä¸å‘Šè¨´æˆ‘們,在一個AI系統里,如果有一個部分ä¸éš¨è‘—數據的scale(增多)從而性能scale(æå‡ï¼‰ï¼Œé‚£ä¹ˆé€™éƒ¨åˆ†æœ€åŽå°±æœƒè®Šæˆé€™å€‹ç³»çµ±çš„ç“¶é ¸ã€‚ä»¿çœŸå™¨æ˜¯æˆ‘å€‘ç”¨æ‰‹è¨è¨ˆçš„,ä¸éš¨è‘—整個系統的æå‡è€Œæå‡ï¼Œæœ€åŽæˆ‘們å¸å‡ºä¾†çš„ç–略就ä¸æœƒè¶…éŽä»¿çœŸå™¨çš„本身。
虎嗅:所以在manipulationé‚„å˜åœ¨å¾ˆå¤§å•é¡Œçš„情æ³ä¸‹ï¼Œä½ 覺得具身智能接下來的發展方å‘應該是什么?
ç¾…åŠåµ: 我覺得接下來幾年,我們ä¸è¦èªªåšå…¨èƒ½æ©Ÿå™¨äººï¼Œè€Œæ˜¯åšæœ‰ç”¨çš„機器人,解決一個任務å¯èƒ½å¤ªspecialize (專用)了,但至少å¯ä»¥è§£æ±º4ã€5å€‹å ´æ™¯é‡Œé¢çš„任務。我也ä¸é—œæ³¨ä»–到底是ä¸æ˜¯äººå½¢ã€‚
本文來自虎嗅,原文éˆæŽ¥ï¼šhttps://www.huxiu.com/article/4197063.html?f=wyxwapp
特別è²æ˜Žï¼šä»¥ä¸Šå…§å®¹(å¦‚æœ‰åœ–ç‰‡æˆ–è¦–é »äº¦åŒ…æ‹¬åœ¨å…§)為自媒體平臺“網易號â€ç”¨æˆ¶ä¸Šå‚³å¹¶ç™¼å¸ƒï¼Œæœ¬å¹³è‡ºåƒ…æ供信æ¯å˜å„²æœå‹™ã€‚
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.