網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

人形機(jī)器人：像人還是像機(jī)器？ | 動(dòng)察

2025-03-10 19:30:35　來源: 動(dòng)點(diǎn)科技

上海舉報(bào)

分享至

機(jī)器人比人更聰明、更高效？

文｜動(dòng)點(diǎn)科技

作者｜icebin

排版｜Miziko

本文預(yù)計(jì)閱讀時(shí)長(zhǎng)9分鐘

具身機(jī)器人的發(fā)展，技術(shù)上來說已經(jīng)進(jìn)入到百家爭(zhēng)鳴的新階段，各個(gè)廠商都在試圖用更好的技術(shù)來驅(qū)動(dòng)機(jī)器人。而如何讓機(jī)器人看起來更聰明，處理事情更加有效率，是要解決的一個(gè)難點(diǎn)。我們通過追蹤不同機(jī)器人廠商的技術(shù)前沿，可以感知具身機(jī)器人進(jìn)化的脈搏。這次我們來認(rèn)識(shí)下Figure AI 的Helix 人工智能模型，以及采用這個(gè)新技術(shù)的具身機(jī)器人Figure 02，未來有望提升人類生產(chǎn)力。

老齡化沖擊下，人類社會(huì)需要機(jī)器人來提高生產(chǎn)力

談起，F(xiàn)igure AI，就不能不提起創(chuàng)始人兼首席執(zhí)行官Brett Adcock。他是一個(gè)連續(xù)創(chuàng)業(yè)者，他認(rèn)為，人類正面臨前所未有的勞動(dòng)力短缺。僅在美國(guó)就有超過 1000 萬個(gè)不安全或不受歡迎的工作崗位，人口老齡化只會(huì)讓企業(yè)擴(kuò)大勞動(dòng)力規(guī)模變得越來越困難。而在這個(gè)時(shí)期，多個(gè)國(guó)家和地區(qū)出現(xiàn)了人口老齡化，包括中國(guó)。

因此，本世紀(jì)勞動(dòng)力供應(yīng)增長(zhǎng)將逐步停止。如果人類社會(huì)想要繼續(xù)增長(zhǎng)，就需要提高生產(chǎn)力——這意味著更多的自動(dòng)化。

Figure 的目標(biāo)是：開發(fā)通用人形機(jī)器人，為人類帶來積極影響，為子孫后代創(chuàng)造更美好的生活。這些機(jī)器人可以滿足對(duì)不安全和不受歡迎的工作的需求，從事危險(xiǎn)和重復(fù)性的體力勞動(dòng)——最終讓我們過上更快樂、更有意義的生活。

值得慶幸的是，我們正處于人工智能和機(jī)器人革命的早期階段。這為大幅提高我們的生產(chǎn)和生活水平提供了獨(dú)特的機(jī)會(huì)。

隨著自動(dòng)化繼續(xù)大規(guī)模融入人類生活，我們可以預(yù)測(cè)，我們所熟知的以勞動(dòng)力為基礎(chǔ)的經(jīng)濟(jì)將發(fā)生轉(zhuǎn)變。能夠思考、學(xué)習(xí)、推理并與環(huán)境互動(dòng)的機(jī)器人最終將能夠比人類更好地完成任務(wù)。

Figure AI 在具身機(jī)器人的硬件及成本上精打細(xì)算

那么要如何構(gòu)建功能齊全的具身機(jī)器人，執(zhí)行類似人類的操作，并將人形機(jī)器人融入勞動(dòng)力之中。這是一個(gè)三步走的路徑，只有把這三個(gè)路徑完成，才能形成生產(chǎn)力。

而在具身機(jī)器人的硬件方面，F(xiàn)igure AI 團(tuán)隊(duì)已經(jīng)推出了 2款全電動(dòng)機(jī)械人形機(jī)器人，具備雙手，而最新的產(chǎn)品是Figure 02。與Figure 01不同，新品外觀看過去更擬人，五個(gè)手指更加靈巧多變。據(jù)介紹，迭代后的Figure手部具有16個(gè)自由度，能夠承受與人類相當(dāng)?shù)牧α俊igure 02配備了6個(gè)RGB攝像頭，用于感知物理世界，同時(shí)還有麥克風(fēng)和揚(yáng)聲器用來和人類進(jìn)行互動(dòng)。

Figure AI目標(biāo)是開發(fā)具有人類身體能力的硬件。正在根據(jù)運(yùn)動(dòng)范圍、有效載荷、扭矩、運(yùn)輸成本和速度來衡量這一點(diǎn)，并將通過快速的開發(fā)周期不斷改進(jìn)。同時(shí)，通過高產(chǎn)量生產(chǎn)降低單個(gè)機(jī)器人的單位成本，努力實(shí)現(xiàn)可持續(xù)的規(guī)模經(jīng)濟(jì)。

Figure AI 在人工智能以及機(jī)器人神經(jīng)網(wǎng)絡(luò)上取得突破

機(jī)器人要實(shí)現(xiàn)人類的一些動(dòng)作，如果只是模仿，那不足以形成自主行為能力，這時(shí)候引入 AI 人工智能是很好的解決方案。Figure AI 的第一代產(chǎn)品，F(xiàn)igure 01學(xué)會(huì)了搬箱子，能夠完成簡(jiǎn)單的體力任務(wù)。隨后，通過觀看人類示范視頻就學(xué)會(huì)了沖咖啡，還會(huì)自己糾正錯(cuò)誤。緊接著，F(xiàn)igure宣布同OpenAI簽署合作協(xié)議，為其人形機(jī)器人開發(fā)生成式AI，但這只是第一個(gè)階段。

最大的突破來自于Figure AI 自身，他們斷開和OpenAI 的合作，推出了 Helix，這是一種通用的“視覺-語言-動(dòng)作” (VLA) 模型，它將感知、語言理解和學(xué)習(xí)控制統(tǒng)一起來，以克服機(jī)器人技術(shù)領(lǐng)域的多項(xiàng)長(zhǎng)期挑戰(zhàn)。

Helix 是個(gè)極大的突破，是第一款對(duì)整個(gè)人形上身（包括手腕、軀干、頭部和各個(gè)手指）進(jìn)行高速率連續(xù)控制的 VLA 模型。這就意味著可以實(shí)現(xiàn)多個(gè)機(jī)器人之間的協(xié)作，共同完成一項(xiàng)需要連續(xù)操作的任務(wù)。

另外，它有了一些自主學(xué)習(xí)決策的能力，配備了 Helix 的 Figure 02機(jī)器人現(xiàn)在只需按照自然語言提示，就能拿起幾乎任何小型家居物品，包括數(shù)千種它們從未遇到過的物品。

這就需要賦予機(jī)器人思考的靈魂，Helix 使用一組神經(jīng)網(wǎng)絡(luò)權(quán)重來學(xué)習(xí)所有行為（挑選和放置物品、使用抽屜和冰箱以及跨機(jī)器人交互），而無需任何針對(duì)特定任務(wù)的微調(diào)。并且是第一款完全在嵌入式低功耗 GPU 上運(yùn)行的 VLA 模型，可立即進(jìn)行商業(yè)部署，在未來的成本上也有一定優(yōu)勢(shì)。

Figure AI 的機(jī)器人已經(jīng)可以執(zhí)行包裹分類和處理任務(wù)

將人形機(jī)器人引入勞動(dòng)力隊(duì)伍是 Figure 使命的核心。而最新的Figure AI 的機(jī)器人已經(jīng)可以進(jìn)行物流包裹處理和分類。這項(xiàng)任務(wù)需要人類級(jí)別的速度、精度和適應(yīng)性，突破了從像素到動(dòng)作的學(xué)習(xí)操作的界限。

這個(gè)能力是Helix System 1 大模型迭代來的，其具有豐富的 3D 理解能力，可以實(shí)現(xiàn)更精確的深度感知運(yùn)動(dòng)。每個(gè) Figure 機(jī)器人現(xiàn)在都可以自我校準(zhǔn)，從而實(shí)現(xiàn)跨機(jī)器人無縫傳輸。使用簡(jiǎn)單的測(cè)試時(shí)間加速技術(shù)，Helix 實(shí)現(xiàn)了比演示者更快的執(zhí)行速度，同時(shí)保持了較高的成功率和靈活性。

在以往傳統(tǒng)的具身機(jī)器人模擬中，需要對(duì)物品進(jìn)行描繪和界定。而物流包裹是變化的，由于環(huán)境永遠(yuǎn)無法完全預(yù)測(cè)，因此系統(tǒng)必須能夠自我糾正。此外，它還需要跟蹤連續(xù)移動(dòng)的傳送帶上大量包裹的動(dòng)態(tài)流動(dòng)并保持高吞吐量。Helix 視覺運(yùn)動(dòng)策略現(xiàn)在將兩個(gè)攝像頭的特征合并到多尺度立體網(wǎng)絡(luò)中，然后再進(jìn)行標(biāo)記，多尺度特征使系統(tǒng)能夠解釋精細(xì)細(xì)節(jié)以及更廣泛的上下文線索，共同促進(jìn)視覺控制的可靠性。

最后，通過利用學(xué)習(xí)校準(zhǔn)和視覺本體感受模塊，F(xiàn)igure AI能夠?qū)⒆畛踉趩蝹€(gè)機(jī)器人數(shù)據(jù)上訓(xùn)練的相同策略應(yīng)用于多個(gè)其他機(jī)器人，這就是協(xié)同工作的核心能力。也就是這個(gè)能力，使得其上流水線能夠發(fā)揮更大的生成效能。

Figure AI 的官方視頻展示了如何利用高質(zhì)量的數(shù)據(jù)集，結(jié)合立體多尺度視覺、在線校準(zhǔn)和測(cè)試時(shí)間加速等架構(gòu)改進(jìn)，在現(xiàn)實(shí)世界的物流分揀場(chǎng)景中實(shí)現(xiàn)比演示者更快的靈巧機(jī)器人操作——所有這些都是在使用相對(duì)適量的演示數(shù)據(jù)的情況下實(shí)現(xiàn)的。物流分揀線的機(jī)器人視頻已經(jīng)發(fā)布，也就是說，F(xiàn)igure AI 在機(jī)器人轉(zhuǎn)化為勞動(dòng)力上已經(jīng)取得了成就。

Figure AI 不斷獲得融資，是對(duì)其技術(shù)路線的肯定

最新消息，F(xiàn)igure AI正在洽談新一輪15億美元融資，公司估值高達(dá)395億美元，比上一輪高了 15 倍左右。預(yù)計(jì)將由Align Ventures和Parkway Venture Capital領(lǐng)投。

而在這之前，2024年3月，F(xiàn)igure AI宣布完成6.75億美元，估值26億美元，投資方包括微軟、OpenAI Startup Fund、Nvidia（英偉達(dá)）、亞馬遜工業(yè)創(chuàng)新基金、在科技界響當(dāng)當(dāng)?shù)牧硪粋€(gè)人物杰夫·貝索斯（Jeff Bezos）、Parkway Venture Capital、英特爾投資、Align Ventures和ARK Invest，都是有份量的投資人。

Figure AI創(chuàng)始人兼首席執(zhí)行官Brett Adcock近期稱，F(xiàn)igure已簽約第二位（目前還處在保密階段）商業(yè)客戶，并有望出貨100,000 個(gè)人形機(jī)器人。而實(shí)際上，它的第一個(gè)客戶是寶馬公司，其具身機(jī)器人已經(jīng)在寶馬工廠測(cè)試一些簡(jiǎn)單的工作。

Figure AI 的融資如果能夠再度落實(shí)，那就意味著其技術(shù)路線受到行業(yè)肯定。不過全新的Helix 模型驅(qū)動(dòng)的機(jī)器人能力還處在早期階段，后面會(huì)進(jìn)化到什么程度，能不能批量商業(yè)化成會(huì)思考能決策自主進(jìn)化的勞動(dòng)力機(jī)器人，我們拭目以待。

本文為動(dòng)點(diǎn)科技記者原創(chuàng)文章，未經(jīng)授權(quán)不得轉(zhuǎn)載，如需轉(zhuǎn)載或開白請(qǐng)?jiān)诤笈_(tái)回復(fù)“轉(zhuǎn)載”。

- - - - - - - - END - - - - - - - -

互動(dòng)話題

你認(rèn)為人類工作會(huì)被它盯上嗎？

快來評(píng)論區(qū)留下你的觀點(diǎn)吧！
*想要獲取行業(yè)資訊、和志同道合的科技愛好者們分享心得，那就趕快掃碼添加“動(dòng)點(diǎn)君”加入群聊吧！群里更有不定期福利發(fā)放！

精彩好文值得推薦！

一鍵轉(zhuǎn)發(fā)，戳個(gè)在看！

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.