機(jī)器人比人更聰明、更高效?
文 |動(dòng)點(diǎn)科技
作者|icebin
排版|Miziko
本文預(yù)計(jì)閱讀時(shí)長(zhǎng)9分鐘
具身機(jī)器人的發(fā)展,技術(shù)上來說已經(jīng)進(jìn)入到百家爭(zhēng)鳴的新階段,各個(gè)廠商都在試圖用更好的技術(shù)來驅(qū)動(dòng)機(jī)器人。而如何讓機(jī)器人看起來更聰明,處理事情更加有效率,是要解決的一個(gè)難點(diǎn)。我們通過追蹤不同機(jī)器人廠商的技術(shù)前沿,可以感知具身機(jī)器人進(jìn)化的脈搏。這次我們來認(rèn)識(shí)下Figure AI 的Helix 人工智能模型,以及采用這個(gè)新技術(shù)的具身機(jī)器人Figure 02,未來有望提升人類生產(chǎn)力。
老齡化沖擊下,人類社會(huì)需要機(jī)器人來提高生產(chǎn)力
談起,F(xiàn)igure AI,就不能不提起創(chuàng)始人兼首席執(zhí)行官Brett Adcock。他是一個(gè)連續(xù)創(chuàng)業(yè)者,他認(rèn)為,人類正面臨前所未有的勞動(dòng)力短缺。僅在美國(guó)就有超過 1000 萬個(gè)不安全或不受歡迎的工作崗位,人口老齡化只會(huì)讓企業(yè)擴(kuò)大勞動(dòng)力規(guī)模變得越來越困難。而在這個(gè)時(shí)期,多個(gè)國(guó)家和地區(qū)出現(xiàn)了人口老齡化,包括中國(guó)。
因此,本世紀(jì)勞動(dòng)力供應(yīng)增長(zhǎng)將逐步停止。如果人類社會(huì)想要繼續(xù)增長(zhǎng),就需要提高生產(chǎn)力——這意味著更多的自動(dòng)化。
Figure 的目標(biāo)是:開發(fā)通用人形機(jī)器人,為人類帶來積極影響,為子孫后代創(chuàng)造更美好的生活。這些機(jī)器人可以滿足對(duì)不安全和不受歡迎的工作的需求,從事危險(xiǎn)和重復(fù)性的體力勞動(dòng)——最終讓我們過上更快樂、更有意義的生活。
值得慶幸的是,我們正處于人工智能和機(jī)器人革命的早期階段。這為大幅提高我們的生產(chǎn)和生活水平提供了獨(dú)特的機(jī)會(huì)。
隨著自動(dòng)化繼續(xù)大規(guī)模融入人類生活,我們可以預(yù)測(cè),我們所熟知的以勞動(dòng)力為基礎(chǔ)的經(jīng)濟(jì)將發(fā)生轉(zhuǎn)變。能夠思考、學(xué)習(xí)、推理并與環(huán)境互動(dòng)的機(jī)器人最終將能夠比人類更好地完成任務(wù)。
Figure AI 在具身機(jī)器人的硬件及成本上精打細(xì)算
那么要如何構(gòu)建功能齊全的具身機(jī)器人,執(zhí)行類似人類的操作,并將人形機(jī)器人融入勞動(dòng)力之中。這是一個(gè)三步走的路徑,只有把這三個(gè)路徑完成,才能形成生產(chǎn)力。
而在具身機(jī)器人的硬件方面,F(xiàn)igure AI 團(tuán)隊(duì)已經(jīng)推出了 2款全電動(dòng)機(jī)械人形機(jī)器人,具備雙手,而最新的產(chǎn)品是Figure 02。與Figure 01不同,新品外觀看過去更擬人,五個(gè)手指更加靈巧多變。據(jù)介紹,迭代后的Figure手部具有16個(gè)自由度,能夠承受與人類相當(dāng)?shù)牧α俊igure 02配備了6個(gè)RGB攝像頭,用于感知物理世界,同時(shí)還有麥克風(fēng)和揚(yáng)聲器用來和人類進(jìn)行互動(dòng)。
Figure AI目標(biāo)是開發(fā)具有人類身體能力的硬件。正在根據(jù)運(yùn)動(dòng)范圍、有效載荷、扭矩、運(yùn)輸成本和速度來衡量這一點(diǎn),并將通過快速的開發(fā)周期不斷改進(jìn)。同時(shí),通過高產(chǎn)量生產(chǎn)降低單個(gè)機(jī)器人的單位成本,努力實(shí)現(xiàn)可持續(xù)的規(guī)模經(jīng)濟(jì)。
Figure AI 在人工智能以及機(jī)器人神經(jīng)網(wǎng)絡(luò)上取得突破
機(jī)器人要實(shí)現(xiàn)人類的一些動(dòng)作,如果只是模仿,那不足以形成自主行為能力,這時(shí)候引入 AI 人工智能是很好的解決方案。Figure AI 的第一代產(chǎn)品,F(xiàn)igure 01學(xué)會(huì)了搬箱子,能夠完成簡(jiǎn)單的體力任務(wù)。隨后,通過觀看人類示范視頻就學(xué)會(huì)了沖咖啡,還會(huì)自己糾正錯(cuò)誤。緊接著,F(xiàn)igure宣布同OpenAI簽署合作協(xié)議,為其人形機(jī)器人開發(fā)生成式AI,但這只是第一個(gè)階段。
最大的突破來自于Figure AI 自身,他們斷開和OpenAI 的合作,推出了 Helix,這是一種通用的“視覺-語言-動(dòng)作” (VLA) 模型,它將感知、語言理解和學(xué)習(xí)控制統(tǒng)一起來,以克服機(jī)器人技術(shù)領(lǐng)域的多項(xiàng)長(zhǎng)期挑戰(zhàn)。
Helix 是個(gè)極大的突破,是第一款對(duì)整個(gè)人形上身(包括手腕、軀干、頭部和各個(gè)手指)進(jìn)行高速率連續(xù)控制的 VLA 模型。這就意味著可以實(shí)現(xiàn)多個(gè)機(jī)器人之間的協(xié)作,共同完成一項(xiàng)需要連續(xù)操作的任務(wù)。
另外,它有了一些自主學(xué)習(xí)決策的能力,配備了 Helix 的 Figure 02機(jī)器人現(xiàn)在只需按照自然語言提示,就能拿起幾乎任何小型家居物品,包括數(shù)千種它們從未遇到過的物品。
這就需要賦予機(jī)器人思考的靈魂,Helix 使用一組神經(jīng)網(wǎng)絡(luò)權(quán)重來學(xué)習(xí)所有行為(挑選和放置物品、使用抽屜和冰箱以及跨機(jī)器人交互),而無需任何針對(duì)特定任務(wù)的微調(diào)。并且是第一款完全在嵌入式低功耗 GPU 上運(yùn)行的 VLA 模型,可立即進(jìn)行商業(yè)部署,在未來的成本上也有一定優(yōu)勢(shì)。
Figure AI 的機(jī)器人已經(jīng)可以執(zhí)行包裹分類和處理任務(wù)
將人形機(jī)器人引入勞動(dòng)力隊(duì)伍是 Figure 使命的核心。而最新的Figure AI 的機(jī)器人已經(jīng)可以進(jìn)行物流包裹處理和分類。這項(xiàng)任務(wù)需要人類級(jí)別的速度、精度和適應(yīng)性,突破了從像素到動(dòng)作的學(xué)習(xí)操作的界限。
這個(gè)能力是Helix System 1 大模型迭代來的,其具有豐富的 3D 理解能力,可以實(shí)現(xiàn)更精確的深度感知運(yùn)動(dòng)。每個(gè) Figure 機(jī)器人現(xiàn)在都可以自我校準(zhǔn),從而實(shí)現(xiàn)跨機(jī)器人無縫傳輸。使用簡(jiǎn)單的測(cè)試時(shí)間加速技術(shù),Helix 實(shí)現(xiàn)了比演示者更快的執(zhí)行速度,同時(shí)保持了較高的成功率和靈活性。
在以往傳統(tǒng)的具身機(jī)器人模擬中,需要對(duì)物品進(jìn)行描繪和界定。而物流包裹是變化的,由于環(huán)境永遠(yuǎn)無法完全預(yù)測(cè),因此系統(tǒng)必須能夠自我糾正。此外,它還需要跟蹤連續(xù)移動(dòng)的傳送帶上大量包裹的動(dòng)態(tài)流動(dòng)并保持高吞吐量。Helix 視覺運(yùn)動(dòng)策略現(xiàn)在將兩個(gè)攝像頭的特征合并到多尺度立體網(wǎng)絡(luò)中,然后再進(jìn)行標(biāo)記,多尺度特征使系統(tǒng)能夠解釋精細(xì)細(xì)節(jié)以及更廣泛的上下文線索,共同促進(jìn)視覺控制的可靠性。
最后,通過利用學(xué)習(xí)校準(zhǔn)和視覺本體感受模塊,F(xiàn)igure AI能夠?qū)⒆畛踉趩蝹€(gè)機(jī)器人數(shù)據(jù)上訓(xùn)練的相同策略應(yīng)用于多個(gè)其他機(jī)器人,這就是協(xié)同工作的核心能力。也就是這個(gè)能力,使得其上流水線能夠發(fā)揮更大的生成效能。
Figure AI 的官方視頻展示了如何利用高質(zhì)量的數(shù)據(jù)集,結(jié)合立體多尺度視覺、在線校準(zhǔn)和測(cè)試時(shí)間加速等架構(gòu)改進(jìn),在現(xiàn)實(shí)世界的物流分揀場(chǎng)景中實(shí)現(xiàn)比演示者更快的靈巧機(jī)器人操作——所有這些都是在使用相對(duì)適量的演示數(shù)據(jù)的情況下實(shí)現(xiàn)的。物流分揀線的機(jī)器人視頻已經(jīng)發(fā)布,也就是說,F(xiàn)igure AI 在機(jī)器人轉(zhuǎn)化為勞動(dòng)力上已經(jīng)取得了成就。
Figure AI 不斷獲得融資,是對(duì)其技術(shù)路線的肯定
最新消息,F(xiàn)igure AI正在洽談新一輪15億美元融資,公司估值高達(dá)395億美元,比上一輪高了 15 倍左右。預(yù)計(jì)將由Align Ventures和Parkway Venture Capital領(lǐng)投。
而在這之前,2024年3月,F(xiàn)igure AI宣布完成6.75億美元,估值26億美元,投資方包括微軟、OpenAI Startup Fund、Nvidia(英偉達(dá))、亞馬遜工業(yè)創(chuàng)新基金、在科技界響當(dāng)當(dāng)?shù)牧硪粋€(gè)人物杰夫·貝索斯(Jeff Bezos)、Parkway Venture Capital、英特爾投資、Align Ventures和ARK Invest,都是有份量的投資人。
Figure AI創(chuàng)始人兼首席執(zhí)行官Brett Adcock近期稱,F(xiàn)igure已簽約第二位(目前還處在保密階段)商業(yè)客戶,并有望出貨100,000 個(gè)人形機(jī)器人。而實(shí)際上,它的第一個(gè)客戶是寶馬公司,其具身機(jī)器人已經(jīng)在寶馬工廠測(cè)試一些簡(jiǎn)單的工作。
Figure AI 的融資如果能夠再度落實(shí),那就意味著其技術(shù)路線受到行業(yè)肯定。不過全新的Helix 模型驅(qū)動(dòng)的機(jī)器人能力還處在早期階段,后面會(huì)進(jìn)化到什么程度,能不能批量商業(yè)化成會(huì)思考能決策自主進(jìn)化的勞動(dòng)力機(jī)器人,我們拭目以待。
本文為動(dòng)點(diǎn)科技記者原創(chuàng)文章,未經(jīng)授權(quán)不得轉(zhuǎn)載,如需轉(zhuǎn)載或開白請(qǐng)?jiān)诤笈_(tái)回復(fù)“轉(zhuǎn)載”。
- - - - - - - - END - - - - - - - -
互動(dòng)話題
你認(rèn)為人類工作會(huì)被它盯上嗎?
快來評(píng)論區(qū)留下你的觀點(diǎn)吧!
*想要獲取行業(yè)資訊、和志同道合的科技愛好者們分享心得,那就趕快掃碼添加“動(dòng)點(diǎn)君”加入群聊吧!群里更有不定期福利發(fā)放!
精彩好文值得推薦!
一鍵轉(zhuǎn)發(fā),戳個(gè)在看!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.