人工智能領域在AI大模型和智能駕駛爆火之后,下一個最熱的賽道是什么?具身智能當仁不讓!據(jù)高盛此前預測,到2035年,人形機器人市場空間有望達到1540億美元。除了特斯拉,國內也有很多大廠和創(chuàng)業(yè)公司投身其中。
與傳統(tǒng)的工業(yè)機器人不同的是,新一代具身智能的核心目標是,賦予機器人類人化的泛化能力,也即面對多樣化的環(huán)境和任務時,能夠像人類一樣從容應對和靈活操作。比如人形機器人被期望可以做一些家務勞動,而不是像流水線上的機械手臂一樣只能做簡單、重復的動作。
要實現(xiàn)這一點,正如ChatGPT需要海量數(shù)據(jù)做訓練,端到端的智能駕駛需要幾百萬輛車提供數(shù)據(jù)來源,具身智能的發(fā)展同樣需要大量優(yōu)質的訓練數(shù)據(jù)。但是,收集機器人訓練數(shù)據(jù),遠比通用大模型收集文本或圖像等互聯(lián)網(wǎng)數(shù)據(jù)困難得多,需要在專門的環(huán)境中記錄機器人的每個關節(jié)動作和末端執(zhí)行信息。這個過程不僅需要昂貴的硬件設備,還需投入大量人力來確保數(shù)據(jù)質量。成本高,數(shù)據(jù)少,已成為人形機器人行業(yè)迭代的掣肘。
國內具身智能明星企業(yè)智元機器人,今日重磅發(fā)布全球首個基于全域真實場景、全能硬件平臺、全程質量把控的百萬真機數(shù)據(jù)集開源項目AgiBot World。這一里程碑式的開源項目,旨在構建國際領先的開源技術底座,有助于推動具身智能領域迎來GPT時刻。
接下來的一段時間,智元機器人將按計劃在HuggingFace、Github以及agibot-world.com項目主頁上分批上傳數(shù)據(jù),供全球下載和使用,加速人類邁向通用人工智能的新時代。 #源神稚暉君又開源了#
為什么是智元機器人?
智元機器人成立時間不長,但跑得最快,已成為中國估值最高、現(xiàn)金儲備最為充足、商用量產(chǎn)規(guī)模最大的人形機器人企業(yè)之一。
據(jù)了解,智元機器人由“華為天才少年”“稚暉君”彭志輝從華為離職后于2023年2月創(chuàng)立。在成立不到兩年的時間里,智元機器人已經(jīng)完成了八輪融資,融資總額超20億元,估值超70億元。
其投資方背景頗為強大,既包括高瓴創(chuàng)投、鼎暉資本、經(jīng)緯創(chuàng)投等投資機構,也包括上海臨港新片區(qū)基金、上海司南園科私募基金等地方國資,以及比亞迪、上汽投資、長飛光纖、立景創(chuàng)新、百度風投、三花控股等產(chǎn)業(yè)資本。據(jù)智元機器人方面透露,公司計劃于明年年初啟動B輪融資。
在產(chǎn)品布局方面,2024年8月18日,智元機器人發(fā)布了五款商用人形機器人新品,包括“遠征”與“靈犀”兩大系列,這些新品覆蓋了交互服務、柔性制造、特種作業(yè)、科研教育和數(shù)據(jù)采集等多個場景。
在智元的這場新品發(fā)布會上,其柔性智造機器人遠征A2-W的一場“現(xiàn)場秀”讓人印象深刻。
在一個布置得像客廳的場景中,彭志輝對一臺遠征A2-W機器人說“給我做一杯萄汽可樂吧?”;遠征A2-W回問:”什么是萄汽可樂?”;彭志輝解釋稱,“就是把葡萄榨汁和可樂放在一起。”聽到后遠征A2-W就移動去了桌子邊,從放有青棗、葡萄、小番茄等的碟子中選中葡萄,拿起榨汁機,成功將葡萄打成汁,然后又從有可樂、雪碧、橙汁、礦泉水的罐裝飲料中選中可樂,用它的兩根手指打開瓶蓋,將可樂倒入葡萄杯中,最后遞給彭志輝。
對全世界的機器人來說,這一番操作其實相當復雜的,特別考驗機器人的語義理解和手眼配合能力。遠征A2-W的成功完成,證明了智元機器人的軟硬件技術實力。
也正基于此,智元已經(jīng)正式開啟通用機器人商用量產(chǎn)。截至12月15日,機器人累計產(chǎn)量已有962臺,年底計劃產(chǎn)量接近千臺。其市場表現(xiàn)同樣令人矚目。據(jù)透露,智元預計2024年的發(fā)貨量將達到300臺左右,其中,雙足人形機器人遠征A2約200臺,輪式人形機器人遠征A2-W約100臺。
復刻五大場景100多種典型應用
支持遠征A2-W機器人為彭志輝成功制作「萄汽可樂」的,是智元的動作編排大模型。動作編排大模型變得更強的必要條件之一,就是此次開源的數(shù)據(jù)集。 #智元開源,中國具身ImageNet到來#
在智元選擇開源之前,全球最通用的機器人操作策略一般是在由谷歌 DeepMind機器人團隊創(chuàng)建的Open X-Embodiment數(shù)據(jù)集上預訓練的。但由于其在數(shù)據(jù)分布外場景成功率難稱“優(yōu)異”,因此訓練出的機器人系統(tǒng)難以適應新任務、新環(huán)境的巨大挑戰(zhàn)。
相比Open X-Embodiment數(shù)據(jù)集,Agibot World長程數(shù)據(jù)規(guī)模高出10倍,場景范圍覆蓋面擴大100倍,數(shù)據(jù)質量從實驗室級上升到工業(yè)級標準!
據(jù)介紹,AgiBot World數(shù)據(jù)集中涵蓋的場景具備多樣化和多元化特點,從抓取、放置、推、拉等基礎操作,到攪拌、折疊、熨燙等復雜動作,幾乎涵蓋了人類日常生活所需的絕大多數(shù)場景。AgiBot World數(shù)據(jù)集中收錄了80多種日常生活中的多樣化技能視頻,讓機器人能夠“十八般武藝樣樣精通”。
AgiBot World數(shù)據(jù)集誕生于智元自建的大規(guī)模數(shù)據(jù)采集工廠與應用實驗基地,空間總面積超過4000平方米,包含3000多種真實物品,真實復刻了家居、餐飲、工業(yè)、商超和辦公五大核心場景,全面覆蓋了機器人在生產(chǎn)、生活中的100多種典型應用需求。
與傳統(tǒng)數(shù)據(jù)集只能處理短程任務相比,Agibot World數(shù)據(jù)集的一大特色是,80%的任務均為長程任務,任務時長集中在60s-150s之間,并且包含多個原子技能,是DROID和OpenX-Embodiment的5倍左右。
舉個形象的例子。傳統(tǒng)數(shù)據(jù)集訓練的是,讓機器人拿一只碗,拿住不打滑、掌握好力道不捏碎,就已經(jīng)很棒了。而Agibot World數(shù)據(jù)集能讓機器人做到的是使用洗碗機洗碗的完整程序。這些操作包括:首先打開洗碗機;然后將筷子、勺子、碗和盤子等水池里雜亂的不同形狀的餐具,一一準確無誤地整理至洗碗機相應卡槽中;關上洗碗機;打開按鈕開始洗刷。
憑借先進的硬件、精心設計的任務和保證的數(shù)據(jù)質量,AgiBot-World 為大規(guī)模機器人學習樹立了新的標桿,并為通用機器人系統(tǒng)的未來鋪平了道路。
源神稚暉君又雙叒叕開源
數(shù)據(jù)集的開源并非智元機器人首次對外開源。其創(chuàng)始人稚暉君深受極客精神影響,秉持開源理念,認為開源不僅是技術分享,更是推動行業(yè)進步的有力方式,通過開源,讓科技成果為更多人所用,促進整個行業(yè)的發(fā)展,實現(xiàn)技術的共享與創(chuàng)新。
2024 年 9 月 25 日智元 AimRT 中間件正式開源。AimRT 是智元機器人自主研發(fā)的高性能通信中間件,它為機器人開發(fā)者提供了一個更輕量化、高效、易用的工具,簡化了機器人開發(fā)過程中的資源管控、異步編程與部署配置等復雜流程,提升了開發(fā)效率,有助于推動各類機器人應用的快速落地。同時,其兼容性和可擴展性也為 AI 繪畫、AI 生文等領域的應用提供了良好基礎,能夠促進機器人技術與其他領域的融合發(fā)展。
2024 年 10 月 24 日智元機器人又宣布靈犀X1面向全球全棧開源,包含含本體設計圖紙、軟件框架、中間件源碼、基礎運控算法等,開源資料總大小超過1.2GB。這一舉措不僅推動了技術的民主化,也為全球的開發(fā)者和科技愛好者提供了學習和研究的平臺。智元希望靈犀X1能夠開啟“人形機器人人人造”的時代。
如同OpenAI將GPT做成大模型領域的基礎設施一樣,智元也希望未來所有的機器人都使用同樣的硬件、同一個大腦甚至小腦——而這些都是智元Inside。
智元在此刻開源全球首個基于全域真實場景、全能硬件平臺、全程質量把控的百萬真機數(shù)據(jù)集AgiBot World,是具身智能技術發(fā)展的重大突破和里程碑事件,更是推進具身智能通用人工智能(AGI)實現(xiàn)的重要加速器。
未來,智元機器人將陸續(xù)開源千萬仿真數(shù)據(jù),以支持更泛化和更通用的大模型訓練;將發(fā)布具身基座大模型,可支持模型微調,賦能千行百業(yè);發(fā)布全套工具鏈,實現(xiàn)采集、訓練和評測完美閉環(huán);為激發(fā)創(chuàng)新的無限潛能,我們還將舉辦一系列AgiBot World Challenge。
智元方面表示,“我們通過匯聚頂尖資源與技術力量,將共同推動具身智能發(fā)展新范式,加速人類邁向通用人工智能的新時代,在全球范圍內奠定中國在這一前沿領域的領導地位。” #源神稚暉君又開源了# #智元開源,中國具身ImageNet到來#
#源神稚暉君又開源了#
#智元開源,中國具身ImageNet到來#
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.