新智元報道
編輯:桃子 好困
【新智元導讀】短短幾個月,國產黑馬再次拿下新一輪超5億元融資,引爆具身智能賽道。從「抓糖豆」到「全流程疊衣」技術飛躍,杭州創業沃土孕育的這顆新星,正以軟硬全棧技術路線沖擊萬億市場。
國產具身智能黑馬,又雙叒拿下新一輪融資!
剛剛,千尋智能正式官宣,完成Pre-A輪5.28億元最新融資。
此次投資陣容堪稱豪華,不僅有阿美風險投資旗下Prosperity7 Ventures(P7)領投,還有華發集團、浙江省科創母基金與上市公司浙江東方在杭州共同發起設立的善富科創子基金提供戰略加持,以及招商局創投、廣發信德、靖亞資本、東方富海、華控基金等知名玩家強勢入局。同時,老股東達晨財智、柏睿資本、弘暉基金以及千乘資本在本輪持續加碼。
據透露,最新融資將主要用于進一步研發、迭代VLA大模型,自研本體進化,以及全球一流團隊的搭建。
近期,千尋智能發布了全新Spirit v1 VLA(視覺-語言-動作)模型搶先版,也成為國內首次攻克柔性物體長程操作難題的具身智能公司。
資本市場為何對千尋如此狂熱追捧?這家AI新星究竟藏著怎樣的殺手锏?
讓我們揭開這輪融資背后的硬核邏輯。
全流程疊衣,堪比真人
回想去年11月,千尋機器人已經實現了多任務通用泛化能力,抓糖豆、倒水、插花都是自學精通。
如今,也就3個多月的時間,它便進化出全流程疊衣服的能力。
目前,除了UC伯克利大佬創辦的Physical Intelligence之外,千尋還是全球唯二能夠挑戰全流程疊衣任務的公司。
兩個機械臂準備就緒,面對身旁籃子中的一堆衣服,得等苦哈哈干完才能休息。
右邊機械臂首先拿起一件紅色衣服后,左邊機械臂同時將衣服提起,第一步就是甩開正面平鋪到桌面上。
接下來,把紅色T恤一邊疊起,再把另一邊疊起,然后將其上下擺正,中間先對折一下,最后再折一下,一件衣服就完成了。
再來下一件,千尋機械臂疊藍色T恤時,由于衣服邊角不整齊,還會仔細地將兩邊鋪平,才開始同上的步驟。
更讓人意想不到的是,在疊完藍色衣服后,它還會主動將其放在紅色衣服上,疊成一摞。
綠色、咖色....兩個機械臂吭哧吭哧,一口氣全部疊完,整整齊齊地將所有衣物放在桌子的左上角。
此外,千尋機械臂還能將雞蛋放置在雞蛋盒,摞碗、按顏色分揀樂高、將錫紙準確插入支架等多種任務。
以上,還只是千尋preview版本的機器人,等將所有流程打通之后,就可以裝上可移動的身體。
驚艷的是,升級后的千尋機器人,直接大秀空中接物,好似一個勝利者在招手。
可能你會覺得,疊衣服這么簡單的事,對于機器人來說太簡單了。事實上,并非如此。
歷時3月,VLA難題大攻關
千尋機械臂成功完成從抓取、鋪平、折疊,再到堆疊全流程疊衣服操作,這一跨越式進化背后,核心便在于Spirit v1。
Spirit v1是一個視覺-語言-動作的多模態模型,首次引入了動態場景感知全新的能力。
相較于此前抓糖豆、倒水等任務,這次的疊衣服的難度呈指數級上升。
左右滑動查看
而且,疊起平鋪在桌面上的衣服,與從筐里拿起再疊衣服,情境完全是不一樣的。
千尋首席科學家高陽在采訪中表示,「對于外行人來說,這可能只是兩件事,但對于機器人而言,思維難度天差地別」。
前者狀態空間相對有限,場景重復性高,有時可以通過重復預設動作序列就可以完成。
而后者的情況則完全不同,狀態空間至少是倒水的100倍,而且每一件衣服的褶皺、形狀都是獨一無二的。
對于纏繞在一起的衣服,再加上不同的褶皺,僅僅讓機械臂重復相同的動作序列,更是遠遠不夠。
疊衣服時,涉及到動態感知、復雜操作序列,需要機器人實時處理不可預測的場景,而抓糖豆只需要關注精細控制,倒水則依賴相對固定的軌跡。
就比如,這次機器人疊衣服全流程中加入了一個「甩」的動作,這其實是一個非常關鍵的技術亮點。
這個動作對高動態性能要求極高,因為機器人模型需要在時序上實現精確控制,確保機械臂能夠在恰當的時機,以合適的速度和力度將衣服甩開并平鋪。
這就要求VLA模型不僅能實時感知動態變化,還要快速調整動作策略。
左右滑動查看
從有限狀態到無限可能的跨越,也正是此次Spirit v1的重大突破之處。
多源數據驅動,復雜任務進化密碼
那么,機器人在面對亂成一團糟的衣服時,從哪里下手?有褶皺怎么辦?沒抓到怎么辦?
這些邊角案例,層出不窮。
千尋智能又是如何攻克這些難題,實現了疊衣服全流程操作?
要知道,具身智能發展的核心瓶頸之一在于數據稀缺。與語言模型都動輒萬億級語料相比,機器人領域的操作數據規模和質量,遠遠不足。
千尋智能的應對策略獨具匠心,構建一個分層級數據利用體系,按照數據源和數據質量進行了排序,其中包括:
· 大規模、低成本的互聯網視頻數據
· 中等規模、高精度的遙控操作數據
· 高質量、稀缺的機器人試錯數據
Spirit v1從互聯網視頻學習人類行為后,然后從遙操數據提煉精細控制,再通過強化學習實現試錯優化。
再加上策略設計和連續性優化,能夠確保Spirit v1每個環節順暢銜接,最終完成全流程任務。
這種多源數據融合,恰恰讓Spirit v1在通用性和泛化性上實現質變,恰恰也體現了機器人領域的Scaling Law。
高陽團隊最新研究中,證實了數據Scaling Law在機器人中廣泛存在
據透露,過去一年,千尋的數據規模增長了約5倍。這種數據量級的躍升,不僅推動了模型能力的快速迭代,也為Spirit v1在高動態場景中的表現奠定了基礎。
針對全流程疊衣的任務,千尋機器人模型進行了連續三次測試,同時完成任務的能力已從過去至多5個擴展到50個,向國際領先的π0逐漸靠近。
而疊衣服不僅僅是技術展示,更是對現實中高難度任務的回應。
現實生活中,有很多人類希望機器人代勞的任務,比如疊被子、晾衣服、洗碗,目前具身智能挑戰,就在于泛化能力不足。
高陽表示,「疊衣服的突破是邁向通用的重要一步,雖不能一步到位,但每一次提升都讓我們更靠近家用和工業場景」。
更關鍵的是,千尋VLA模型還在內部快速迭代,在面對新任務時,遠未達模型極限。
杭州創業黑馬,獲頂級資本青睞
千尋智能的技術迭代著實令人矚目,一年拿下多輪融資,資本市場對其認可度可見一斑。
這里不免會有疑問,多家著名投資機構在評估千尋時,究竟看重了哪些優勢?
高陽一語中的,「我們走了一條業界領先的端到端技術路線,AI+機器人硬件的全棧能力是核心壁壘」。
這種全棧能力,不僅體現在千尋在算法層面上的突破,還包括硬件設計與商業落地的深度耦合。
正是這種綜合實力,讓他們能夠在眾多初創企業中脫穎而出,進而打動資本市場挑剔的眼光。
更值得一提的是,千尋智能也誕生于杭州創業的沃土之中,汲取了騰飛的養分。
提起千尋和杭州的緣分,背后還藏有一份深厚的情懷。
千尋智能創始人兼CEO韓峰濤,也是浙大的校友,懷揣著對母校的拳拳之心,便選定杭州作為千尋的起航之地。
作為國內頂尖學府,浙大在機器人、AI、多模態感知等方面,積累了深厚的技術成果,培養了大批領軍人才,在具身智能領域同樣聲名顯赫。
同時,浙江省科創母基金與上市公司浙江東方在杭州共同發起設立的善富科創子基金,對千尋堅定戰略加持,為其在具身智能領域的產業布局注入了強大動力。
目前,千尋的研發重心主要在北京,但杭州的創業氛圍和政策便利,始終是其不可或缺的「起跑助推器」。
軟硬全棧路線,商業化可期
放眼全球,具身智能的佼佼者多集中于伯克利系,而千尋聯合創始人兼首席科學家高陽是「伯克利歸國四子」之一。
高陽在預訓練、監督學習、微調、強化學習領域取得了全球領先的成果,被譽為國內少有的全面型具身智能科學家。
更重要的是,他的技術路線短期內能快速落地并積累數據,長期上限極高,能端到端泛化與多本體數據融合。
正因此,千尋掌握了世界級多源數據融合學習能力與具身大模型的實力。在軟件層面上,才有了VLA模型——Spirit v1。
顯然,具身智能只有大腦和小腦是不夠的,必須有載體才能實現商業閉環。
而在硬件端,千尋同樣不遑多讓。
這家公司匯聚了全球一流的智能硬件團隊,工業級基因為其奠定了定義具身智能硬件新標準的底氣。
高陽在采訪中稱,「軟硬協同是具身智能的核心。算法延遲和硬件響應若不能無縫銜接,機器人可能無法精準完成0.1秒內的動作指令」。
千尋通過底層架構設計,將軟件需求與硬件性能深度耦合,鑄就了新的護城河。
盡管這一技術尚未成為行業標準,但其內部體系已有效支撐快速迭代與產品穩定性的平衡。
有了站得住腳的產品之后,下一步就是商業化了。
機器人賽道與自動駕駛類似,需要的是長期的投入,而商業化能力是關鍵支撐。
恰恰,千尋創始團隊是國內同類公司中,商業化能力最強的一家。
另一位聯創鄭靈茵曾帶領珞石機器人海外事業部從0到1,在2023年海外銷售占比15%,為千尋積累了寶貴的經驗。
未來,千尋計劃延續這一優勢,優先攻占海外市場,因為其人工成本高,企業付費意愿更強。
技術硬核、硬件領先、商業化可期,這套王炸組合,讓資本根本無法拒絕。
產學研融合,打造具身智能人才高地
在具身智能賽道上,千尋智能正在以「頂尖人才驅動顛覆性創新」為戰略,加速構建產學研融合的人才體系。
目前,它已聯手清華、北大、浙大、中科院等高校及科研機構,制定了畢業生定向培養計劃。
人才選拔上,則重點吸納AI和機器人領域的優秀博士人才,為研發團隊注入源源不斷的科研動能。
為了鍛造全球競爭力的人才引擎,千尋還創新性地推行了「AI+機器人雙導師制」。
每位團隊成員由AI和機器人領域的頂尖專家聯合指導,確保研發方向既前沿又接地氣。
同時,通過復合型項目實戰,團隊在具身大模型訓練、硬件迭代、場景落地等全流程中快速成長,并提供廣闊的發展空間和資源支持。
千尋智能創始人兼CEO韓峰濤表示,「人才密度決定技術高度,我們吸引全球頂尖人才,并讓其在千尋發揮乘數效應——即1+1>2的創新合力」。
從高校合作到實踐培養,千尋將產學研融合,不僅為行業輸送創新火種,也在為自身發展積蓄了磅礴力量。
具身智能,AI下一個萬億浪潮
前段時間剛結束的GTC 2025大會上,老黃擲地有聲地宣布,「通用機器人的時代已經開啟」。
沒錯,AI的下一波浪潮,就是具身智能。
過去幾個月,我們見證了具身智能領域,國內外迎來技術密集爆發期。
拋棄OpenAI之后,Figure在上個月亮出首個自研VLA模型——Helix,也是一個端到端的通用模型,能夠讓機器人學習、語言理解、感知控制。
谷歌基于Gemini 2.0打造了兩款通用具身智能模型Gemini Robotics和Gemini Robotics-ER,在推理能力加持下,不僅能折紙、打包飯盒,還能摘葡萄、組合字母.....
除此之外,英偉達開源全球首個可定制的通用基礎模型GROOT N1;波士頓動力Atlas翻跟頭炫技;李飛飛團隊開源BEHAVIOR機器人套件,還有國內智元啟元GO-1大模型、宇樹G1側翻等等。
全球科研機構和公司,就此展開了豐富的研究和商業化探索。
資本、人才、公司紛紛涌入具身智能,恰恰說明了,這一賽道蘊藏著萬億級市場價值。
融合AI、機器人、多模態感知等前沿技術的具身智能,技術路線尚未收斂,靈巧操作、感知決策、人機交互等領域仍充滿突破的可能。
參照谷歌DeepMind對AGI的L1-L5分級標準,具身智能目前行業能力在L0到L1之間,短期內有希望實現L1,即基礎任務的初步自動化。
論文地址:https://arxiv.org/pdf/2311.02462
再加上,具身智能市場前景更加令人振奮。
從工業制造到服務業,從醫療到教育,人形機器人作為具身智能的重要載體,萬億市場潛力無限。
據預測,中國具身智能市場規模將在未來幾年內快速增長。
自研,還是共腦?
在談及近期國內外具身智能成果時,高陽給出了獨到的見解——
Helix模型亮點在于將高層識別和底層快速運動解耦。它相當于一個判斷系統,模型規模可以繼續scaling,動作執行也更順滑,是一個不錯的思路。
至于谷歌Gemini Robotics更像是π0的優化版(畢竟π0團隊是從谷歌分拆出來的),泛化性有所提升,但在任務排序上并無本質突破。
其推理能力的實現,并非來自于完全統一的推理模型。Gemini Robotics仍是分層端到端設計,是Gemini Robotics-ER和Robotics的結合體。
幾乎每家具身智能公司都在搞自研模型,難道機器人就沒有一個共用的大腦(基座模型)嗎?
在高陽看來,從技術上分析,若是GPT-4.5開源,大家肯定會選用更好的模型。但在現實商業化中,公司出于競爭的需求會自研大腦。
「具身智能可能會走類似的路徑:初期各自為戰,最終留下一個最優的大腦」。
如今,面對AI下一個萬億浪潮,千尋智能信心滿滿。
近兩年來,AI在虛擬世界,即語言、圖像、聲音、視頻等領域突飛猛進,大模型的革命必然從虛擬世界走向物理世界。
我們皆生活在物理世界中,具身智能可以創造出比LLM更大的市場機會。這是因為機器人輸出能力更強,所以具身智能未來將是一個比計算機更大的市場。
而現在,硬件已具備可用性,只要模型能力達到可用性閾值,千尋機器人將會解鎖無數個應用場景。
未來十年,從家務到工業,他們希望能夠讓10%的人擁有自己的機器人。
從5.28億融資到全球布局,千尋團隊用硬實力證明了中國企業在具身智能賽道的無限可能。
憑借領先的軟硬全棧技術和強大的商業化落地能力,這家具身智能黑馬,正加速奔向萬億級市場的核心舞臺。
參考資料:
https://www.youtube.com/watch?v=bemrcQcHmMk
https://www.physicalintelligence.company/blog/pi0
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.