99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

AR智能革命!Satori系統讀懂人類意圖,科幻電影場景成現實

0
分享至




團隊由 IEEE 會士,紐約大學教授 Claudio Silva 和紐約大學研究助理教授錢靖共同指導。 論文由Chenyi Li和Guande Wu共同第一作者。

在無數科幻電影中,增強現實(AR)通過在人們的眼前疊加動畫、文字、圖形等可視化信息,讓人獲得適時的、超越自身感知能力的信息。無論是手術醫生帶著 AR 眼鏡進行操作,還是智能工廠流水線前的例行檢查、或是面對書本時 AR 快速查找翻閱的超能力,是這一切只為一個最終目的——通過適時的信息輔助我們。



直到今日,大部分 AR 輔助依然停留在需要人工遠程接入輔助的層面,與我們期待的智能的、理解性的、可拓展的 AR 輔助相差甚遠。這也導致 AR 在重要產業和生活應用中的普及受到限制。如何能讓 AR 在生活中真正做到理解用戶、理解環境、并適時的輔助依然面臨巨大挑戰。



Satori 系統自動識別用戶稱重 11 g 咖啡的展示

這一切隨著 Satori 系統的誕生即將成為過去。來自紐約大學數據與可視化實驗室(NYU VIDA)聯合 Adobe 的研究人員融合多模態大語言模型(MLLM)與認知理論 BDI(Belief-desire-intention theory)讓 AI 首次真正意義的去理解使用者的行為、目標以及環境狀態,最終達到根據不同場景自動適配指示內容,指示步驟,與判斷輔助時機。讓 AR 輔助接入智慧核心,向泛化應用、智能交互邁進了里程碑的一步。



  • 論文標題:Satori: Towards Proactive AR Assistant with Belief-Desire-Intention User Modeling
  • 論文鏈接:https://arxiv.org/abs/2410.16668v2
  • Github:https://github.com/VIDA-NYU/satori-assistance

Satori 創新介紹

創新點一:結合 BDI 模型讓 AI 理解用戶行為和場景關系

通過 AR 眼鏡讓 AI 擁有跟用戶共同視角的「具身感知」,成功的讓 AI 通過認知模型 BDI 理解用戶的動作行為及其短期目的。BDI 把人的行為分解成對周圍世界的理解(Belief),對總體目標的判斷(Desire),和為達目標進行的動作行為(Intention)三個部分。

本質上,BDI 強調人是主動性體(agentive being),做出的行為是基于對環境的理解和內部目標的組合,因此我們使用 AI 以多模態數據的模擬人接受信息和應對目標的方式,適合短期以行為目標為主的的 AR 輔助。



這使得 AR 眼鏡可以通過 AI 加持實時判斷用戶行為背后的目的,不再是單純的對于行為本身的判斷。

創新點二:大語言模型結構認知

Satori 系統以模塊化組織 MLLM,將圖像識別、語義理解、用戶交互歷史上下文解耦處理,并統一納入 BDI 認知架構中。通過將視覺感知模塊(如 OWL-ViT 與 DETR)與語言推理模塊(MLLM)分層協作,系統能夠從用戶的行為動態構建 Belief 狀態、識別任務目標,推理出即時意圖。

該模塊化結構不僅增強了推理透明度與可解釋性,還顯著提升了系統的泛化性與跨任務適配能力,展示了多模態大模型在具身智能中的結構認知潛力。



自動生成帶有動作和箭頭方向的指示圖片

創新點三:AI 自動生成多模態指示

在輔助過程中,AI 生成了適時的、應景的、易理解的圖片以及文字。在圖像層面,Satori 使用 DALLE-3 與場景感知(Belief)模塊自動生成與當前任務階段精準匹配的視覺提示(如剪刀與花的動作關系,與花瓶的空間位置關系),給用戶直接的視覺指引、減少語義誤解。

這項技術同時也用在了文字生成中,在基礎文本上追加對場景物體,用戶交互關系的描述(如「把花插入花瓶」變為「把花插入藍色花瓶」)。此創新讓 AI 更具備操作引導的即時性與可視化表達能力,大幅提升了 AR 輔助的清晰度與實用性。





創新點四:雙系統動作完成檢測方法減少用戶等待時間,增加提示準確率

AR 輔助中一大挑戰在于任務的復雜度影響了 AI 判斷成功率和速度。步驟越復雜、動作越多,AI 一次性判斷的噪音和不確定性越大。因此,Satori 團隊創新地將每個步驟分成多個更明確,易判斷的小目標(checkpoints),來完成對總體步驟的確認。例如:「剪花」任務中的「剪掉枯葉」步驟,會有「拿剪刀」,「對準枯葉」,和「完成剪切」三個小目標,系統判斷這些是否完成后便可觸發下一提示。



Satori 使用雙系統理論(Dual Process Theory)將 AI 的反饋分為「快速反應+理性結構」。動作識別由一個輕量 LLM 完成快速行為完成判斷,以高容量 LLM 補充結構性語義分析,通過交互設計機制將二者節奏對齊,確保系統既具響應性,又具智能表達力。



團隊所提出的模塊化多模態推理框架,不僅在技術層面上展示出對 AR 交互場景的高度適配性,更為未來跨平臺、多領域的智能輔助系統奠定了方法論基礎。系統核心可靈活部署于 HoloLens、Vision Pro、或者輕量級智能眼鏡如 Rokid、INMO、雷鳥、和 Nreal 等不同硬件平臺。



在 AI 與大語言模型快速發展的今天,無疑是 AR 技術邁向實用性的一次新的機遇。無論你是 AI、AR 的愛好者,或者是在學界,工業界的專業人士,都歡迎關注 AR 輔助這個正在覺醒的未來。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
中日友好董女士,一生都在走后門:本科經濟,回國4+4直接協和醫學博士

中日友好董女士,一生都在走后門:本科經濟,回國4+4直接協和醫學博士

可達鴨面面觀
2025-04-28 13:31:05
馬健把主持人干沉默了!怒斥遼寧全方位劣勢,質疑怎么進的四強?

馬健把主持人干沉默了!怒斥遼寧全方位劣勢,質疑怎么進的四強?

籃球資訊達人
2025-04-28 22:44:05
不準關閉大壩,巴鐵通電王毅外長,中方遞出18個字,印度直接泄洪

不準關閉大壩,巴鐵通電王毅外長,中方遞出18個字,印度直接泄洪

簡讀視覺
2025-04-28 22:27:31
步劉國梁后塵?又一離隊教練曝光,王勵勤大膽改革,馬琳峰回路轉

步劉國梁后塵?又一離隊教練曝光,王勵勤大膽改革,馬琳峰回路轉

忠橙家族
2025-04-28 12:20:38
河北三姐妹給父親上墳,被大伯炸死:年齡分別是26歲,33歲和37歲

河北三姐妹給父親上墳,被大伯炸死:年齡分別是26歲,33歲和37歲

江山揮筆
2025-04-28 16:56:11
炸裂!捐精有多亂,雙方直接在賓館完成懷孕過程,一次八百到幾萬

炸裂!捐精有多亂,雙方直接在賓館完成懷孕過程,一次八百到幾萬

阿霸聊事
2024-09-23 10:13:50
廣廈26分大勝遼寧奪賽點!布朗30+9趙繼偉被凍結,衛冕冠軍陷絕境

廣廈26分大勝遼寧奪賽點!布朗30+9趙繼偉被凍結,衛冕冠軍陷絕境

體壇紀錄片
2025-04-28 21:48:57
大量私照和內幕爆出:董小姐腹中子可能不是肖大夫的!肖大夫虧死

大量私照和內幕爆出:董小姐腹中子可能不是肖大夫的!肖大夫虧死

一支破筆半支煙
2025-04-28 21:58:17
央企副總被舉報長期出軌多名人妻,還遭失陪酒女男友抓奸敲詐!

央企副總被舉報長期出軌多名人妻,還遭失陪酒女男友抓奸敲詐!

兵叔評說
2025-04-28 16:40:22
河北三姐妹給父親上墳被大伯炸死,只因耕地有矛盾,炸死三個侄女

河北三姐妹給父親上墳被大伯炸死,只因耕地有矛盾,炸死三個侄女

阿鳧愛吐槽
2025-04-28 07:36:08
曝拒幫肖飛打招呼的醫生是盤尼西林樂隊成員

曝拒幫肖飛打招呼的醫生是盤尼西林樂隊成員

大象新聞
2025-04-28 17:06:20
北京、上海最新消費數據,出現斷崖式下滑

北京、上海最新消費數據,出現斷崖式下滑

黑噪音
2025-04-28 04:33:29
張譯拿完影帝后!僅過了3分鐘,就做了重大決定,息影,原因在這

張譯拿完影帝后!僅過了3分鐘,就做了重大決定,息影,原因在這

說說史事
2025-04-28 08:08:17
德國稱抓到兩名俄方特工!手機里竟有美國防長的電話

德國稱抓到兩名俄方特工!手機里竟有美國防長的電話

項鵬飛
2025-04-27 21:51:00
烏克蘭最新消息:澤連斯基御用女演員被打死!網友:好漂亮好可惜

烏克蘭最新消息:澤連斯基御用女演員被打死!網友:好漂亮好可惜

步論天下事
2025-04-28 08:02:18
中日友好醫院出軌大瓜:女的學4年醫就能進手術室,男的出軌52歲女護士求干活

中日友好醫院出軌大瓜:女的學4年醫就能進手術室,男的出軌52歲女護士求干活

瑪麗姬絲
2025-04-28 13:00:26
男子嫌情婦太黏人,讓妻子勸她分手,2010年情婦不答應被他殺死了

男子嫌情婦太黏人,讓妻子勸她分手,2010年情婦不答應被他殺死了

漢史趣聞
2025-04-28 17:04:39
首都醫科大學校長饒毅當王辰院士面開噴協和:烏煙瘴氣、任人唯親!

首都醫科大學校長饒毅當王辰院士面開噴協和:烏煙瘴氣、任人唯親!

讀史
2024-11-09 07:01:30
當不成總統了?美爆發混亂,替罪羊出現,特朗普開始后悔了

當不成總統了?美爆發混亂,替罪羊出現,特朗普開始后悔了

紅色鑒史官
2025-04-27 18:35:03
皇馬與安帥和平分手!78歲佛爺拍板:全款支付剩余薪水 聘任大使

皇馬與安帥和平分手!78歲佛爺拍板:全款支付剩余薪水 聘任大使

風過鄉
2025-04-28 21:20:29
2025-04-29 04:48:49
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
10419文章數 142299關注度
往期回顧 全部

科技要聞

傳騰訊阿里從字節搶購算力資源 字節否認

頭條要聞

美航母一戰機墜海 胡塞武裝此前稱對該航母發動襲擊

頭條要聞

美航母一戰機墜海 胡塞武裝此前稱對該航母發動襲擊

體育要聞

“我們欠球迷一個冠軍慶典,現在可以狂歡了”

娛樂要聞

黃渤青島做東請客 桌上全人情世故

財經要聞

外賣平臺陷入內卷,傷害的是誰?

汽車要聞

東風日產,重新起跑

態度原創

本地
親子
時尚
手機
公開課

本地新聞

與重慶超合拍|取景框對準來福士,開機你的電影感之旅

親子要聞

【漲知識】福州廈門代孕公司哪里有代孕機構|ZSE

五一,就躲在家里看書吧!

手機要聞

或成為最薄折疊屏手機,曝三星Galaxy Z Fold7折疊狀態下厚度為8.2毫米

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 弥渡县| 彩票| 涡阳县| 清水河县| 莒南县| 葫芦岛市| 泰和县| 宾阳县| 德格县| 民和| 伊春市| 郧西县| 三门峡市| 米泉市| 桃园市| 育儿| 互助| 清镇市| 射洪县| 渝北区| 原阳县| 海盐县| 山西省| 河北区| 富蕴县| 仁怀市| 沭阳县| 崇礼县| 玉树县| 巧家县| 崇左市| 华安县| 鄂温| 个旧市| 南安市| 山西省| 桃源县| 武义县| 兰坪| 昭平县| 濉溪县|