2025 年的今天,AI 眼鏡越發(fā)成為焦點(diǎn),或許我們可以大膽地猜測(cè),未來(lái)的 AI 助手不是藏在手機(jī) App 里,而是戴在你臉上、看你所看、答你所問(wèn)。
4 月舉辦的 TED 大會(huì)上,Google 也給出了自己的答案。在 TED 官方上周最新發(fā)出的視頻中,谷歌首次公開(kāi)展示了搭載 Android XR 的 AI 眼鏡,如何在 Gemini AI 的加持下如何運(yùn)行:
不僅能聽(tīng)懂語(yǔ)言、即時(shí)翻譯,還能「看見(jiàn)」世界,甚至記住用戶曾看過(guò)的物體、識(shí)別書(shū)名、直接播放唱片上的音樂(lè)、疊加導(dǎo)航指引。
圖/ TED
這場(chǎng)現(xiàn)場(chǎng)演示,也再次引發(fā)了外界對(duì)于 AI 眼鏡的廣泛熱議。誠(chéng)然,這不是 Google 第一次做眼鏡,也不是第一款 AI 眼鏡,但它背后是 Google 最新構(gòu)建的 XR 系統(tǒng)平臺(tái) Android XR,也是 Gemini 大模型首次與現(xiàn)實(shí)空間深度融合的結(jié)果。
尤其在 Meta、Rokid、雷鳥(niǎo)等廠商接連發(fā)布 AI 眼鏡后,Google Android XR 的這次「下場(chǎng)」,也被視作 AI 眼鏡「平臺(tái)戰(zhàn)爭(zhēng)」的新號(hào)角。但 Android XR 能夠復(fù)制 Android 在智能手機(jī)市場(chǎng)的成功嗎?或許很難。
Google 做的 AI 眼鏡,到底有什么不一樣?
在 TED 放出演講視頻《The next computer? Your glasses》中,能夠很明顯看到 Google 打造的 AI 眼鏡,很像一副普通眼鏡。別誤會(huì),這是大勢(shì)所向。
進(jìn)行演示的 Google AI 眼鏡,圖/ TED
不同于 AR 眼鏡過(guò)去的張揚(yáng)設(shè)計(jì),今天 AI 眼鏡追求的就是越像普通眼鏡越好,以便于消費(fèi)者在日常生活中無(wú)感地進(jìn)行使用。包括 Google 這副看似樸素的智能眼鏡,一開(kāi)始或許不如 Vision Pro 那樣炫技,但當(dāng) AI 開(kāi)始真正「看懂」世界,它釋放出的潛力,足夠讓人重新想象 AI 眼鏡的未來(lái)。
其中最引發(fā)熱議的,就是 Gemini 展示出的「記憶」能力。
我們可能都見(jiàn)過(guò)這樣的演示:戴著 AI 眼鏡對(duì)著某個(gè)畫(huà)面詢問(wèn) AI。不過(guò) TED 現(xiàn)場(chǎng)的演示中,Google 不只是展示了這類實(shí)時(shí)響應(yīng),讓 Gemini 看著現(xiàn)場(chǎng)寫(xiě)俳句(日本的一種古典短詩(shī))。
但更讓人驚喜的是,Google 員工 Nishtha Bhatia 只是輕輕瞥了一眼身后的書(shū)架,然后背身再等了一段時(shí)間,才詢問(wèn)眼鏡「后面架子上那本白色封皮的書(shū)叫什么?」,隨后 Gemini 秒答:
那是詹姆斯·克利爾所著的《Atomic Habits》(中文版譯名為《掌控習(xí)慣》)。
Gemini 有記憶的能力,圖/ TED
不僅如此,Gemini 還能提前記住看過(guò)的信息,然后在之后的詢問(wèn)中直接告訴 Nishtha Bhatia 房卡放在了唱片旁邊。相比之前 AI 眼鏡只能「問(wèn)答」或「識(shí)圖」,Google 這次展示的 AI 眼鏡,在「連續(xù)性」和「上下文感知」方面,可以說(shuō)邁進(jìn)了新的維度。
這不是傳統(tǒng)意義上的圖像識(shí)別,而是近乎具備了「視覺(jué)記憶」的 AI。用戶視線已經(jīng)離開(kāi),AI 卻「記住了」曾經(jīng)看到的物體。換句話說(shuō),它也不只是識(shí)別「是什么」,而是真正能理解「你在問(wèn)什么」。不過(guò) Google 也留下了一些疑問(wèn):
AI 眼鏡上 Gemini 的「記憶窗口」能有多長(zhǎng)?
但無(wú)論如何,這都是我們之前在所有 AI 眼鏡中,沒(méi)能看到的。當(dāng)然,這主要還是得益于 Gemini 模型的能力,理論上隨著其他第三方大模型的迭代和釋放,其他 AI 眼鏡也能實(shí)現(xiàn)。
AI眼鏡=AI+AR,這也是Google的看法
TED 現(xiàn)場(chǎng)的這場(chǎng)演講之所以引發(fā)廣泛關(guān)注,不僅因?yàn)?Gemini 的「記憶力」突破,更因?yàn)?Google 這次交出的,是一副具備 AR 顯示能力的 AI 眼鏡。
關(guān)注 Google Project Astra 項(xiàng)目的朋友可能還會(huì)記得,2022 年谷歌官宣收購(gòu)了一家名為 Raxium 的 MicroLED 顯示屏公司,當(dāng)時(shí)就引發(fā)了諸多猜想。而在 TED 演講中,Google XR 負(fù)責(zé)人 Shahram Izadi 就透露,現(xiàn)場(chǎng)演示的 AI 眼鏡搭載了 MicroLED 顯示屏。
Shahram Izadi 展示 AI 眼鏡顯示屏,圖/ TED
從視頻中的演示也可以看出,Gemini 的交互界面直接出現(xiàn)在鏡片中,不只是在耳邊回應(yīng),還會(huì)透過(guò)光波導(dǎo)鏡片展現(xiàn)在眼前。這種形態(tài) AI 眼鏡的優(yōu)勢(shì),我們已經(jīng)說(shuō)過(guò)很多回:
核心在于純語(yǔ)音交互天然存在體驗(yàn)上的障礙,而視覺(jué)+聽(tīng)覺(jué)的交互體驗(yàn),更符合人類天生的認(rèn)知和交互習(xí)慣。
還是拿 Google 的現(xiàn)場(chǎng)演示來(lái)說(shuō),Gemini 能夠在回復(fù)——不管是回答還是翻譯直接呈現(xiàn)在眼前讓人閱讀,不僅作為觀眾的他者,就連進(jìn)行演示的 Nishtha Bhatia 本人也能非常高效地了解信息,而不用等待 Gemini 的逐詞念出。更不用說(shuō),嘈雜環(huán)境下,就連更靠近耳道的開(kāi)放式耳機(jī)也很難,遑論 AI 眼鏡。
除此之外,顯示能力的加入也帶來(lái)了更多的交互可能,比如最直接的就是——AR 導(dǎo)航。通過(guò)將數(shù)字信息透過(guò)眼鏡疊在眼前,Google AI 眼鏡能夠進(jìn)行在現(xiàn)實(shí)空間中進(jìn)行為用戶進(jìn)行更直觀的導(dǎo)航,包括實(shí)際的方向、距離和路線。
這種輕量化 AR 能力的加持,當(dāng)然也不只是 Google 一家在做。
Rokid Glasses,圖/ Rokid
事實(shí)上,雷科技多次在 AI 眼鏡報(bào)道中提到的 Rokid Glasses 就率先采用了這種 AI+AR 的路線,配備了雙目 AR 顯示,支持信息推送、空間導(dǎo)航、翻譯字幕、AI 對(duì)話等功能。另一邊,Meta 與雷朋(Ray-Ban)合作的下一代智能眼鏡,也被英國(guó)《金融時(shí)報(bào)》爆料將在今年晚些時(shí)候加入 AR 顯示功能。
但想要做好 AI+AR 顯示,并不簡(jiǎn)單,其實(shí)背后蘊(yùn)含的是對(duì)空間感知、視覺(jué)識(shí)別和語(yǔ)義推理的整合能力,同時(shí)也代表了 AI 眼鏡從「語(yǔ)音驅(qū)動(dòng)」跨越到「多模態(tài)交互」的重要節(jié)點(diǎn)。
Google 欲再造Android奇跡,但很難
Google 這次帶來(lái)的 AI 眼鏡背后,是一個(gè)新名字——Android XR。雖然披著 Android 的外衣,但它其實(shí)是 Google 為 XR(擴(kuò)展現(xiàn)實(shí))設(shè)備打造的一套全新操作系統(tǒng)架構(gòu),主打融合語(yǔ)音交互、視覺(jué)感知和空間定位等能力。
換句話說(shuō),它不是給手機(jī)用的 Android,而是 Google 想在下一代計(jì)算平臺(tái)上,再?gòu)?fù)制一次 Android 的生態(tài)奇跡。
但現(xiàn)實(shí)是,今天的 AI 眼鏡,不是 15 年前的智能手機(jī)。
回看 AI 眼鏡行業(yè)的現(xiàn)狀,我們幾乎看到每一家頭部廠商都在自研操作系統(tǒng)。Rokid 自研了空間操作系統(tǒng) YodaOS-Master,這是專為空間計(jì)算與多模態(tài) AI 交互設(shè)計(jì)的操作系統(tǒng)。Meta 也有自己的 Horizon OS,不僅強(qiáng)調(diào)空間操作系統(tǒng)定位,甚至計(jì)劃向第三方開(kāi)放。
YodaOS-Master,圖/ Rokid
簡(jiǎn)單來(lái)說(shuō),大家早已不再指望 Android 給 XR 提供答案。Google 推出 Android XR 時(shí),雖然能打出「兼容 Android 應(yīng)用」的優(yōu)勢(shì)牌,但這張牌,現(xiàn)實(shí)里其實(shí)越來(lái)越輕了。
智能手機(jī)之所以需要操作系統(tǒng)標(biāo)準(zhǔn),是因?yàn)樗休d的是高頻 App 使用場(chǎng)景:社交、支付、娛樂(lè)、地圖……都需要一個(gè)穩(wěn)定的生態(tài)容器。
但 AI 眼鏡不是手機(jī),它的核心交互邏輯并不依賴「打開(kāi)某個(gè) App」,而是基于語(yǔ)音、圖像和上下文理解的即時(shí)響應(yīng)。在 TED 的演示中,我們也可以看到,用戶不需要點(diǎn)擊任何圖標(biāo),不需要跳轉(zhuǎn)任何應(yīng)用——只要說(shuō)出來(lái)、看過(guò)去、問(wèn)一句,就能觸發(fā)系統(tǒng)執(zhí)行:
- 看到書(shū)架,問(wèn)書(shū)名;
- 看向唱片,播放歌曲;
- 嘴里說(shuō)「去哪」,導(dǎo)航就展開(kāi)。
這些體驗(yàn)很多都不太依賴龐大的 App 生態(tài),而更接近服務(wù)即操作、意圖即執(zhí)行的系統(tǒng)級(jí)協(xié)作。硬要說(shuō)的,Gemini 或者說(shuō) AI 才是真正的關(guān)鍵。在這方面,Gemini 很強(qiáng),但還遠(yuǎn)不能「力壓群雄」。
從 TED 演示的那副眼鏡出發(fā),我們看到 Google 正試圖用 Gemini 重構(gòu) AI 眼鏡的交互方式,并借由 Android XR 再次發(fā)起一場(chǎng)平臺(tái)級(jí)的進(jìn)攻。它做出了真正「看得見(jiàn)」的 AI 眼鏡,也帶來(lái)了記憶、導(dǎo)航、翻譯等一整套超越傳統(tǒng)的體驗(yàn)。
但要構(gòu)建一個(gè)真正意義上的平臺(tái),靠炫目的演示還遠(yuǎn)遠(yuǎn)不夠。Android XR 面臨的不只是技術(shù)挑戰(zhàn),還有群雄的市場(chǎng)格局,以及用戶交互遷移的巨大挑戰(zhàn)。包括當(dāng)用戶不再「打開(kāi) App」,而是與 AI 直接對(duì)話時(shí),什么才是平臺(tái)?
這也是 Google 此前所有 XR 項(xiàng)目始終未能落地的癥結(jié)所在——它太擅長(zhǎng)構(gòu)建系統(tǒng),卻始終沒(méi)找到下一個(gè)系統(tǒng)存在的理由。
但無(wú)論如何,AI 眼鏡確實(shí)展現(xiàn)了成為新一代個(gè)人計(jì)算平臺(tái)的巨大潛力,至于 Android XR 能不能成為那個(gè)定義標(biāo)準(zhǔn)的平臺(tái),還是需要我們抱有耐心,見(jiàn)證歷史。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.