- 克雷西 發(fā)自 凹非寺
- 量子位 | 公眾號 QbitAI
AI眼鏡,究竟為什么這么熱?
自2023年10月Meta旗下的Ray-Ban Meta智能眼鏡發(fā)布,標志著智能眼鏡終端不再只是極客的玩具,而是可能成為繼智能手機之后,人類與數(shù)字世界交互的下一個核心入口。
截至目前,國內已有十余家廠商正式發(fā)布了AI眼鏡產(chǎn)品,還有更多的產(chǎn)品正等待亮相,“百鏡大戰(zhàn)”的序幕已經(jīng)拉開。
這場大戰(zhàn)之中,參賽選手屬性各不相同,既有互聯(lián)網(wǎng)廠商,也有做顯示出身……不同類型的選手都是以一種怎樣的姿態(tài)加入的這場戰(zhàn)斗?
為了解開這些疑問,量子位與不同屬性的AI眼鏡從業(yè)者進行了對話交談。今天的文章是這一系列交流中的第二期,我們對話了閃極科技創(chuàng)始人兼CEO張波先生。
在做AI眼鏡之前,閃極科技以其電池和充電產(chǎn)品而聞名,因此也被外界看做AI眼鏡的“跨界選手”。
當然,閃極內部對此有不同的看法,但可以肯定的是,做電池的經(jīng)歷給閃極在“百鏡大戰(zhàn)”中帶來了獨特優(yōu)勢。
閃極為什么要做AI眼鏡?他們理想當中的AI眼鏡又是怎樣的一種形態(tài)?
來看這位“跨界選手”心目中的藍圖。
核心要點
- AI眼鏡要擁有“記憶”,能夠主動成為用戶的“個人助理”;
- 目前圖形界面的UI,不適合做成AI眼鏡的顯示;
- AI眼鏡的關鍵在于全天候使用,“大而全”不是終極目的;
- 小米等大廠的入局,會讓整個行業(yè)變得更加繁榮。
以下為量子位與張波對話實錄,部分內容有刪改。
讓AI眼鏡成為有記憶的“個人助理”
量子位:自從產(chǎn)品發(fā)布以來,閃極眼鏡的AI功能有沒有什么新的迭代?下一步的更新計劃是什么樣的?
張波:首先是接入了更多的模型,包括春節(jié)期間我們把DeepSeek也接進來了。
另外就是我們把我們的智能體的商店也做得更全面了,比如說我們有導游的Agent,可以通過拍照的方式幫你解讀沿途的景物,包括背后的文化、歷史。
而且我們云端的鏈路也優(yōu)化得更流暢了,整個響應的全流程都做了軟硬件一體的效率優(yōu)化。
第三,在功能上我們想做一些主動的AI,比如說我們現(xiàn)在有一個模式是如果你打開它,那么每隔幾分鐘它就會拍一張照片,然后用AI去歸納、匯總、整理。
而且在拍照的同時,如果有人聲出現(xiàn)的話,它就可以持續(xù)地錄一段音,把有效的聲音信息也記錄下來,這種主動地去記錄聲音和畫面信息,形成一個助理型AI的歸納整理。
這個是我們在去深入開發(fā)和優(yōu)化的部分,就是讓它成為一個真正過目不忘的助理。
量子位:閃極提出的這種AI記憶存儲,成本還是比較高的,閃極會不會考慮采用訂閱模式?用戶的訂閱習慣需要如何培育?
張波: 我們的基礎功能——AI問答,包括多模態(tài)的問答,肯定還是不收費的,因為這個服務成本可以不斷地去優(yōu)化和降低。
但是像長期的記憶和專屬歸納整理、檢索,最終還是要走向收費的,否則成本會持續(xù)增加。
我們可以通過幾個機制去來去平衡,第一就是前期是先免費,后期(收費期)用戶可以通過打卡或者社交平臺曬單分享的方式獲得抵用券,或者累加免費的時長、容量。
我們規(guī)劃中的價格是299一年,但是實際大家通過打卡獲得優(yōu)惠之后,實際的價格大概在100元左右。
但是就算不付費,輕度的問答和有限容量的記憶都還是可以用的。量子位: 剛才您也提到了閃極今年會接入更多的模型,當然對于用戶來說多幾種選擇不是壞事,但是模型一多就可能會存在一個調度問題。另外有些廠家采用了定制化的模型,相對來說和系統(tǒng)、硬件的融合程度會更好。
所以,閃極目前設置的模型接入方式背后都有哪些考量?如何解決背后的一些潛在問題?
張波: 我認為,定制化模型主要的目的是讓模型在更細分的方向上做得更好,但是現(xiàn)在用戶數(shù)量還不夠多,還沒有看到特定的高頻場景,能夠支持我們去做定制模型。
但是這并不代表閃極沒有這樣的能力,當前這個階段我們會積累數(shù)據(jù),以便為未來定向訓練更適合個人助理的模型做準備。
我們現(xiàn)在已經(jīng)在模型上有了布局,去年Tensorflow團隊發(fā)布的一個新的強化記憶的模型,它可以讓整個Transformer架構在不用重訓練的情況下,就是具備一定的記憶能力。
這跟我們要做強記憶的模型是不謀而合的,所以在探索新的模型架構,而不是在現(xiàn)在Transformer的基礎上去做,因為想讓Transformer有記憶的話訓練成本太高了,我們現(xiàn)在都是通過外掛降數(shù)據(jù)庫的形式去實現(xiàn)。
但是最終,我們還是希望這些記憶能夠直接融入到模型本身,當然還有很多工作要做,我們也正在努力。
關于我們接入的不同模型,的確每個模型在我們的測試項中展示的特長不一樣,比如說通義千問對于各種復雜的圖片的多模態(tài)識別就會更精確一些;但是如果是在這種擬人的對話和情感的對話上面,可能豆包的模型就會更好一些;如果是像生物識別,比如說識別植物和動物的門綱目科屬種,那可能就會用科大訊飛的植物識別模型。
所以在調用模型時我們會基于功能進行分配,另外也要看系統(tǒng)的響應,因為所有的模型都有抖動,我們會不斷地地去測試這些模型服務器的響應的情況,調用響應更好、更及時的模型。
量子位: 您之前在其他的訪談中提到過,希望AI眼鏡能夠融入互聯(lián)網(wǎng)平臺,擴大“朋友圈”。所以閃極現(xiàn)在眼鏡產(chǎn)品與第三方平臺的生態(tài)合作上,有沒有什么新的進展?
張波: 第一,我們肯定希個眼鏡它有更多、更直接的用戶行為習慣數(shù)據(jù)導入,所以我們和網(wǎng)易云音樂、 QQ音樂都談了新的合作,希望可以直接拉取歌單,更好地判斷用戶在視聽習慣上的喜好,這個會在下一個版本中可以更新出來。
第二個是在AI的存儲歸納總結上,我們發(fā)現(xiàn)有些筆記類的應用,都有一些非常好的一些模板和接口,這個也是我們在打通和調用的。
第三,眼鏡也好,還是其他硬件也好,最終還是需要把拍的東西傳播和分享出去。所以我們和小紅書、微博等社交媒體都在探討“一鍵分享”,最終我們希望成為AI的APP store,所以這個軟硬件的權限也是開放的,可以支持更多的開發(fā)者在我們的產(chǎn)品上面開發(fā)的原生AI應用。
并且溝通下來這些廠商的態(tài)度也是比較積極的,因為其實是增加用戶活躍度和內容產(chǎn)出的一個新渠道,當然也面臨著一些技術和法律問題,我們會持續(xù)溝通、推進。
AI眼鏡和顯示之間,還差一個新的用戶界面
量子位: 閃極曾經(jīng)表示過,在“AI重構UI”之前不會做顯示部分。請問您對于這個“重構”的定義是什么樣的?
張波: 現(xiàn)有的所有的UI交互都是基于圖形化的顯示界面,人和機器之間的溝通是通過操作界面去完成的。
但是AI交互基本上是純對話,最多只要再加一些圖片就OK了,交互過程就是一種對話流,所有的展示都是在一個網(wǎng)頁或者在一個對話框里完成。
所以,等到用戶最終覺得這種實時生成的對話內容,可以滿足信息獲取需求的時候,那我們就可以在眼鏡上基于這種實時對話流的形式,去增加顯示的功能。目前我覺得一個關鍵的點,是大家能不能針對這種AI的瀑布流的顯示達成共識。
另外顯示現(xiàn)在還面臨一個問題,就是在眼鏡上做超輕量的顯示,它的功耗、體積都不是特別的能夠滿足全天候佩戴的需求,那我們肯定還是要做精簡。
量子位:您認為無顯示或輕量化顯示的AI眼鏡,和帶有AI功能的AR眼鏡,這兩種硬件形態(tài)的用戶群體分別是什么樣子的?
張波: AR眼鏡的其中一種形態(tài),就是作為顯示設備的便攜式替代,最大的目標群體還是游戲用戶,大家把它當成游戲機等娛樂設備的副屏。這個肯定不是我們想做的,我們還是希望做一個具有獨立算力和全部系統(tǒng)權限的、類似于小手機的一種眼鏡硬件。
還有一種是光波導,但是做光波導的廠商現(xiàn)在還沒有特別大量的出貨,可能兩三千臺就是現(xiàn)在單一品牌的極限,還沒有形成規(guī)模效應,用戶人群也很難收斂出來。大多數(shù)用戶依然、把它當玩具,當一個新奇的體驗在用,而沒有能夠貢獻出生產(chǎn)力或者娛樂上的價值。
目前來看,閃極未來的演進方向,還是希望在記錄和個人助理的層面上給大家貢獻一點生產(chǎn)力的價值,我們希望眼鏡能幫大家記錄跟人溝通了什么、講了什么、做了什么。
量子位: 如果讓您來暢想一下我們 AI 眼鏡產(chǎn)品的終極形態(tài),您認為會是一個什么樣子?張波:我認為是讓大家每天佩戴起來沒有什么負擔,但是在雙手都被占據(jù)的時候又可以完成絕大多數(shù)的人機交互。不管是信息提示、AI問答,還是一些主動的處理型的內容,都有點像一個手表手環(huán)的存在,但是能比手表手環(huán)帶來更強的人機交互和生產(chǎn)力的價值。
這就是它一個比較理想的狀態(tài),可能是在未來三到五年內實現(xiàn)的。
如果說更遠的未來就是,那AI眼鏡可能人類增強自己能力的最佳硬件,最終AI和人類肯定是要相互賦能的,那就必須有一個介質。
終極的介質可能是腦機接口,但是很多人可能不希望使用侵入式的腦機接口,那么隨身佩戴的眼鏡就成了增強人機交互的最佳硬件載體。
不做“大而全”,關鍵在使用全天候
量子位: 所以您認為就是決定AI眼鏡類成產(chǎn)品能不能成功的最關鍵的因素是什么?
張波: 我覺得最關鍵的因素還是讓用戶覺得它真的有用,能夠在生活中默默地、主動地幫用戶做一些事情。
如果需要人類去指揮的話,手機這種交互形式肯定還是更加的符合大家的直覺,學習成本也更低的。
所以我們要做在手機上做不到的事情,它實時在看、在錄,幫人做好歸納總結,這是我們在努力的方向。
量子位:您認為閃極的產(chǎn)品在這場“百鏡大戰(zhàn)”中最大的優(yōu)勢是什么?
張波:我們最大的優(yōu)勢,第一就是我們在充電技術上的積累,可以讓我們這個眼鏡的續(xù)航更長,這樣它就可以更長的陪伴和記錄。
第二就是我們在AI的記錄存儲和總結上面投入了很大的開發(fā)資源和精力,我們現(xiàn)在已經(jīng)可以做到第一梯隊,并且我們會持續(xù)地加強。
第三是我們有一批非常愿意嘗新的用戶,可以讓我們更好地去快速完成驗證。
量子位:剛才您也提到了電池的優(yōu)勢,確實閃極也是從做電池和充電設備跨界過來的,并且這個跨度還是比較大的,但所以選擇做AI眼鏡是基于什么樣的考量?
張波: 我想澄清一點,這個跨度可能在外界看來確實很大,但在我們內部看并不算大。
因為我們在做充電之前是做過手機和無人機,并且做無人機的合伙人他之前就在無人機的頭部廠商做超輕量的顯示設備,所以在這一塊上面我們的技術能力和積累是足夠的。我們之所以做這個方向,是因為我們發(fā)現(xiàn)在AI時代到來之后,必須有一種新的交互硬件,才能充分地發(fā)揮AI的能力。
在各種穿戴設備,比如鼠標、軸環(huán)、掛飾、眼鏡、耳機等這些當中隨便選,那么眼鏡無疑是陪伴人時間最長的,而且它的算力和電力都更充分,能夠一直符合人的第一視角的感觀,綜合起來就是我們就最終決定要做AI眼鏡的原因。
量子位: 您之前曾經(jīng)說過閃極要把AI眼鏡的價格做到“雷軍也做不到的水平”,那么閃極是如何實現(xiàn)成本控制的?
張波: 第一是更多地選用國產(chǎn)芯片,雖然做3納米、4納米的手機處理器可能還比較難,但是做一個手表、手環(huán)級別的處理器,國內的技術還是很成熟的,所以我們會跟國內優(yōu)秀的芯片供應商做配合。
另外就是我們也重構了整個架構。之前的各種眼鏡都是單芯片優(yōu)化,主控芯片即使在不工作的時候功耗也很高,所以我們就通過協(xié)處理器,通過超低功耗的待機和喚醒,實現(xiàn)續(xù)航的增長。
當然成本降低還也有賴于整個供應鏈的支持,因為整個供應鏈都認可這的確是未來的方向,大家愿意幾乎不掙錢甚至倒貼的陪我們一起玩,希望能夠盡快地做出一個爆款的產(chǎn)品,讓整個市場能夠對更多的用戶對這個產(chǎn)品感興趣。
所以我們在努力做這個方向上的成本的優(yōu)化,供應商也很配合,大家一起努力把成本做到最低。
量子位:您剛才提到了供應鏈,AI眼鏡作為一個新的物種,在大眾看來打通供應鏈并非非常容易的事,所以好像跟您剛才說的就是有一點出入?
張波:一個產(chǎn)品的落地肯定是妥協(xié)的結果,沒有人可以做到完美,哪怕是iPhone,第一代也有很多不完美的地方,所以關鍵是怎么實現(xiàn)預期和實際狀況之間的平衡。
大家肯定都想做個完美的產(chǎn)品,但是技術和硬件達不到要求的時候,是很難實現(xiàn)的。具體到我們,的確在對于整個芯片方案的優(yōu)化、攝像頭聲音的算法上還有提升空間。這是一個工程上的難題,而不是一個科學的難題,那就給出時間、給出目標、給出資金和人力,大家去努力完成就好了。
量子位:前兩天就是小米也剛剛宣布了他們的AI眼鏡,您怎么看待小米的入局呢?
張波:我覺得這是一個非常好的事情,因為雷總的帶貨能力還是超過很多人的,只會讓這個行業(yè)越來越好。
量子位:您對于認為目前這個整個AI眼鏡市場的發(fā)展最大的限制因素是什么?
張波:我認為是AI眼鏡這種產(chǎn)品,大多數(shù)人都還沒見過,甚至不知道有這個東西存在。
要想解決這個問題,單靠我們一家是很難扭轉整個市場和消費者的認知的,所以這需要整個行業(yè)一起向前進步,然后讓大家意識到這種新型產(chǎn)品形成整個產(chǎn)業(yè)鏈,可能也需要有大廠在這個方面去發(fā)聲,讓更龐大的人群能夠了解這樣的產(chǎn)品。
量子位:有的廠商,特別是AR廠商認為AI眼鏡的最終形態(tài),就是全彩顯示、空間計算等等趨勢融合全部都融進來,您覺得這個判斷是對的嗎?張波:我認為一個設備如果能夠獲得用戶的注意力,那所有的資金和資源就會向它集中。就像手機上面抖音越來越搶占大家用戶的注意力,那它的規(guī)模就越來越龐大。
還是要強調,這個產(chǎn)品必須是能夠全時段陪伴用戶的,一旦做了“大而全”,在物理重量上用戶就不一定能夠接受,在各種場景下它的續(xù)航也不一定能扛得住。
所以我覺得這個產(chǎn)品就是如果做得“大而全”,它就無法符合全場景的使用需求,也就更難衍生出更強的商業(yè)化的價值。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.