文 | 闌夕
1939年,一臺會說話的機器人,震驚了造訪紐約世博會的每一個游客。
機器人名叫Elektro,造型酷似「綠野仙蹤」里的鐵皮人,不過覆滿全身的是鋁板,且被涂成了古銅色,它由西屋電氣生產,在設計上帶有典型的工程師風格。
在展臺上,Elektro口齒清晰的發表自我介紹:「女士們,先生們,我很榮幸見到各位,我是一個聰明的家伙,因為我的大腦里有48個繼電器。」
Elektro甚至能夠表現出幽默感,當有游客停下來打量它時,它就會冷不防的來上一句:「我的大腦比你大」。
這也是實話,因為那48個繼電器加起來重達25公斤,遠非人類可以比擬。
興奮的媒體很快就把Elektro當成未來已至的造物,用盡一切溢美之詞贊美這個時代的科技奇觀,但不出意外的,意外還是雖遲必到。
西屋電氣很快承認,Elektro其實并不是真的會說話,所有的語音指令,都是提前錄制好的,由操作員控制播放,那些充滿機鋒的對話,也只是經過編排的劇本。
雖然好萊塢還挺喜歡Elektro的——它客串了不少電影,多少也啟發了C-3PO的造型——但在市場噱頭幻滅之后,Elektro還是被扔進了報廢倉庫,成為歷史長河里數不清的過客之一。
不過人類還是不曾放棄創造智能物種的念想,近一個世紀以來,人工智能的探索曲折蜿蜒,終于在這幾年的大模型浪潮里,第一次接近了為無機物賦予生命并和「它們」平等對話的可能。
而看著哆啦A夢長大的一代人,也開始有機會制造下一代人的哆啦A夢了。
2024年的最后一個月,火山引擎在上海舉辦了Force原動力大會,AI繼續擔當主角并不讓人感到意外,但AI落地到硬件的場景嶄露頭角,還是有些科幻走進現實的味道。
想象一下,未來的潮玩和手辦,將不再只能放在展示柜里觀賞,而是每一個都內置「人格」,可以隨時響應用戶的召喚,和他們對答如流的暢談詩與遠方,這會帶來怎樣顛覆性的產業變革?
越來越聰明的大模型看上去已經能夠勝任這樣的角色了,但真實的工業生產,從來不是把軟件裝在硬件里,就能解決一切需要,在火山引擎參與「組局」之前,對話式AI+硬件最大的問題其實在于——AI感的無法消除。
在日常的使用場景里,普通人大概體會不到主流智能手機的計算性能和操作系統有多強大,然而一旦將同樣的大模型置于千元以內的硬件終端里,那種交互上的違和感很快就會出現。
比如反應變慢,一句話問完要等好幾秒后才有回應,或是無法像自然對話那樣隨時打斷,往往用戶插嘴后AI還在滔滔不絕的輸出既有內容,再就是對弱網場景支持不足,在接收指令時丟失了關鍵信息,以致于已讀亂回的情況時常發生。
加上在多模態的環境里,人與AI之間的交互,不僅有低帶寬的文本和語音,還會包含高帶寬的視覺影像,以及情緒模擬的個性化適配,這就更加考驗端側音視頻處理的能力了。
理解了將AI和硬件組合在一起的難度,也就理解了為什么火山引擎要來推出解決方案,就商業邏輯而言,讓硬件公司專注于消費制造,讓軟件平臺專注于模型開發,是效率最高的最優解,而中間的粘合環節,恰好就是火山引擎的擅長領域。
畢竟,在實時音視頻RTC配合AI接入的這條技術線上,火山引擎可能是云計算廠商里,走得最遠的那一家。
火山引擎對于RTC技術的長期投入,讓它同樣成為對話式AI的方案供應商,昔年的深耕穿越至今結出碩果,倒是有些「養兵千日,用兵一時」的意思。
世界杯的多人觀賽、抖音的直播連麥、飛書的多人會議……從規模負載來看,火山引擎RTC的實戰積累,也是全球領先的,所以當AI交互的新場景出現后,火山引擎并不需要重新造輪子,而是可以直接站在先進經驗的山頭,另起青云。
于是,不到半年時間,火山引擎就從發布實時對話式AI方案、向著行業喊話的試探性角色,上升到了聯合IoT領域的國產龍頭樂鑫科技正式支持硬件制造商們入局的核心圈玩家,同時火山引擎也和這幾家廠商聯合發布「硬件+對話式AI」智躍計劃。
樂鑫科技是做IoT芯片的,全球出貨量累計超過了10億顆,是這個細分市場的頭部公司,在大會專場上做了30分鐘的演講。
其中有一個比喻非常通俗:在這一輪AI潮玩造物的產業分工里,硬件生產商,相當于是在制造「肉體」,樂鑫這類集成電路設計企業,負責構建「大腦和神經」,而接進來的各種大模型,則承擔著賦予「靈魂」的使命。
以此類推,火山引擎作為云服務平臺的價值,就是為上述器官提供一套「生命系統」,從消化到代謝,從呼吸到知覺,確保智能的平穩運行。
具體來說,樂鑫專為AIoT市場供應的的ESP32-S3芯片,將會集成火山引擎的RTC能力,內置一套「即插即用」的大模型語音交互模組,把端到端的響應延遲壓到可在1s以內,還能靈敏識別用戶的打斷意圖,還原人機(大模型)之間的真人感對話。
直接調用豆包大模型后,還能獲得最新的多模態交互技術,讓潮玩等AI硬件可以「看到」甚至「察覺」用戶的情緒,可以持續與AI持續對話,不用「一按一問」。
隨著前沿技術的溢出,硬件消費品可能到了最合適的下場時機,互聯網產業上游都在致力于提供一站式保姆服務,萬事俱備,只欠產品。
加入這場「硬件+對話式AI」盛宴的潮玩品牌ToyCity,是一家典型的制造業廠商,前身曾是東莞數千家玩具代工廠里的一員,為高達、米老鼠、變形金剛等一線玩具品牌生產組件。
2020年,創始人鄭波決定開創自己的設計師玩具品牌,這也是過去十幾年來并不少見的,從中國制造到中國智造的產業升級敘事。
在分享環節,鄭波拿出了ToyCity旗下最成功的原創IP「耙老師」,認為這只在潮玩圈里家喻戶曉的熊貓非常適合成為公司史上第一代AI潮玩的形象,可愛無害,柔軟可捏,情緒價值拉滿。
在鄭波看來,他看好AI潮玩迎來普及化的機會,是基于專業,而這里的專業,指的不只是ToyCity的設計能力,還包括專業的芯片、模型和對話技術,一切的水到渠成,都取決于各方都把自己的專業打磨到了可以直面市場的程度。
和ToyCity一起「入伙」的,還有新興的潮玩品牌FoloToy,曾以對兒童玩具火火兔的AI化改造一夜成名,以及面向年輕女性市場的珞博智能、為普通人打造賽博伙伴的魂伴科技,它們的共同點在于,相信潮玩的陪伴價值,會在原子化的未來社會里被無限放大。
比如要想實現魂伴科技的愿景,就對交互技術有著極高要求,AI不應該止步于有問必答的工具人,更應該充當打破次元壁的個人CP,它甚至可以笨一點,需要人的關懷和陪伴,雙向輸出情緒價值,讓AI和人性一起成長。
在魂伴科技的使命里,「復活」人們耳熟能詳的那些經典IP,是最有價值的鏈條所在,讓分院帽、寶可夢、紅小豆這些可被抱在懷里的柔軟玩具,成為像影視劇里表現出來的,可以不分晝夜的陪在用戶身邊,隨時回應情感需求,在這樣的時刻,市場對于玩具的估值和期待,將得到徹底改寫。
為了證明自身的存在不是孤獨的,人類可以制作出經過10億年都不會腐朽的金唱片,讓旅行者號探測器帶著它飛向宇宙深空,而在不需要遠離地球的另一條技術線上,以造物主的身份創造出數字化的同類,也能抵達同樣的終岸。
而且,這也不是局部的認知,而是全球的共識。
今年8月,OpenAI投資了一家不起眼的初創公司Heeyo,其產品就是利用大模型打造兒童的數字玩伴,由哈佛和斯坦福的心理學家參與設計,可以提供早期教育的定制化服務。
即使是在「少子化」的日本,玩具市場在過去一年的增長,依然保持在7.1%的高位,無論是兒童還是成人,都在對抗孤獨這件事情上,有著強烈的需求意志。
玩具的AI化,是在功能性和娛樂性的基礎上,把那些「無用之物」變成了賽博時代的生命體,并將另一個數量級的陪伴市場嫁接過來,雖然很難估量交叉之后的產值,但讓從業者燃起興奮,是毋庸置疑的。
就像Google Pixel的存在意義是給各家Android手機廠商「打樣」,火山引擎今年中秋定制的毛絨玩具「顯眼包」,也給AI+硬件這條賽道,做了一次很有意思的啟蒙示范。
在二手平臺,「顯眼包」的交易價格已經上漲到了300-500塊錢不等,這個萌翻眾人的火山擬人玩偶,以其「體形雖小,智慧俱全」的對話體驗,在沒有量產計劃的情況下,依然火出圈了。
或者說,卷模型的事情,就交給大廠們去砸錢,站在制造業大國的路徑上,高度成熟的供應鏈資源,是不應該被浪費的,最難的技術鏈打通之后,壓力就來到了最需要創意和情感的消費級市場。
根據第三方招聘平臺的數據,AI的大浪襲來,再度復興了產品經理這個古典職業,在國內新經濟行業今年的新發崗位數量上排名第一,新聞里的AI隔三差五就出王炸,普通人的感知卻長期偏弱,中間橫亙的深邃鴻溝,需要更多的大眾向產品來填平。
不只是玩具,在廣義的AIoT市場里,萬物的感知系統一定會越來越強,未來所有的生活場景都離不開軟件,而軟件則生長在云設施上,從支持人和物的對話開始,火山引擎的歷史使命,也是從萬物的IT化,到萬物的AI化。
俄亥俄州的曼斯菲爾德紀念館后來收藏了Elektro的遺骸,配上的文字充滿深意:「每天都有改變歷史的發明被扔進垃圾桶里。」
而在今天,所有投身AI賽道的建造者,都有機會親手把科幻電影里的未來實現在近在咫尺的前方,怎么看,這都是一件高燃的事情。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.