新智元報(bào)道
編輯:編輯部 HYZ
【新智元導(dǎo)讀】AI如何重塑孩子的未來?聽力熊Teeni.AI首席科學(xué)家張馳攜自進(jìn)化智能體AppAgentX重磅亮相,要把AI打造成孩子成長路上的「最佳拍檔」。這不僅是一次技術(shù)革新,更是一場關(guān)于如何培養(yǎng)α世代孩子的深刻思考。
AI自主進(jìn)化的同時(shí),還能成為孩子的「第二大腦」。
最近,AI圈子不太平靜,這不聽力熊Teeni.AI首席科學(xué)家張馳帶著全新升級(jí)AppAgentX強(qiáng)勢亮相。
這款新一代自進(jìn)化手機(jī)智能體,一出場就刷屏了。
它不僅能像人一樣操作手機(jī),還能越用越聰明,堪稱「數(shù)字生產(chǎn)力的核武器」。
早年在騰訊時(shí),張馳提出的AppAgent可以模仿人類點(diǎn)擊、滑動(dòng)等操作,到如今AppAgentX干活學(xué)習(xí)兩不誤,效率直接翻倍。
更厲害的是,AppAgentX還盯上了孩子的學(xué)習(xí)場景。
整理筆記、生成提綱、記憶學(xué)習(xí)習(xí)慣.....,要成為孩子們貼心的助手,學(xué)習(xí)的第二大腦。
不僅如此,張馳聯(lián)手聽力熊Teeni.AI試圖打造一款面向α世代(10后)的全新智能終端,目標(biāo)是讓AI不僅聰明實(shí)用,還能做孩子成長路上的「最佳拍檔」。
這么硬核又貼心的技術(shù),到底是怎么練成的?AppAgentX的「進(jìn)化引擎」里藏著什么秘密?
帶著這些好奇,我們特別采訪了聽力熊Teeni.AI的首席科學(xué)家張馳,聽他聊聊自己和技術(shù)背后的故事,以及他對(duì)10后如何擁抱AI時(shí)代的獨(dú)到看法。
一位搖滾科學(xué)家的誕生
當(dāng)然,首先還要從張馳自己的經(jīng)歷講起。
從小學(xué)開始,張馳就對(duì)電腦非常癡迷。
初中的時(shí)候,自己就做了一個(gè)類似仙劍奇?zhèn)b傳的RPG游戲。
當(dāng)時(shí)他花了幾周時(shí)間,把自己學(xué)校的地圖1:1地重構(gòu)出來,把老師和主任都變成了boss,把食堂變成賣裝備的地方,整個(gè)游戲就是一段校園探險(xiǎn)。
另外,他還做了許多多媒體惡搞視頻,甚至學(xué)習(xí)了很多黑客技術(shù)。
他最為感慨的就是,當(dāng)你接觸一件新事物,又很有熱情的話,做事就會(huì)極有動(dòng)力。
在讀博時(shí),張馳又有了類似的感覺。做研究和孩子學(xué)習(xí)的過程很類似,都是探索一個(gè)全新的事物。
當(dāng)你真正處于巨大的熱情之中,這件事情就可以既辛苦又輕松。
辛苦,就像張馳當(dāng)年做游戲一樣,可以從中午干到晚上三點(diǎn);輕松,是自己看到一件新事物,知道自己有辦法去解決,因而充滿了熱情。
做一件事時(shí),好的習(xí)慣,好的思考方式,會(huì)對(duì)做事的感受有很大的影響。
而無論在小學(xué),還是讀博期間,張馳始終延續(xù)著這種習(xí)慣。
在他看來,小孩子也應(yīng)該培養(yǎng)這種習(xí)慣和熱情,如果不感興趣,沒有熱情,做事就會(huì)非常痛苦,家長也跟著痛苦。
所謂因材施教,就是從價(jià)值、習(xí)慣的角度,去給孩子加以引導(dǎo)。
如今的AI技術(shù)包括文生圖、文生視頻、大語言模型,已經(jīng)非常多,但用怎樣的辦法,能讓小孩子去接觸、去使用呢?
這就是做產(chǎn)品的人,需要去思考的事情。
這里的產(chǎn)品,做的不僅僅是單詞的翻譯、課本的解讀,要真正發(fā)揮AI的價(jià)值,就要把AI作為小孩子思考的一種工具,成為他們的習(xí)慣。
現(xiàn)在,AI可以看作是我們身邊的一種高等智慧,知道它的存在之后,能否用它來提升自己的思考方式。
在將來,會(huì)使用AI的孩子,和不知道AI存在、不會(huì)用AI的孩子,思考方式會(huì)截然不同。
AI的角色可以比喻成計(jì)算機(jī),但影響力會(huì)比計(jì)算機(jī)更大。
作為一個(gè)AI研究者,張馳對(duì)于AI所有領(lǐng)域的發(fā)展都十分感興趣。
他的經(jīng)歷涵蓋了傳統(tǒng)的視覺、多模態(tài)大語言模型到AIGC。
另外,他還在西湖大學(xué)開設(shè)了一門《大模型導(dǎo)論》通識(shí)導(dǎo)論課,希望把AI知識(shí)以大家都能接受的方式傳遞給大家。
讀博期間,張馳做的研究方向是計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí),包括各種監(jiān)督和數(shù)據(jù)的處理算法,離大眾并不近。
但到了騰訊之后,做的東西就開始偏主流,比如生成式AI、AIGC、多模態(tài)大模型和智能體,這些都是現(xiàn)在大眾視野中的AI。
首次在圖形界面中探索智能體
2023年末,還在騰訊的張馳,作為共同一作發(fā)表了多模態(tài)智能體框架App智能體。
他們首先探索了智能體服務(wù)于手機(jī)這種場景下的功能,比如用它去操作一個(gè)軟件,或者去點(diǎn)外賣。
可以說,在圖形界面中做智能體,張馳的團(tuán)隊(duì)是第一個(gè)。
但團(tuán)隊(duì)的目標(biāo),遠(yuǎn)不止于此。
大模型時(shí)代,人機(jī)交互是什么形態(tài)?
在大模型時(shí)代,人機(jī)交互終極形態(tài)顯然不是電腦或者手機(jī)。
如果回顧人機(jī)交互發(fā)展歷程,你便會(huì)發(fā)現(xiàn)一個(gè)很有趣的趨勢:從最初命令行,到后來的圖形用戶界面,再到如今大模型和智能體的興起,每一步都在讓技術(shù)變得更「親民」,門檻更低,體驗(yàn)更自然。
想當(dāng)年,命令行界面必須得是一個(gè)懂代碼、懂指令專業(yè)人士操作。后來,UI出現(xiàn)了,它把復(fù)雜的后臺(tái)操作隱藏起來,變成了我們熟悉的「拖拽」「點(diǎn)擊」形式。
這本質(zhì)上,是一次技術(shù)門檻的降低——普通人不需要理解技術(shù)原理,憑直覺操作就能完成任務(wù)。
而大模型和智能體的出現(xiàn),又把這個(gè)進(jìn)化過程推向了下一步。
這一次,交互的媒介變成了語言,每個(gè)人最熟悉、最自然的表達(dá)方式。
文字/語言成為交互的最新途徑,它不僅讓更加復(fù)雜的功能抽象化,還把「意圖」和「功能」之間的橋梁搭得更牢固。
舉個(gè)栗子,以前點(diǎn)外賣可能需要多步繁瑣的操作:打開APP、選餐廳、挑菜品、下單。現(xiàn)在有了智能體,你只要說一句「我餓了,想吃點(diǎn)東西」,它便能理解你的意圖,甚至還能根據(jù)場景推薦「要不要來份披薩」。
不難看出,這是一個(gè)從命令到UI,再從UI到語言交互的轉(zhuǎn)變。
語言交互讓意圖更清晰、更能更抽象,就連復(fù)雜任務(wù)都能被簡化為一句指令,變成「任務(wù)托管」的形式。
你只需要做的,就是用最直覺的方式——說話或打字,就能搞定一切。這種趨勢的終極目標(biāo),就是讓技術(shù)徹底融入生活,像空氣一樣無感卻又無處不在。
在張馳看來,未來并不會(huì)只有一種交互方式,獨(dú)霸天下。命令行、UI、語言交互,這三種形態(tài)可能會(huì)長期并存,服務(wù)于不同人群。
他舉例稱,命令行依舊是程序員和專業(yè)人士的「專屬」,因?yàn)樗珳?zhǔn)、高效;UI是目前的主流,適用于大多數(shù)人,諸如修圖這類任務(wù),普通人可以用美圖等簡單工具,專業(yè)人則會(huì)用PS等。
而語言交互,未來可能會(huì)讓非專業(yè)需求變得更簡單。比如,我想P一張藝術(shù)照,不用自己手動(dòng)調(diào)參數(shù),只要一句話,智能體就能實(shí)現(xiàn)。
在這種情況下,智能體服務(wù)的是一個(gè)整體的體驗(yàn),通過語音互動(dòng)扮演好一個(gè)賈維斯,一個(gè)什么都能做的超級(jí)助理。
它能做到的絕不僅僅是點(diǎn)外賣,而是成為你的好朋友,好伙伴。
除了跟你交流,它還能傾聽你的想法,給你建議,幫你解決問題,是服務(wù)于整體的一個(gè)目標(biāo)。
張馳和團(tuán)隊(duì)研究智能體之后,覺得不能做一個(gè)僵硬的智能體工作流,而是讓它像人一樣越接觸越聰明,在智力和效率上都能不斷進(jìn)化。
的確,如果只是做一個(gè)能對(duì)話的智能體,其實(shí)很簡單,但要真正把這個(gè)東西做好,可以相當(dāng)復(fù)雜。
舉例來說,如果這個(gè)設(shè)備能記住一天中發(fā)生的事情,整理成一個(gè)長視頻,多模態(tài)能力還能把發(fā)生的事情整理下來作為記憶,給用戶帶來的交互體驗(yàn)將會(huì)完全不一樣。
這時(shí),它就是一個(gè)能真正看到你、了解你的伴侶,而不只是基于對(duì)話需求鍵入一個(gè)query,然而更聰明地回復(fù)你一句話。
在此過程中,就需要去結(jié)合智能體的長記憶和短記憶,并且智能體本身的架構(gòu)也需要能夠進(jìn)化,才讓用戶在使用智能體時(shí)體驗(yàn)越來越好。
技術(shù)有了,那么接下來的問題是,該用在什么方向上呢?
10后,成長在AI爆發(fā)的年代
每個(gè)時(shí)代,都會(huì)有自己的特點(diǎn),而唯一不變的是孩子們對(duì)周遭環(huán)境的好奇。
曾經(jīng)的80后、90后,接觸計(jì)算機(jī)還要穿著鞋套進(jìn)機(jī)房,但如今的小孩卻處在一個(gè)信息大爆炸當(dāng)中,對(duì)于他們而言「環(huán)境」的定義已經(jīng)很不一樣了。
有一次,張馳看到自己的外甥正在學(xué)少兒編程。
首先要學(xué)圖形化編程,然后就是Python這類代碼編程。他們的學(xué)習(xí)方式很枯燥,還是過去那種刷題的模式:在紙上給一個(gè)編程題,然后直接去做。
對(duì)此,張馳感到十分詫異:既然是教編程,不應(yīng)該是先去電腦搭一個(gè)能調(diào)試起來的編程環(huán)境嗎?
因此,張馳給外甥推薦了大語言模型編程環(huán)境,比如用豆包。他建議說,遇到什么題就直接做豆包上問,因?yàn)樗馨汛a解釋得非常清楚,還能把錯(cuò)誤找出來。
果然,這樣做以后,孩子的學(xué)習(xí)效率立刻高了起來。
將AI融入學(xué)習(xí)的過程,本質(zhì)上是一種對(duì)人工智慧的運(yùn)用。有這樣的智慧在身邊,你對(duì)它的邊界也相對(duì)了解,怎樣讓它幫助到自己,就是一門學(xué)問。
這就像智能體的工作流,每個(gè)環(huán)節(jié)負(fù)責(zé)不同子部分的目標(biāo),在更復(fù)雜的多智能體中,則是每個(gè)智能體負(fù)責(zé)一個(gè)子任務(wù)。我們知道這些智慧擅長什么,該怎么讓它們配合好,解決自己的問題。
作為AI從業(yè)者,張馳和自己的同事每天看到各類AI新聞,都會(huì)覺得非常驚喜和興奮,對(duì)于孩子就更是如此了。
他們希望,中國的孩子對(duì)于AI能力的認(rèn)知上,能夠不遜于任何國家的人,也不遜于成年人。
陪伴一個(gè)孩子成長
提到學(xué)習(xí),就不得不說它的一個(gè)副產(chǎn)物——心理問題。
雖然成因千差萬別,有剛剛提到的學(xué)習(xí)壓力,有源于家庭環(huán)境,還有的是性格使然,但解決方法還是有跡可循。
心理醫(yī)生能夠懂得傾聽、設(shè)身處地理解,激發(fā)人的表達(dá)欲望。
同理,智能體產(chǎn)品本質(zhì)上也在做一件類似的事——成為孩子們的「智慧伙伴」「心靈助手」。
對(duì)于α世代孩子們來說,不會(huì)在現(xiàn)實(shí)生活中表達(dá)內(nèi)心。一方面,他們可能缺少傾訴的機(jī)會(huì);另一方面,他們獲取因?yàn)閮?nèi)向,不好意思開口,選擇默默承受。
張馳表示,「聽力熊Teeni.AI智能體提供了一個(gè)安全的交流通道,孩子可以在這個(gè)虛擬空間里暢所欲言,不用擔(dān)心被誤解、表現(xiàn)尷尬。
這種互動(dòng)不僅能緩解情緒,還能讓孩子學(xué)會(huì)表達(dá)和反思。
更重要的是,智能體不僅僅是一個(gè)傾聽者。
它還能在生活、教育、興趣等多個(gè)維度,為孩子們提供幫助。
想象一下,就像「鋼鐵俠」里的賈維斯一樣,你和它聊天時(shí),它能隨時(shí)陪聊;你需要查資料時(shí),它能迅速幫你搞定...
這種「能思考、有執(zhí)行力」的伙伴,不只是功能性工具,更像是一個(gè)貼心的朋友。
當(dāng)然,要讓智能體真正成為孩子們的伙伴,聽力熊Teeni.AI目前仍有許多需要打磨的地方。
比如記憶力,如果孩子昨天向智能體傾訴了一件煩心事,今天再提起時(shí),智能體全然不知那種體驗(yàn)肯定大打折扣。
一個(gè)優(yōu)秀的智能體,應(yīng)該記得你的喜好、習(xí)慣,甚至是你昨天的小情緒,這樣才能讓互動(dòng)更自然、更貼心。
除了記憶,幽默感、機(jī)智、共情能力同樣重要。
孩子可能需要的不只是解決問題,還希望在不開心時(shí)被逗笑,在失落時(shí)被理解。
再有LLM多模態(tài)能力的加持,比如看懂圖片、聽懂語音,便能讓智能體的陪伴更加立體。
張馳表示,我們想要做得更多,比如理解長視頻。一個(gè)孩子一天的經(jīng)歷,可能包含好幾個(gè)小時(shí)的視頻片段,里面有對(duì)話、表情、場景的變化,甚至還有語氣的起伏。
如果智能體能捕捉到這些細(xì)微的情緒,甚至結(jié)合上下文理解他為什么開心、為什么失落,那互動(dòng)就會(huì)更有溫度。
張馳曾在QQ中做過一次調(diào)研,數(shù)據(jù)顯示,小孩和成人中使用產(chǎn)品時(shí),會(huì)呈現(xiàn)出許多不一樣的點(diǎn)。由此也不難得出,孩子們喜歡的產(chǎn)品形態(tài),顯然是和成年人不一樣的。
這些讓他思考:究竟如何做出小孩子最喜歡的產(chǎn)品?
產(chǎn)品,要做成什么樣子的?
雖然如今是技術(shù)大爆炸的時(shí)代,但技術(shù)和用戶、產(chǎn)品之間的gap是需要被克服的。
這就涉及到一個(gè)本質(zhì)問題:做這樣一個(gè)產(chǎn)品,究竟是為誰而做?
選擇合適的技術(shù),再做成合適的產(chǎn)品給用戶,這中間有一條很長的路。期間,需要公司去很好地洞察人性,發(fā)自內(nèi)心、設(shè)身處地地考慮用戶需要。
比如曾經(jīng)一度爆火的Ai Pin,就是一個(gè)炫技的產(chǎn)品,并沒有很好地考慮用戶的需求。
對(duì)于青少年來說,像科大訊飛、學(xué)而思的AI學(xué)習(xí)機(jī)其實(shí)大家都見過很多,但聽力熊Teeni.AI「隨身智能體」這種形態(tài)的產(chǎn)品卻比較少見。
一方面,得益于AI技術(shù)的進(jìn)步,產(chǎn)品的想象力可以更加放飛。另一方面,這也體現(xiàn)了產(chǎn)品的理念——最終,是為了青少年而設(shè)計(jì)的。
產(chǎn)品帶給青少年的,不僅僅是一個(gè)狹義的教育意義,像平板、學(xué)習(xí)機(jī)那樣去教授知識(shí)。
教育更大的目標(biāo),是育人。產(chǎn)品更大的意義,是陪伴一個(gè)孩子成長。這就涉及到了價(jià)值的傳遞、習(xí)慣的培養(yǎng)。
比如,培養(yǎng)一種好奇心驅(qū)動(dòng)的思考方式。這,就是「隨身智能體」和其他產(chǎn)品的最大差異。
在產(chǎn)品設(shè)計(jì)上,聽力熊Teeni.AI充分考慮了孩子的天性:他們不一定喜歡過去很傳統(tǒng)的讀文字、讀書,而是天性喜歡去玩、去探索。
從功能上講,張馳希望,使用聽力熊Teeni.AI產(chǎn)品的青少年能接觸到最前沿的AI技術(shù)。因此,產(chǎn)品需要極有生命力,不斷更新內(nèi)容。
這種情況下,能有一個(gè)類似賈維斯或者哆啦A夢的虛擬伙伴陪在身邊學(xué)習(xí)、解答問題,往往是孩子最能接受的一種形態(tài)。
DeepSeek,讓更多人能夠接觸AI
如今,DeepSeek的出現(xiàn),不僅讓人們見識(shí)到了現(xiàn)階段AI的強(qiáng)大之處,也希望主動(dòng)去擁抱AI;而且也讓讓各家公司都能夠借助AI加速迭代產(chǎn)品,也包括教育硬件類的公司。
但是,張馳再次強(qiáng)調(diào),「技術(shù)和產(chǎn)品,從來都不是強(qiáng)綁定的關(guān)系」。
若想做好一件產(chǎn)品,真正需要的是將技術(shù)需求和產(chǎn)品完美融合,只有這樣的公司最后才能成功。
接入大模型,就能讓AI教育硬件脫胎換骨嗎?
從用戶體驗(yàn)上,肯定會(huì)有提升,比如翻譯更準(zhǔn)確,理解意圖更精準(zhǔn),輸出結(jié)果更優(yōu)質(zhì)等等。
但問題在于,這種技術(shù)能力的進(jìn)步,能不能真正轉(zhuǎn)化為產(chǎn)品競爭力?答案是,不一定。
技術(shù)只是工具,產(chǎn)品才是用戶最終接觸的形態(tài)。如何把LLM智慧變成用戶手中的價(jià)值,這中間的轉(zhuǎn)化過程,才是決定成敗的關(guān)鍵。
不同公司在這方面的表現(xiàn),往往會(huì)拉開差距。
也就是說,一家公司如果過去在LLM領(lǐng)域積累了豐富的經(jīng)驗(yàn),同時(shí)有對(duì)目標(biāo)用戶群體有深刻的洞察,那么他們很有可能做出更貼合需求的產(chǎn)品。
十年磨一劍,智能體全新探索
十年磨一劍的聽力熊Teeni.AI團(tuán)隊(duì),始終深耕人工智能硬件領(lǐng)域。
從2015年推出首款C端家庭陪伴機(jī)器人「布丁s」,到2017年為B端市場提供千萬級(jí)出貨量的ROS.AI解決方案,再到2020年打磨出顛覆行業(yè)的聽力熊便攜終端——這支「爆品制造機(jī)」從未停止進(jìn)化。
2025年2月,搭載哪吒AI角色的聽力熊終端實(shí)現(xiàn)28億token大模型調(diào)用量,登頂國內(nèi)青少年硬件賽道。
「做適合青少年的、專業(yè)的、專屬的AI產(chǎn)品」,團(tuán)隊(duì)的初心在大模型時(shí)代愈發(fā)堅(jiān)定。
隨著張馳的加入,聽力熊與AI的綁定從「技術(shù)加持」升維為「基因融合」——與其說用AI升級(jí)硬件,不如說以硬件為容器,將前沿AI技術(shù)具象化為可感知的陪伴。
據(jù)透露,聽力熊新一代產(chǎn)品的設(shè)計(jì)初衷,是打造賈維斯般的智能伙伴。相較專注聽力訓(xùn)練、英語學(xué)習(xí)等單一場景的T系列「功能機(jī)」,新一代產(chǎn)品開啟了智能體的全新維度,目標(biāo)是與電腦、相機(jī)一樣,自然融入孩子的日常生活。
張馳對(duì)其愿景是,幫助孩子建立一種對(duì)AI的態(tài)度,它可以是你依賴的伙伴,但最終的價(jià)值,還是由你自己創(chuàng)造。
這一點(diǎn),對(duì)于α世代孩子尤其重要,因?yàn)樗麄儙缀跏菑?開始構(gòu)建對(duì)AI的認(rèn)知。
「我們不是在教他們『用』AI,而是在教他們?nèi)绾卧贏I時(shí)代下,思考、表達(dá)和生活。
可以說,這個(gè)產(chǎn)品是一個(gè)打開AIGC前沿的大門,把最新的技術(shù)帶給孩子們。
AI的意義,被低估了
在采訪最后,張馳表示,AI的意義如今被低估了。
有很多人喜歡把AI的革命比作計(jì)算機(jī)的革命,但前者顯然意義更大。因?yàn)橛?jì)算機(jī)革命的周期很長,如今很多年長的領(lǐng)導(dǎo)人還不會(huì)用計(jì)算機(jī),但他們在工作中并沒有太大的困難。
但AI對(duì)人們生活的影響,顯然會(huì)高很多。因?yàn)樗举|(zhì)上是一種智慧,但人的智慧是有限的。
當(dāng)你身邊有一個(gè)更智慧的「人」幫你解決問題、思考問題,會(huì)讓人和人的差距變得非常大,而到了小孩子身上,這個(gè)問題就會(huì)被放大更多。
因此,AI的意義,應(yīng)該從孩子對(duì)世界的認(rèn)知上就開始強(qiáng)調(diào)。
如果在未來幾年,AGI真的能很輕松地打敗人類,人和人的差距就會(huì)更明顯。
因此張馳發(fā)自內(nèi)心地希望,不僅是自己公司的產(chǎn)品,全社會(huì)的產(chǎn)品都能讓中國的孩子不落后于世界,去更早地接觸AI。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.