99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

AI重塑手機,vivo的“非顛覆式”創新答卷

0
分享至


在vivo開發者大會(VDC)開幕的幾個月前,vivo的研發團隊在深圳福田的辦公室測試了一項新功能:讓手機內置的AI智能體像人一樣訂餐廳。

和大部分AI應用不同,研發團隊設計了一個大膽的構想:用戶通過文本或語音下達指令,AI可以像真實用戶一樣,自己打開App,搜索并選擇對應的餐廳,自行撥打餐廳電話訂位。整個流程在用戶看來,就像有一只看不見的手在操作手機。

一旦這個設想可以實現,理論上人在手機上能完成的操作,都可以交給AI完成。

vivo的思路是從訂位和點外賣這兩項相對基礎且高頻的場景開始。在點咖啡這個功能中,AI像人一樣熟練的進入了商家小程序,按照指令選擇了對應的杯型,甚至識別并關閉了促銷廣告。

這次技術探索,在今年10月10號召開的vivo開發者大會上首次亮相。

和去年一樣,兩屆開發者大會的主題都是“同心同行”,但內涵卻有所差異。去年vivo發布了自研的藍心大模型與藍河操作系統,第一次將AI兵工廠中的軍火集中批量展示。一年之后,vivo打算直觀的向開發者與消費者解釋,復雜的參數和代碼帶來了什么改變。

這是vivo嘗試用AI重構用戶體驗的365天,也是他們重新理解AI的365天。

重建規則

和許多被AlphaGo驚醒的公司一樣,vivo對AI的大規模投入始于2017年。

周圍是這項戰略最主要的執行者,他在vivo工作了15年。2017年,周圍受命帶隊vivo的人工智能研發團隊,在這個團隊組建前,他和其他高管走訪了國內外各大高校,意識到學術界在人工智能上的探索,正在孕育產業化的想象空間。

ChatGPT出現后,vivo對生成式AI的投資更加堅決。相比新技術的開發,手機廠商更注重如何將新技術應用于終端產品,并帶來更好的用戶體驗和附加值。ChatGPT像AlphaGo一樣,直觀的展現出了大模型的應用前景。


vivo的副總裁、OS產品副總裁、AI全球研究院院長周圍

和研究機構不同,vivo是一家消費電子公司,周圍則是硬件公司中軟件團隊的負責人。因此,他需要思考的不是單獨的應用或研發項目,而是AI在公司戰略中的定位,以及具體的執行策略。

在“過飽和投入”的原則下,vivo以大模型為中心,開始迅速補齊自身在底層技術環節的短板,代表性成果是去年VDC上一口氣發布的三個參數量級,一共五款大模型。


2023年,vivo公布自研通用大模型矩陣“藍心大模型”

然而,伴隨自研大模型在各種榜單上頻頻刷臉,模型參數無止境的擴張,坐擁數十篇頂級期刊論文和數百項發明專利研發團隊,卻一度陷入迷茫。

同樣的尷尬也發生在產業界,經歷了如火如荼的百模大戰,社會輿論對生成式AI的熱情似乎迅速冷卻。而身為AI落地最核心的終端載體,AI手機的革命性也許久停留在精心剪輯和渲染的演示視頻。

2023年的VDC結束后,vivo的AI團隊曾做了長時間的用戶調研,希望搞清楚用戶需要什么樣的AI功能,但答案不外乎兩類:一種是用戶自己也說不清楚;另一種是過于超前,放在五十年后都屬于科幻電影的素材。

作為團隊負責人,周圍帶隊技術攻堅的履歷無可指摘,但面對難以量化極度朦朧的用戶需求,他也需要反復思考。

一個關鍵問題是,除了少數經典的釘子戶機型,市場上大部分手機,實際上都是貨真價實的“AI手機”。

最典型的例子是蘋果在2019年推出Deep Fusion:用戶按下快門鍵拍照時,iPhone其實在短時間內連拍了9張照片,算法會在不到1秒的時間里,將這些照片“像素對像素”的精確疊合,最終合成一張最優質照片。

從2017年的A11處理器集成NPU(Neural network Processing Unit)模塊開始,AI就迅速介入了手機中大大小小的功能服務,從翻譯、修圖到相冊檢索與推薦算法,只要不是太老的手機,基本都擁有從軟件到硬件完整的AI功能。


A11處理器中首次出現了NPU

在這個背景下,如果要讓AI脫離對原有功能本身的強化,而是塑造全新的改變,需要的是研發、組織和管理體系的重整。

2022年之前,vivo的研發思路是以功能性模塊為基本單元,將分散在操作系統的各個功能分門別類進行開發。比如開發文檔掃描、證件掃描、文字提取等功能,然后集成在相機、相冊等系統功能里。第三方開發者也可以通過接口,開發各種功能性模塊。

而當大模型以一種通用技術底層的形態出現,周圍意識到類似“項目制”的研發策略已經難以為繼,團隊需要的是一個與大模型適配的“規則”,并在規則的框架下完成各種技術實現。

按照周圍的說法,在沒有明確應用方向的前提下,那就先給高樓打好地基,修成什么樣再說。

如果說以藍心大模型為代表的一系列底層技術是高樓的地基,那么去年VDC結束的時候,他就應該認真思考,高樓應該修成什么樣了。

理解直覺,重構交互

開發者大會上,周圍展示了OriginOS 5新的交互方式:用戶長按屏幕會喚醒AI助手,在屏幕上圈選任意的內容,AI就會開始識別選定內容。用戶將圈定內容拖動,AI會根據目標應用提供下一步服務。


OriginOS 5中,AI接入拖拽交互

按壓、圈選、拖放是智能機時代用戶早已習慣的交互邏輯,設備會根據預先設定好的交互邏輯完成對應的操作。但多模態大模型可以通過訓練理解用戶各種動作背后的意圖,周圍的目標是基于大模型的能力,構建一種新的交互規則。

vivo的企業文化中,有一條是虛心學習其他公司的長處,蘋果之類的優秀公司,一直是其內部反復研究的對象。

iPhone并不是第一個采用觸摸屏的手機,但它與功能機的差別在于,后者只是將物理按鍵的交互邏輯原封不動的轉移到了觸摸屏上。而蘋果基于觸摸這個交互方式,重新定義了一套交互邏輯。

舉例來說,帶有觸摸屏的功能機在執行返回操作時,只是在屏幕上添加了一個可以觸摸的返回按鈕,但iPhone設計了滑動返回的交互邏輯。配合其他的零部件,開發者基于全新的交互邏輯,創造了水果忍者和憤怒的小鳥。

周圍把基于新技術構建的交互邏輯稱為“規則”,他提煉出的關鍵詞是“直覺”。


vivo在多年前組建了一個算法團隊,試圖通過算法讓用戶拍出來的照片更美。但“美”這個字難倒了整座辦公樓的算法工程師——什么是美?

把飄渺的詞匯變成可以感知的產品是消費電子公司的核心工作,vivo內部“影像認知部”的成立很大程度來源于此,這個部門專門負責定義影像的“美”,接著由算法或硬件部門把這種審美技術實現,成為消費者可以使用的功能。

在AI團隊的搭建過程中,vivo遇到了類似的問題——作為負責人,周圍需要把復雜的用戶需求和設計藍圖高度抽象,同時要確保抽象的概念能準確指引團隊的研發流程。

除了AI,周圍還負責Origin OS的開發和迭代,過去幾年,他對系統研發的提出的一個詞語是“流暢”,這個詞又可以衍生出刷新率、圖層等一系列技術指標,指引團隊的開發。

過去一年里,周圍想了很多詞來概括自己腦海中關于AI那個不太清晰的概念,比如自然、優雅等等,但他認為最貼切的是“直覺”,即“這件事應該是這樣的”——手指收攏圖像會縮小,手指張開頁面會放大。

依照這個原則,vivo的開發團隊想到了一個方向:AI可以像人一樣操作手機,像人一樣打開App,選擇菜單和功能,而不是通過各種各樣的后臺接口。

讓AI幫用戶買咖啡,是研發團隊在這個方向指引下一次大膽的探索。周圍稱之為“手機智能體”,相比原有功能的強化,手機智能體的核心是基于用戶的習慣和意圖,可以主動進行識別與操作。

在開發者大會的演講中,周圍把手機智能體和自動駕駛類比,兩者的確存在相同之處。

特斯拉對純視覺技術路線的執著固然有成本的考量,但依照馬斯克頻繁念叨的第一性原理,既然人類駕駛員依靠視覺就能判斷距離,那么只要有足夠大的訓練量,算法也可以依靠攝像頭作出判斷,不需要雷達的輔助。

這種相似性反映也啟發了vivo的思路:利用AI創造新的交互方式,但這種交互沒有破壞用戶原有的、早已習慣的交互邏輯。

2019年,周圍曾提出了一個大膽的設想:讓AI成為真正的智能助手,扮演手機和App之間的一個重要角色。這個思路與后來AGI的構想相當類似,只是在當時過于超前。

但今天,vivo離他們的目標已經非常接近了。

挖足夠深的地基

去年7月,《紐約時報》曾探訪谷歌實驗室, 完整記錄了基于RT-2模型的機器人智能閃現的瞬間:

桌子上放著恐龍、鯨魚、獅子三個塑料玩具,工程師讓單臂機器人“撿起滅絕的動物”,機器人拿起了恐龍。這里的難點不是機器人的抓取動作,而是它能識別三種動物,還能理解什么是“滅絕的動物”。


基于RT-2模型的Google機器人

周圍將AI帶給手機最大的改變概括為“系統記憶能力”,即AI不僅能執行用戶的指令,還可以理解用戶的行為。在今年開發者大會現場,他舉了一個與谷歌機器人類似的例子:

用戶可以對AI助手說,找出去年我和小貝在北京環球影城的照片,祝他生日快樂。

核心問題在于,AI需要理解“北京”和“環球影城”的含義,并在相冊中準確的識別,而不是檢索手機中文件名包含“北京”和“環球影城”兩個關鍵詞的文件。同樣,AI還要理解“小貝”是誰,把照片和通訊錄里的號碼對應起來。


OriginOS 5中,由AI完成的圖像記憶

這些設想伴隨多模態大模型的出現已經不是問題,但對一家手機公司來說,把論文和代碼變成可以使用的功能遠沒有那么簡單。

首當其沖的是隱私問題——模型會讀取用戶的隱私數據,意味著關鍵數據和算法無法在云端處理,繼而對手機性能提出了挑戰,也是vivo“藍科技”矩陣中多個技術方案誕生的契機。

2021年,vivo與聯發科達成戰略級技術合作,對vivo自研影像芯片V1和聯發科當時的旗艦移動處理器天璣9000測試聯調,目的在于提高兩者的兼容性,最大程度釋放兩者性能。

隨后,雙方的合作成為了“藍科技”板塊之一“藍晶芯片技術棧”,研發重心也轉向了以更強的算力和更低的功耗,并在軟件層面提高對算力的利用效率,保證大模型在終端的正常運作。

與之對應,vivo通過藍河操作系統,讓大模型融入系統的底層設計中,實現從應用到工具鏈的全方位突破。


今年的開發者大會,vivo公布藍河操作系統2

今年的開發者大會上,vivo發布了新的30億參數藍心端側大模型3B,思路依然是基于30億參數這個端側大模型“黃金尺寸”,在確保隱私安全的前提下,保證終端的用戶體驗。

暫時拋開“藍晶”、“藍心”、“藍河”這些傳播用途的修飾,vivo呈現出的是以一種系統性的軟硬件研發能力,來指引各個技術條線的研發。


何為系統性的軟硬件結合?即通過軟硬件的協同能力,提高產品真實的體驗而非單純的參數。

2020年之前,手機品牌的技術投資趨勢,大多體現為借助零部件更新增加產品賣點。大多數品牌的研發策略都開始向體系化的創新轉變。

舉例來說,當相機像素堆到5000萬甚至1億以上,對于拍照體驗的改善會快速遞減。此時,產品開發思路將注意力轉向算法,通過降低快門延遲、加快成像速度等提高拍照性能。邊際遞減同樣出現在快充場景,品牌們不約而同掏出曾經的120W快充,反而借助軟件的運行策略的優化來降低功耗。

在開發者大會上亮相的OriginOS 5、藍河操作系統2和升級后的藍心大模型,也是這一轉變的體現。


vivo的“藍科技”矩陣

一座5層的建筑,需要一場誓師大會和工程師們大干三個月,但一幢百層的高樓,起決定作用的是地基的深度。

2024年的開發者大會上,vivo展示了這座大廈第一層的模樣。

尾聲

開發者大會開始前,周圍曾提醒同事,團隊對“手機智能體”的定位不是顛覆或革命,而是一種“探索”。

產業界喜歡把技術創新的長期主義形容為馬拉松,其實不完全準確。因為馬拉松有規劃完整的路線和清晰明確的終點,但創新往往既無線路可尋,也沒有明確的目標以供參考。

長期主義是vivo管理層很多決策的出發點,他們同時創造了一個非常vivo特色,也更貼切的詞匯:埋頭種因。

在無法預知終點的長跑中,大部分可量化的目標都沒有意義。而大多數看似橫空出世的創新,往往都是在反復的探索中,一點點描摹出來的。

全文完,感謝您的耐心閱讀。

作者:李墨天

編輯:張澤一

視覺設計:疏睿

責任編輯:李墨天


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
《我的后半生》這個美籍華人戲混子別演了,回漂亮國吧

《我的后半生》這個美籍華人戲混子別演了,回漂亮國吧

游古史
2025-04-15 09:40:59
中美貿易戰又再升級!4月15日,深夜爆出的三大消息持續發酵!

中美貿易戰又再升級!4月15日,深夜爆出的三大消息持續發酵!

風口招財豬
2025-04-15 00:43:33
特朗普考慮部分汽車關稅豁免

特朗普考慮部分汽車關稅豁免

參考消息
2025-04-15 11:35:05
蔡司展示飛機內透明玻璃全息顯示原型,相關技術已被用于航天任務

蔡司展示飛機內透明玻璃全息顯示原型,相關技術已被用于航天任務

IT之家
2025-04-14 14:52:33
剛剛,貝索斯發射火箭,將未婚妻成功送上太空!同行還有樂壇天后“水果姐”,6位成員均為女性

剛剛,貝索斯發射火箭,將未婚妻成功送上太空!同行還有樂壇天后“水果姐”,6位成員均為女性

每日經濟新聞
2025-04-14 23:13:11
海豚語言被谷歌模型破譯!實現跨物種交流,哈薩比斯:下一個是狗

海豚語言被谷歌模型破譯!實現跨物種交流,哈薩比斯:下一個是狗

量子位
2025-04-15 09:57:15
勇士沖擊附加賽首勝!庫里巴特勒全力出擊,贏球首輪對決火箭

勇士沖擊附加賽首勝!庫里巴特勒全力出擊,贏球首輪對決火箭

體壇小李
2025-04-15 10:56:13
歐盟被迫取消中國電車關稅

歐盟被迫取消中國電車關稅

后視鏡里de未來
2025-04-14 09:58:05
“內鬼”陳笑波被逮捕,曾泄露工作秘密

“內鬼”陳笑波被逮捕,曾泄露工作秘密

政知新媒體
2025-04-15 10:39:19
數十名俄軍吞槍自殺,多名女兵被炸死!用槍爆頭會有痛苦嗎?

數十名俄軍吞槍自殺,多名女兵被炸死!用槍爆頭會有痛苦嗎?

軍武次位面
2025-04-14 15:09:14
曝昔日“情人節帶男友結扎”的女子懷孕,稱要當單親媽媽,讓孩子隨狗姓

曝昔日“情人節帶男友結扎”的女子懷孕,稱要當單親媽媽,讓孩子隨狗姓

不掉線電波
2025-04-14 19:16:34
劉亦菲素顏出鏡,與路人無差別,網友:這才是真實的狀態

劉亦菲素顏出鏡,與路人無差別,網友:這才是真實的狀態

草莓解說體育
2025-04-15 00:55:08
中國孩子的第一個玩具,該用點好的了

中國孩子的第一個玩具,該用點好的了

虎嗅APP
2025-04-11 18:33:08
瘋了!網傳一老師冒充家長投訴自己,留作業太多,要求撤換班主任

瘋了!網傳一老師冒充家長投訴自己,留作業太多,要求撤換班主任

火山詩話
2025-04-15 06:22:35
哈啰順風車司機被投訴開特斯拉輔助駕駛睡覺!平臺稱正核查

哈啰順風車司機被投訴開特斯拉輔助駕駛睡覺!平臺稱正核查

南方都市報
2025-04-14 16:03:33
“你不該向一個比你強大20倍的國家開戰,然后希望別人給你導彈”

“你不該向一個比你強大20倍的國家開戰,然后希望別人給你導彈”

觀察者網
2025-04-15 09:20:16
廊坊通報“廣告牌匾禁用紅藍黑”:三河市委主要負責人被免職

廊坊通報“廣告牌匾禁用紅藍黑”:三河市委主要負責人被免職

人民網
2025-04-15 10:45:26
太狠!山西狂勝廣東42分球迷掛標語疑嘲諷對手:接著揍粵接著舞

太狠!山西狂勝廣東42分球迷掛標語疑嘲諷對手:接著揍粵接著舞

林小湜體育頻道
2025-04-15 01:16:16
信息量極大!三河某領導曾用紅旗解釋招牌“禁紅”:咱們已經過了那個燥熱的年代

信息量極大!三河某領導曾用紅旗解釋招牌“禁紅”:咱們已經過了那個燥熱的年代

小蘿卜絲
2025-04-15 09:16:23
千位名醫總結:最簡單的養生法,竟是從1數到10

千位名醫總結:最簡單的養生法,竟是從1數到10

中國藝術家
2025-04-14 05:26:20
2025-04-15 13:12:49
飯統戴老板 incentive-icons
飯統戴老板
有趣且深度的硬核財經
269文章數 23657關注度
往期回顧 全部

數碼要聞

撼訊RX 9070 XT紅魔將推定制背板版本!規格不變

頭條要聞

解職十余名美軍軍官 美國開始對格陵蘭、巴拿馬動手了

頭條要聞

解職十余名美軍軍官 美國開始對格陵蘭、巴拿馬動手了

體育要聞

父母是臺灣移民!女林書豪被WNBA球隊選中

娛樂要聞

專訪 | 王安宇:角色是為觀眾服務的

財經要聞

特朗普為何攪亂貿易?謎題即將解開

科技要聞

OpenAI放大招!GPT-4.1上線,編程戰力全開

汽車要聞

轉型中的"穩健派" 一汽-大眾的智能化突圍路徑

態度原創

家居
旅游
本地
教育
軍事航空

家居要聞

現代本真 展現歸零心態

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

本地新聞

云游湖北|相約安陸,解鎖限定版粉色春天

教育要聞

阿里大文娛集團暑期實習招聘開啟!

軍事要聞

美軍駐格陵蘭島太空基地指揮官遭解職

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 怀化市| 江安县| 鄂尔多斯市| 辰溪县| 勐海县| 重庆市| 南充市| 高雄县| 三都| 全椒县| 敖汉旗| 栖霞市| 神农架林区| 安溪县| 东阿县| 郑州市| 宜宾县| 漳平市| 嫩江县| 桐乡市| 绍兴市| 科尔| 大港区| 娱乐| 彭水| 页游| 湘西| 玉田县| 吉木萨尔县| 鸡泽县| 桂阳县| 乐陵市| 建昌县| 平谷区| 墨玉县| 资阳市| 来凤县| 浙江省| 喀喇沁旗| 大连市| 金秀|