一個做生成式 AI 應用的車企
理想汽車在蘋果 App Store 上線的應用程序并不多。作為車輛與生態入口的理想汽車 App,用來控制車內功能和娛樂的理想遙控器,還有一個 to B 端的云端質量預警平臺理想連山,曾經就是理想的全部手機端應用。12 月 27 號,他們上線了一個新 App,“理想同學”。
這個和車端智能語音助理同名的 App,打開后是一個對話框,看上去和我們熟悉的生成式 AI 界面別無二致。當然我們也可以點擊左下角的攝像頭按鈕,這樣可以調用手機攝像頭、結合圖像,與理想同學 App 連續互動。作為 AI 助理,它的一些能力令我感到驚訝,特別是對圖像的識別以及“2D 映射 3D”的空間感知能力,很難不讓人覺得,自己是在用一個專業生成式 AI 團隊的成果……什么?這 App 是新勢力車企做的?
其實吧,也很難再說它的開發者還是“車企”了。理想同學 App 推出的時候,理想剛好收官了連續三天的技術與人物訪談《2024理想AI Talk》。簡而言之,大部分人眼中的理想是以制造新能源(特別是增程電動)家庭用車著稱的新勢力車企,然而在 2025 年開始的五年內,我們可能要見到一個人工智能新星的崛起。
“不做人工智能,我們什么都不是。”
大概在傳統車企一代車的壽命周期,也就是七八年前,我們還認為汽車和人工智能根本找不到多少交集。那時候,汽車界的主題還是電動化,大家對“智能化是下半場”還沒什么感知。不過后來,我們總算對智能化有了足夠的認知。這得感謝一個叫 ChatGPT 的生成式 AI 應用。
ChatGPT 把“大模型”這個詞帶到大家面前,它通過模擬人類的思考方式,加上大規模數據和訓練集群的強大計算能力,最終實現接近人類的信息理解與處理能力。在理想汽車董事長兼 CEO 李想看來,基于大模型的人工智能,將有能力幫助大家實現知識認知和能力的平權,進而改變人的社會和生活。
因此在 ChatGPT 走入大家視野前,理想內部在 2022 年 9 月就確定了將人工智能作為企業重要的發展方向和競爭力來源。接著就有了 2023 年初的內部信,李想希望這個企業在 2030 年成為全球領先的人工智能企業。到那時候,與其說是人工智能讓汽車變得智能,不如說汽車是人工智能的一個入口和載體,是一個“帶輪子的機器人”。
把今天的交通工具,變成以后連接顯示世界與數字世界的“移動橋梁”,顯然還是有不少前期準備工作要做。理想打算用什么方式,將這個愿景變成現實?也許我們可以從理想現在的產品、和產品背后的體系說起。
第一步:建造基座,用好 AI
讓我們回到理想當下的核心產品,也就是汽車。無論是代表汽車智能化的“殺手級應用”智能駕駛,又或者聲量暫時沒那么大但逐漸得到重視的座艙智能,都可以看出理想對人工智能的熱衷程度——智駕領域的端到端+VLM 雙系統架構,理想最先提出構想并應用起來;Mind GPT 是行業第一個車載認知大模型,也是最早一批用上生成式 AI 大模型的智能座艙體系。
這些“首發”和“最早”,背后是理想對于人工智能“基礎設施”的投入。理想每年超過 100 億元的研發投入中,有近一半用在了這些看不見的地方。通過這些投入,理想建立了自研“基座模型”體系,這些模型就是一些通用的 AI 模型底座,如同初入職場的高效能新人一樣,只需加以專業數據和微調的輔助,很快就能成長起來,處理細分領域的專業問題。以自研基座大模型打底,理想得以迅速地在幾個領域形成產品和技術的“最佳實踐”。前面的端到端+VLM 智駕架構、Mind GPT 智能座艙是車主們比較熟悉的。
除了這些,理想還有兩個應用人工智能的領域。一個是理想的智能商業,通過 AI 總結經驗、分析數據的能力,幫助一線零售營銷團隊快速學習復刻“金牌銷售”的溝通技巧,也幫助客戶服務團隊整理和應對用戶 FAQ,減少呼叫中心的坐席壓力。
最后一個板塊是理想的智能工業,一個包含生產管理、質量監控、生產工藝數據等集大成的 AI 平臺,其中通過將生產人員、物料、設備、工藝介入理想 Li-MOS,人工智能可以協助工廠完成更準確的排產計劃、物料運輸、倉庫管理,并且將生產流程內的數據導入大模型,判斷生產質量并分析制造環節相關數據偏移趨勢,在出現品質問題之前發現問題。
甚至在售后階段,人工智能也可以通過故障相關數據的判讀,提前感知故障發生的可能,減少車主發現-排除故障的周期。
進入智能化時代,這些大家平時看不見的軟件、基座模型自研,與硬件技術的自研同樣重要。這一過程中積累的數據,也可以理想的“2030 愿景”打下基礎。
第二步:VLA、理想同學 App 與“具身智能”的新形態
完成了對人工智能研發和應用體系的基本建構,理想接下來要做的事就很清晰了。大模型本身的能力還可以進一步提升,另外,運用大模型的載體也會發生變化。
視覺語言行動模型 VLA 很可能是理想下一階段的主要成果。如果說接下來智能汽車的完全集中式電子架構是下個時代的硬件,那么 VLA 這樣融合語言、視覺(視頻)和動作的多模態一體式大模型就是下個時代的“軟件”。那時候可能沒有所謂的“智駕大模型”“座艙大模型”,一輛車上只有一個統一的“智能體”,就像一個人既可以開車,又可以在同一時間和車上的乘客講故事聊天一樣。VLA 代表著大模型向“靠近人”的方向又走了一大步。
大模型的性能增強到這個程度,人工智能的載體也不會僅限于汽車(畢竟它有這么強的性能,只用于出行場景、出行載具確實浪費)。通過手機、智能家居主控等設備,將這個模型的可用范圍擴展到人們生活的各個空間,也就自然而然了?,F在的理想同學 App 或許就是大模型向外拓展的實驗場景之一。
到那個階段,汽車將成為具身智能的一種主要形式,而說到具身智能,我們第一時間想到的可能還是機器人。根據李想的說法,等到人工智能發展到某一個階段,理想也將“概率上 100%”地去做機器人,但節點將放在 L4 級自動駕駛車輛之后。要等標準化道路場景的自動駕駛實現了,我們才能期待非標準化場景中活躍的理想家政機器人——或者,用李想的話來說,“硅基家人”。
總結
理想將通用人工智能 AGI 的運用分成三個階段。第一階段“增強我的能力”,人工智能輔助人類工作,需要人來監督,因為能力還有些不夠。第二階段是“成為我的助手”,意味著人工智能可以非常接近人類地獨立處理事情、完成任務,這也被李想認為是人工智能的“iPhone 4 時刻”。至于最終目標,則是第三階段“硅基家人”:無限接近人,完成人的工作,甚至保留人的記憶,成為人類社會中的一員。
以當前的技術發展水平,我們正處在努力向第二階段過渡的時期。理想也是一樣,他們也在等待自己的 iPhone 4 時刻。可能中途我們還會經歷硬件的突破,或者需要找到人工智能的新發展范式,但這項技術的魅力,或許就在它的難以預測——誰知道一個 AI 大廠,以前是造車的呢?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.