中信出版社 投稿
量子位 | 公眾號 QbitAI
“10年后,機器人將可能比人都多,會陸續進入工廠、社會,最終形態是進入家庭。未來每個人、每個家庭都有機器人。”
這樣的預言,來自清華大學智能產業研究院(AIR)院長張亞勤。
在其新書《智能涌現》中,基于數十年對AI的思考與實踐,從他領導下AIR研究院正在推進的三大方向——多模態大模型、自動駕駛和生物智能出發,張亞勤還給出了更多對AI技術演進方向的長期預判,包括:
- 我們經歷了“數字化1.0”和“2.0”,目前正經歷著向“數字化3.0”的升維躍遷——從“小模型”到“大模型”、從“單模態”到“多模態”、從“數字智能”到“物理智能”。
- 未來的發展方向將是智能+X(AI+X),即把日漸強大的AI能力投射到千行百業。“X”既是無限可能的產業,也是無限產業的可能。
- 這場變革沒有旁觀者,全球80億人都已置身其中。
總結起來,對于AI技術的未來發展方向與突破路徑,張亞勤做了以下展望:
- AI大模型的五大演進趨勢
- AI技術進一步發展的五個觀點
- 自動駕駛未來發展的五大趨勢
AI大模型的五個發展方向
AI大模型作為數字化3.0的重要基石,其發展將決定未來技術攀升的高度與覆蓋的廣度。張亞勤眼中,未來AI大模型架構的關鍵發展方向如下:
- 多模態智能:將帶來全面的、具有深度的智能分析。結合語言、文字、圖片、視頻、激光雷達點云、3D結構信息、4D時空信息及生物信息,實現多尺度、跨模態的智能感知、決策和生成。
- 自主智能:將帶來個性化的智能體。將大模型作為一種工具,開發出能夠自主規劃任務、編寫代碼、調用插件、優化路徑的智能體,實現高度自主智能,可自我迭代、升級和優化。
- 邊緣智能:將帶來高效率、低功耗、低成本、低延時的邊緣計算網絡。將大模型部署到邊緣設備端,如新一代AI PC(人工智能電腦)、新一代Intelligent Phone(智能電話)、新一代Intelligent Home(智能家庭,包括TV),大幅提升處理速度和相應的效能表現,從而實現邊緣智能。
- 物理智能:將帶來更加先進的自動駕駛車輛、機器人等。當下大模型正在被應用于無人車、無人機、機器人、工廠、交通、通信、電網和電站以及其他物理基礎設施,以提升各類設備、設施的自動化與智能化水平。
- 生物智能:將帶來生命健康、腦機交互、醫療機器人的突破,將大模型應用到人腦、生命體、生物體中,實現AI與生物體聯結的生物智能,并最終迎來信息智能、物理智能與生物智能的融合。
關于AI技術進一步發展的五個觀點
1.大模型和生成式人工智能是未來十年的主流技術與產業路線
大模型(GPT-4o、ChatGPT-o1、BERT等)和生成式人工智能將成為今后10年內的創新主軸與連鎖變革的導火索。
2.基礎大模型+垂直大模型+邊緣模型、開源+商業
基礎大模型將是AI時代的技術底座,與垂直產業模型、邊緣模型共同孵化出新的產業生態。其生態規模將比個人計算機時代大100 倍,比移動互聯網時代大10倍以上。在這個生態中,開源模型將和商業模型并存,為開發者提供靈活的選擇。
3.統一標識(Tokenisation)+規模定律(Scaling Law)
大模型最核心的兩個要素是統一標識和規模定律。統一標識通過將文本和其他類型的數據統一編碼為單元,使模型能夠處理不同形式的輸入。規模定律則揭示了模型規模與性能之間的關系,表明隨著模型參數的增加和數據規模的擴大,模型的表現會顯著提升。
4.需要新的算法體系
與人腦相比,現有算法存在效率低、能耗高的問題,因此需要開發出新的算法體系,包括世界模型、DNA記憶、智能體、強化學習、概率系統和決定系統等,以實現100倍的效率提升。未來五年內可能會在AI技術架構上取得重大突破,當前主流的AI技術框架,如Transformer、Diffusion、AR,可能在未來5年內被新技術顛覆。
5.從大模型走向通用人工智能
預計15 ~ 20年內可實現通用人工智能,并通過新圖靈測試。更進一步的預測:5年內,在信息智能領域,AI對語言、圖像、聲音和視頻的理解、生成等方面通過新圖靈測試;10年內,在物理智能(具身智能)領域,實現大模型在物理環境中的理解與操作能力的大幅提升,通過新圖靈測試;20年內,在生物智能領域,將AI應用于人體、腦機接口、生物體、制藥和生命科學,實現大模型與生物體聯結的生物智能,通過新圖靈測試。
自動駕駛的未來發展
1.自動駕駛是未來五年最重要的物理智能/具身智能應用,有望成為第一個通過新圖靈測試的具身智能系統
在安全性方面,實現完全無人操作的自動駕駛的安全性要比人類駕駛的至少高出10倍,達到人類“好司機”的水平;在人性化體驗方面,通過模仿學習和自主學習,自動駕駛系統將具備更自然的駕駛風格,結合乘客或車主的駕駛習慣,提供更人性化的體驗,達到人類“老司機”的水平。
2.大模型及生成式AI將在提升L4級別自動駕駛系統的泛化能力方面發揮關鍵作用
一是與數據智能相關,過往自動駕駛系統的邊角案例數據不足,大模型及生成式AI可結合真實數據生成高質量的邊角案例數據。
二是與長尾問題相關,生成式AI可有效改善邊角案例中場景仿真、模擬度不足等問題,解決感知領域的長尾問題。
三是與常識推理相關,大模型的推理能力可助力自動駕駛系統理解并應對道路上的各種突發情況,從而提高自動駕駛系統的能力上限。
3.自動駕駛技術將整合多模態傳感器數據,如計算機視覺、激光雷達等,采用端到端的訓練方式,實現云端大模型與車端實時精確模型的協同工作
一是多模態融合。相較人類而言,機器具備多模態感知優勢,可通過融合計算機視覺、激光雷達和其他傳感器數據,使自動駕駛系統更全面細致地感知周圍環境。
二是端到端。以前自動駕駛算法由許多專門針對特定任務的小模型組成,這些小模型各自負責不同的任務。現在,這些小模型可能會被一個統一的端到端的大模型取代。
三是云端與車端協同。云端大模型提供通用性泛化能力,車端模型提供實時精確響應與本地優化部署。云端和車端協同能夠確保駕駛決策兼具泛化性、及時性與準確性。
4.未來的自動駕駛應用將以單車智能為主,“車-路-云”一體協同工作,從而確保安全冗余,輔助智能交通
一方面,每一輛自動駕駛車輛都必須具備獨立且強大的單車智能駕駛能力。
另一方面,通過“車-路-云”一體化,在為自動駕駛提供多重安全冗余保障、提高駕駛安全性的同時,控制、優化交通流量,提升交通效率。
5.2025年,自動駕駛或將迎來“ChatGPT時刻”;2030年,自動駕駛漸成主流
2025年,在一個具備復雜交通環境的大城市,自動駕駛系統將表現出人類“老司機”的水平,這可能極大地激發產業與市場對于自動駕駛的熱情。2030年,自動駕駛車輛將逐漸躋身市場主流,預計屆時會有10%的新車具備L4級別的自動駕駛能力。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.