給你半分鐘時間認真思考一個問題:如果有一天家里來一個人形機器人,你是打算開箱把它打開,還是讓它自己敲門進來?
這不是科幻電影里的場景,更不是天方夜譚。也許只要5年時間,這個問題會真實地擺在你面前。
昨天,阿里巴巴集團CEO、阿里云智能集團董事長兼CEO吳泳銘在2024云棲大會上發表主題演講時表示,生成式AI最大的想象力,絕不是在手機屏幕上做一兩個新的超級App,而是接管數字世界,改變物理世界。
“現在每個城市家庭里有一輛或者兩輛車,未來每個家庭可能會有兩三個機器人,可能是寵物狗、保姆、助理。”
最快一年半
智能體從數字世界走向物理世界
昨天上午,云棲大會主論壇一場關于通往AGI的大模型發展之路的圓桌論壇上,清華大學人工智能研究院副院長、生數科技首席科學家朱軍說,關于AGI(通用人工智能),學術界和產業界一般認為分為L1-L5這五個階段。
L1相當于聊天機器人,就是像ChatGPT可以做很多對話。L2叫推理者,可以做復雜問題的深度思考和推理。L3又叫智能體,AI開始從“數字世界”走向“物理世界”。L4是創新者,它會發現并創造新的東西和知識。到了L5則變成組織者,它可以去協同,或者某種組織方式更高效來運轉。
雖然目前還處于AGI的初級階段,不過今年有三件事讓階躍星辰創始人、CEO姜大昕印象深刻,其中一個便是GPT-4o的發布。
“在GPT-4o之前,大模型是一個個孤立的,比如有像GPT4V這樣的視覺理解模型,有Dalle、Sora這樣的視覺生成模型,還有像Whisper這樣的聲音模型。但是到了4o,這些原本孤立的大模型融合在了一起。”
融合這件事之所以這么重要,是因為物理世界本身就是一個多模態的世界。“多模融合有助于我們更好地為物理世界建模,從而模擬世界。”姜大昕說。
被稱為天才少年的楊植麟是月之暗面Kimi創始人,成立至今,月之暗面經歷了4輪融資,成為國內大模型創業公司中估值最高的一家。
楊植麟說,AI不僅在智商上有了很大提升,橫向來看也有了很多新的突破。比如從Sora完成文生視頻生成,到最近很多新產品和技術出來,不同模態之間的轉化、交互和生成,變得越來越成熟。
他預測,隨著o1大模型帶來的思考范式的不同,未來在產品形態上有很大變化。“以后的AI,可能不光是思考20秒、40秒,它還要調用各種工具,可能執行的是分鐘級別、小時級別甚至天級別的任務,所以產品形態上會更接近一個人,或接近‘助理’的概念,幫你完成任務。”
AGI從到L1、L2到L3,意味著未來智能體可以更好地做推理規劃,更高效地和環境做交互以及完成人類的復雜任務。那么這個過程還需要多久?
朱軍預測,未來18個月可能比較令人興奮的一個進展,“我希望看到L3已經基本上實現。”
機器人最快5年進入家庭
隨著AI的迅猛發展,也打開了通用機器人這個萬億市場的大門。
在最近的2024 ALL-IN峰會上,特斯拉和美國太空探索技術公司(SpaceX)的首席執行官埃隆·馬斯克預測,未來機器人的數量將遠遠超過人類,達到至少2:1甚至3:1的比例。而早在去年,他曾公開表示,特斯拉未來將以人形機器人為基礎,擎天柱要賣100億臺。
那么機器人大規模走入家庭,到底需要多久?
云棲大會上有一場關于人形機器人的“圖靈時刻”的圓桌上,星動紀元創始人陳建宇,北大-銀河通用具身智能聯合實驗室主任、智源學者王鶴,宇樹科技創始人、CEO王興興以及逐際動力創始人張巍進行了大膽預測。
陳建宇認為,不管是工業還是商用甚至是家用,可能在一兩年內有一些機器人開始進入,并進行簡單工作。
“5年左右,可能是天翻地覆的變化。”對于通用機器人的落地應用,王興興非常樂觀。他預測,最快明年機器人將在一些公益場景或固定場景有商業價值的落地應用,而全球范圍內通用機器人開始應用需要3年左右時間。
“整個的發展節奏,無論是硬件還是軟件,在某種程度上都是超過我自己預計的節奏。”王興興說。
而王鶴給銀河通用定的目標是5年。“在車廠里抱箱子的機器人將達到1萬臺,10年可以安全性達到進入家庭標準,而15年后預計可能會產生千萬乃至大千萬級別的市場。”
這一代是最后一撥
大規模開車的人?
鈦媒體聯合創始人劉湘明經常和同事們開玩笑說,我們這代人可能是最后一撥大規模自己開車的人。
昨天,這個玩笑被“坐實”了。
“從現在到未來的36個月,可以讓我們每一個人在每一個城市都像老司機一樣開車。”昨天“生成式AI重塑自動駕駛”圓桌會上,小鵬汽車董事長、CEO何小鵬這樣預測。
自動駕駛技術最早是從1925年開始開發,豐田從1999年開始開發,谷歌開始的時間是2009年,而百度和小鵬分別是2014年和2017年。
過去的自動駕駛,規則是人類工程師用代碼一個個寫出來的,“一個人無法用規則去面對世界上所有的場景,即使僅僅在開車這一個專業的業務。”何小鵬說,這也導致直到今天自動駕駛沒有規模落地。
不過隨著生成式AI的出現,自動駕駛在過去一年多的時間里看到巨大的機會。今年1月,特斯拉FSD全自動駕駛系統升級到了V12版本,何小鵬體驗后的評價是:“幾乎接近人類司機的駕駛水平。”
NVIDIA全球副總裁、汽車事業部負責人吳新宙,此前在自動駕駛行業工作超過10年,也見證了自動駕駛整個的變化和進展。吳新宙說,大模型已經在互聯網上通過互聯網量級的數據訓練過,它對物理世界的理解已經遠遠超越了汽車駕駛的場景。“有了這樣的通用能力,我們相信自動駕駛可以非常高效地去提高它的上限。”
“我覺得FSD在去年有著長足的進步,以前不管是中國的NGP,還是在海外FSD,都只是一個很基礎的自動輔助駕駛。但FSD用端到端的大模型之后,讓我們都看到了一個更巨大的變化,更擬人、很流暢,是當地的老司機。”
何小鵬預測,一旦當端到端的模型,下限能力在明年會快速提高,下限能力快速提高之后只用兩年,就可以在全球范圍內做到超過L4的標準能力(高度自動駕駛水平)。
文 | 沈積慧
VIEW MORE
@西湖邊的猴子,直面天命 >>
@不死癌癥“狙擊手” >>
@AR眼鏡“孤泳者” >>
@AI“心理咨詢師” >>
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.