剛剛,由李飛飛聯合領導的斯坦福大學以人為本人工智能研究所(Stanford HAI)發布了《2025 年人工智能指數報告》(Artificial Intelligence Index Report 2025)。
這份長達 456 多頁的報告是 Stanford HAI 發布的第 8 份 AI Index 研究,追蹤了 2024 年全球人工智能(AI)行業的發展趨勢。
今年的報告新增了對 AI 硬件發展狀況的深入分析、對推理成本的新估算,以及對 AI 出版和專利申請趨勢的分析。他們還引入了有關企業采用負責任的 AI 實踐的最新數據,并擴大了對 AI 在科學和醫學中日益重要作用的報道。
完整報告:
https://hai-production.s3.amazonaws.com/files/hai_ai_index_report_2025.pdf
Stanford HAI 在官方網站上寫道,“AI 對社會的影響從未如此明顯......2025 年指數是我們迄今為止最全面、也是在這一重要時刻發布的報告。”
他們還認為,“AI 將是 21 世紀最具變革性的技術。然而,除非我們精心引導 AI 行業的發展,否則這項技術將難以惠及普羅大眾。”
這份新報告揭示了 2024 年 AI 行業的 12 大趨勢:
1.AI 在苛刻基準上的表現持續提升
2023 年,研究人員引入了新的基準——MMMU、GPQA 和 SWE-bench,以測試高級 AI 系統的極限。僅僅一年后,性能大幅提升:在 MMMU、GPQA 和 SWE-bench 上的得分分別提高了 18.8、48.9 和 67.3 個百分點。在基準測試之外,AI 系統在生成高質量視頻方面也取得了重大進展,在某些場景下,語言模型智能體(language model agents)甚至在有限時間預算的編程任務中超越了人類。
圖|選擇的 Al 指數技術性能基準 vs. 人類表現
2.AI 正越來越多地融入到日常生活中
從醫療保健到交通運輸,AI 正迅速從實驗室走向日常生活。2023 年,FDA 批準了 223 種 AI 醫療設備,而 2015 年僅為 6 種。在道路上,自動駕駛汽車不再是實驗性的:美國最大的運營商之一 Waymo 每周提供超過 15 萬次自動駕駛出行,而百度的經濟型“蘿卜快跑” (Apollo Go)自動駕駛出租車車隊現在已在中國多個城市提供服務。
圖|FDA 批準的 AI 醫療設備數量(1955-2023)
3.企業全力投入 AI,推動投資和使用創歷史新高
2024 年,美國私營部門對 AI 的投資增長到 1091 億美元——幾乎是中國(9.3 億美元)的 12 倍,是英國(4.5 億美元)24 倍。生成式 AI 尤其強勁,全球吸引私營投資 339 億美元——比 2023 年增長 18.7%。AI 的商業應用也在加速:2024 年,78% 的組織報告稱在使用 AI,比前一年增長 55%。同時,越來越多的研究證實,AI 提高了生產力,在大多數情況下,有助于縮小勞動力中的技能差距。
圖|2017-2024 年,表示其所在組織至少在一項職能中使用 AI 的受訪者比例
4.在創造頂級 AI 模型方面,中國正在縮小與美國的差距
2024 年,美國機構推出了 40 個引人注目的 AI 模型,顯著超過中國的 15 個和歐洲的 3 個。雖然美國在數量上保持領先,但中國模型在質量上迅速縮小了差距:在 MMLU 和 HumanEval 等主要基準上的性能差異從 2023 年的兩位數縮小到 2024 年的接近相等。同時,中國在 AI 出版物和專利方面繼續領先。與此同時,模型開發越來越全球化,中東、拉丁美洲和東南亞等地區也推出了引人注目的新模型。
圖|美國頂尖模型與中國頂尖模型在 LMSYS 聊天機器人競技場中的表現
5.負責任的 AI 生態系統不斷發展,但不均衡
人工智能相關事件急劇上升,但在主要工業模型開發者中,標準化的 RAI 評估仍然很少。然而,新的基準如 HELM Safety、AIR-Bench 和 FACTS 為評估事實性和安全性提供了有希望的工具。在公司中,識別 RAI 風險和采取有意義的行動之間存在差距。相比之下,政府表現出更大的緊迫性:2024 年,全球在人工智能治理方面的合作加強,包括經合組織、歐盟、聯合國和非盟在內的組織發布了關注透明度、可信度和其他核心負責任人工智能原則的框架。
圖|已公布的針對熱門基礎模型的安全性和負責任 AI 基準
6. 全球 AI 樂觀情緒上升,但地區間深層次分歧依然存在
在中國(83%)、印度尼西亞(80%)和泰國(77%)等國家的大多數人認為,人工智能產品和服務是利大于弊的。相比之下,加拿大(40%)、美國(39%)和荷蘭(36%)等地的樂觀情緒仍然遠低于其他國家。然而,情緒正在轉變:自 2022 年以來,包括德國(+10%)、法國(+10%)、加拿大(+8%)、英國(+8%)和美國(+4%)在內的幾個先前持懷疑態度的國家,樂觀情緒顯著增長。
圖 | 2022-2024 年,按國家劃分認為“使用 AI 的產品和服務利大于弊”的比例
7.AI 變得更加高效、經濟實惠和易于獲取
由越來越強大的小型模型驅動,在達到 GPT-3.5 水平上的系統推理成本在 2022 年 11 月到 2024 年 10 月間下降了 280 倍。在硬件層面,成本每年下降 30%,而能效每年提高 40%。開放權重模型也在縮小與封閉模型的差距,在某些基準測試中,一年內性能差異從 8%減少到僅 1.7%。這些趨勢共同迅速降低了高級人工智能的門檻。
圖 | 2022-2024 年,在 MMLU 中得分超過 60% 的最小規模 AI 模型
8.各國政府正在加強對 AI 的監管和投資
2024 年,美國聯邦機構出臺了 59 項與 AI 相關的法規,是 2023 年的兩倍多,發布法規的機構數量也是 2023 年的兩倍。在全球范圍內,自 2023 年以來,75 個國家的 AI 立法提及率上升了 21.3%,自 2016 年以來增長了 9 倍。在日益受到關注的同時,各國政府也在進行大規模投資:加拿大承諾投資 24 億美元,中國啟動了 475 億美元的半導體基金,法國承諾投資 1090 億歐元,印度承諾投資 12.5 億美元,沙特阿拉伯則發起了一項 1000 億美元的倡議。
圖 | 部分供應商的頂尖模型在 LSYS 聊天機器人競技場中的表現
9.AI 和計算機科學教育正在擴大,但普及程度仍不夠
如今,已有 2/3 的國家提供或計劃提供 K-12 計算機科學教育,是 2019 年的兩倍,其中非洲和拉丁美洲取得的進展最大。在美國,擁有計算機學士學位的畢業生人數在過去 10 年中增加了 22%。然而,在許多非洲國家,由于電力等基礎設施的不足,獲得計算機學位的機會仍然有限。在美國,81% 的 K-12 計算機科學教師表示,AI 應該成為計算機科學基礎教育的一部分,但只有不到一半的教師認為自己有能力教授 AI。
10.工業界依然一路領先
2024 年,近 90% 的著名人工智能模型來自工業界,高于 2023 年的 60%,而學術界仍然是高引用率研究的首要來源。模型規模持續快速增長——訓練計算每 5 個月翻一番,數據集每 8 個月翻一番,耗電量每年翻一番。然而,性能差距正在縮小:排名第一和第十的模型之間的得分差距在一年內從 11.9% 降至 5.4%,排名前兩位的差距現在僅為 0.7%。前沿領域的競爭越來越激烈。
圖|AlphaFold 3 與用于蛋白質 - 配體對接的基線方法的性能對比
11.AI 因其對科學的影響而斬獲最高榮譽
AI 的重要性與日俱增,這一點從重大科學獎項中就可見一斑:兩項諾貝爾獎表彰了 AI 在深度學習(物理學)和蛋白質折疊(化學)中的應用,而圖靈獎則表彰了 AI 在強化學習方面的開創性貢獻。
圖|PlanBench 基準下正確的實例數量
12.復雜推理仍是一項挑戰
人工智能模型在國際數學奧林匹克競賽問題等任務中表現出色,但在 PlanBench 等復雜推理基準測試中仍然面臨挑戰。即使存在可證明正確的解決方案,它們也常常無法可靠地解決邏輯任務,這限制了它們在精度至關重要的高風險環境中的有效性。
附:來自 AI Index 聯合主任 Yolanda Gil 和 Raymond Perrault 的一封信
隨著人工智能不斷重塑我們的生活、企業界和公共討論,AI Index 將繼續跟蹤其進展--提供一個獨立的、數據驅動的視角,跨越時間和地域,觀察人工智能的發展、應用和影響。
對于人工智能來說,2024 年是多么美好的一年。諾貝爾物理學獎和化學獎,以及因強化學習方面的奠基性工作而獲得的圖靈獎,都體現了對人工智能在推動人類知識進步方面作用的認可。曾經困難重重的圖靈測試已不再被視為一個難以挑戰的目標,今天的尖端系統已經超越了它。與此同時,人工智能的應用正以前所未有的速度加速發展,數以百萬計的人們正經常在專業工作和休閑活動中使用人工智能。隨著高性能、低成本和開放模型的普及,人工智能的可及性和影響力必將進一步擴大。
在經歷了短暫的放緩之后,企業對人工智能的投資出現反彈。新近獲得融資的生成式人工智能初創企業數量增加了近兩倍,在經過多年的低迷之后,企業采用人工智能的速度在 2024 年顯著加快。人工智能已從邊緣領域成為商業價值的核心驅動力。
政府也在加大參與力度。政策制定者們不再只是在討論人工智能,而是在投資人工智能。一些國家啟動了價值十億美元的國家人工智能基礎設施計劃,包括擴大能源能力以支持人工智能發展的重大努力。全球協調不斷加強,地方倡議也初具規模。
然而,信任仍是一大挑戰。越來越少的人相信人工智能公司會保護他們的數據,對公平性和偏見的擔憂依然存在。錯誤信息繼續構成風險,尤其是在選舉和深度偽造泛濫的情況下。對此,各國政府正在推進新的監管框架,旨在促進透明度、問責制和公平性。公眾的態度也在轉變。雖然懷疑的態度依然存在,但 2024 年的一項全球調查顯示,人們對人工智能帶來廣泛社會效益的潛力的樂觀態度明顯上升。
人工智能不再只是一個關于可能性的故事,而是一個關于現在正在發生的事情,以及我們如何共同塑造人類未來的故事。
Yolanda Gil、Raymond Perrault
AI Index 聯合主任
https://hai.stanford.edu/ai-index/2025-ai-index-report
整理:錦鯉
如需轉載或投稿,請直接在公眾號內留言
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.