網易首頁 > 網易號 > 正文申請入駐

剛剛，李飛飛團隊發布《2025年人工智能指數報告》：12大趨勢證明，AI不再只是關于可能性的故事

2025-04-08 10:13:07　來源: 學術頭條

北京舉報

分享至

剛剛，由李飛飛聯合領導的斯坦福大學以人為本人工智能研究所（Stanford HAI）發布了《2025 年人工智能指數報告》（Artificial Intelligence Index Report 2025）。

這份長達 456 多頁的報告是 Stanford HAI 發布的第 8 份 AI Index 研究，追蹤了 2024 年全球人工智能（AI）行業的發展趨勢。

今年的報告新增了對 AI 硬件發展狀況的深入分析、對推理成本的新估算，以及對 AI 出版和專利申請趨勢的分析。他們還引入了有關企業采用負責任的 AI 實踐的最新數據，并擴大了對 AI 在科學和醫學中日益重要作用的報道。

完整報告：

https://hai-production.s3.amazonaws.com/files/hai_ai_index_report_2025.pdf

Stanford HAI 在官方網站上寫道，“AI 對社會的影響從未如此明顯......2025 年指數是我們迄今為止最全面、也是在這一重要時刻發布的報告。”

他們還認為，“AI 將是 21 世紀最具變革性的技術。然而，除非我們精心引導 AI 行業的發展，否則這項技術將難以惠及普羅大眾。”

這份新報告揭示了 2024 年 AI 行業的 12 大趨勢：

1.AI 在苛刻基準上的表現持續提升

2023 年，研究人員引入了新的基準——MMMU、GPQA 和 SWE-bench，以測試高級 AI 系統的極限。僅僅一年后，性能大幅提升：在 MMMU、GPQA 和 SWE-bench 上的得分分別提高了 18.8、48.9 和 67.3 個百分點。在基準測試之外，AI 系統在生成高質量視頻方面也取得了重大進展，在某些場景下，語言模型智能體（language model agents）甚至在有限時間預算的編程任務中超越了人類。

圖｜選擇的 Al 指數技術性能基準 vs. 人類表現

2.AI 正越來越多地融入到日常生活中

從醫療保健到交通運輸，AI 正迅速從實驗室走向日常生活。2023 年，FDA 批準了 223 種 AI 醫療設備，而 2015 年僅為 6 種。在道路上，自動駕駛汽車不再是實驗性的：美國最大的運營商之一 Waymo 每周提供超過 15 萬次自動駕駛出行，而百度的經濟型“蘿卜快跑” （Apollo Go）自動駕駛出租車車隊現在已在中國多個城市提供服務。

圖｜FDA 批準的 AI 醫療設備數量（1955-2023）

3.企業全力投入 AI，推動投資和使用創歷史新高

2024 年，美國私營部門對 AI 的投資增長到 1091 億美元——幾乎是中國（9.3 億美元）的 12 倍，是英國（4.5 億美元）24 倍。生成式 AI 尤其強勁，全球吸引私營投資 339 億美元——比 2023 年增長 18.7%。AI 的商業應用也在加速：2024 年，78% 的組織報告稱在使用 AI，比前一年增長 55%。同時，越來越多的研究證實，AI 提高了生產力，在大多數情況下，有助于縮小勞動力中的技能差距。

圖｜2017-2024 年，表示其所在組織至少在一項職能中使用 AI 的受訪者比例

4.在創造頂級 AI 模型方面，中國正在縮小與美國的差距

2024 年，美國機構推出了 40 個引人注目的 AI 模型，顯著超過中國的 15 個和歐洲的 3 個。雖然美國在數量上保持領先，但中國模型在質量上迅速縮小了差距：在 MMLU 和 HumanEval 等主要基準上的性能差異從 2023 年的兩位數縮小到 2024 年的接近相等。同時，中國在 AI 出版物和專利方面繼續領先。與此同時，模型開發越來越全球化，中東、拉丁美洲和東南亞等地區也推出了引人注目的新模型。

圖｜美國頂尖模型與中國頂尖模型在 LMSYS 聊天機器人競技場中的表現

5.負責任的 AI 生態系統不斷發展，但不均衡

人工智能相關事件急劇上升，但在主要工業模型開發者中，標準化的 RAI 評估仍然很少。然而，新的基準如 HELM Safety、AIR-Bench 和 FACTS 為評估事實性和安全性提供了有希望的工具。在公司中，識別 RAI 風險和采取有意義的行動之間存在差距。相比之下，政府表現出更大的緊迫性：2024 年，全球在人工智能治理方面的合作加強，包括經合組織、歐盟、聯合國和非盟在內的組織發布了關注透明度、可信度和其他核心負責任人工智能原則的框架。

圖｜已公布的針對熱門基礎模型的安全性和負責任 AI 基準

6. 全球 AI 樂觀情緒上升，但地區間深層次分歧依然存在

在中國（83%）、印度尼西亞（80%）和泰國（77%）等國家的大多數人認為，人工智能產品和服務是利大于弊的。相比之下，加拿大（40%）、美國（39%）和荷蘭（36%）等地的樂觀情緒仍然遠低于其他國家。然而，情緒正在轉變：自 2022 年以來，包括德國（+10%）、法國（+10%）、加拿大（+8%）、英國（+8%）和美國（+4%）在內的幾個先前持懷疑態度的國家，樂觀情緒顯著增長。

圖 | 2022-2024 年，按國家劃分認為“使用 AI 的產品和服務利大于弊”的比例

7.AI 變得更加高效、經濟實惠和易于獲取

由越來越強大的小型模型驅動，在達到 GPT-3.5 水平上的系統推理成本在 2022 年 11 月到 2024 年 10 月間下降了 280 倍。在硬件層面，成本每年下降 30%，而能效每年提高 40%。開放權重模型也在縮小與封閉模型的差距，在某些基準測試中，一年內性能差異從 8%減少到僅 1.7%。這些趨勢共同迅速降低了高級人工智能的門檻。

圖 | 2022-2024 年，在 MMLU 中得分超過 60% 的最小規模 AI 模型

8.各國政府正在加強對 AI 的監管和投資

2024 年，美國聯邦機構出臺了 59 項與 AI 相關的法規，是 2023 年的兩倍多，發布法規的機構數量也是 2023 年的兩倍。在全球范圍內，自 2023 年以來，75 個國家的 AI 立法提及率上升了 21.3%，自 2016 年以來增長了 9 倍。在日益受到關注的同時，各國政府也在進行大規模投資：加拿大承諾投資 24 億美元，中國啟動了 475 億美元的半導體基金，法國承諾投資 1090 億歐元，印度承諾投資 12.5 億美元，沙特阿拉伯則發起了一項 1000 億美元的倡議。

圖 | 部分供應商的頂尖模型在 LSYS 聊天機器人競技場中的表現

9.AI 和計算機科學教育正在擴大，但普及程度仍不夠

如今，已有 2/3 的國家提供或計劃提供 K-12 計算機科學教育，是 2019 年的兩倍，其中非洲和拉丁美洲取得的進展最大。在美國，擁有計算機學士學位的畢業生人數在過去 10 年中增加了 22%。然而，在許多非洲國家，由于電力等基礎設施的不足，獲得計算機學位的機會仍然有限。在美國，81% 的 K-12 計算機科學教師表示，AI 應該成為計算機科學基礎教育的一部分，但只有不到一半的教師認為自己有能力教授 AI。

10.工業界依然一路領先

2024 年，近 90% 的著名人工智能模型來自工業界，高于 2023 年的 60%，而學術界仍然是高引用率研究的首要來源。模型規模持續快速增長——訓練計算每 5 個月翻一番，數據集每 8 個月翻一番，耗電量每年翻一番。然而，性能差距正在縮小：排名第一和第十的模型之間的得分差距在一年內從 11.9% 降至 5.4%，排名前兩位的差距現在僅為 0.7%。前沿領域的競爭越來越激烈。

圖｜AlphaFold 3 與用于蛋白質 - 配體對接的基線方法的性能對比

11.AI 因其對科學的影響而斬獲最高榮譽

AI 的重要性與日俱增，這一點從重大科學獎項中就可見一斑：兩項諾貝爾獎表彰了 AI 在深度學習（物理學）和蛋白質折疊（化學）中的應用，而圖靈獎則表彰了 AI 在強化學習方面的開創性貢獻。

圖｜PlanBench 基準下正確的實例數量

12.復雜推理仍是一項挑戰

人工智能模型在國際數學奧林匹克競賽問題等任務中表現出色，但在 PlanBench 等復雜推理基準測試中仍然面臨挑戰。即使存在可證明正確的解決方案，它們也常常無法可靠地解決邏輯任務，這限制了它們在精度至關重要的高風險環境中的有效性。

附：來自 AI Index 聯合主任 Yolanda Gil 和 Raymond Perrault 的一封信

隨著人工智能不斷重塑我們的生活、企業界和公共討論，AI Index 將繼續跟蹤其進展--提供一個獨立的、數據驅動的視角，跨越時間和地域，觀察人工智能的發展、應用和影響。

對于人工智能來說，2024 年是多么美好的一年。諾貝爾物理學獎和化學獎，以及因強化學習方面的奠基性工作而獲得的圖靈獎，都體現了對人工智能在推動人類知識進步方面作用的認可。曾經困難重重的圖靈測試已不再被視為一個難以挑戰的目標，今天的尖端系統已經超越了它。與此同時，人工智能的應用正以前所未有的速度加速發展，數以百萬計的人們正經常在專業工作和休閑活動中使用人工智能。隨著高性能、低成本和開放模型的普及，人工智能的可及性和影響力必將進一步擴大。

在經歷了短暫的放緩之后，企業對人工智能的投資出現反彈。新近獲得融資的生成式人工智能初創企業數量增加了近兩倍，在經過多年的低迷之后，企業采用人工智能的速度在 2024 年顯著加快。人工智能已從邊緣領域成為商業價值的核心驅動力。

政府也在加大參與力度。政策制定者們不再只是在討論人工智能，而是在投資人工智能。一些國家啟動了價值十億美元的國家人工智能基礎設施計劃，包括擴大能源能力以支持人工智能發展的重大努力。全球協調不斷加強，地方倡議也初具規模。

然而，信任仍是一大挑戰。越來越少的人相信人工智能公司會保護他們的數據，對公平性和偏見的擔憂依然存在。錯誤信息繼續構成風險，尤其是在選舉和深度偽造泛濫的情況下。對此，各國政府正在推進新的監管框架，旨在促進透明度、問責制和公平性。公眾的態度也在轉變。雖然懷疑的態度依然存在，但 2024 年的一項全球調查顯示，人們對人工智能帶來廣泛社會效益的潛力的樂觀態度明顯上升。

人工智能不再只是一個關于可能性的故事，而是一個關于現在正在發生的事情，以及我們如何共同塑造人類未來的故事。

Yolanda Gil、Raymond Perrault

AI Index 聯合主任

https://hai.stanford.edu/ai-index/2025-ai-index-report

整理：錦鯉

如需轉載或投稿，請直接在公眾號內留言

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.