網易首頁 > 網易號 > 正文申請入駐

斯坦福2025人工智能指數報告要點聚焦

2025-04-10 17:35:04　來源: 全球技術地圖

北京舉報

分享至

2025年4月，斯坦福大學發布《2025年人工智能指數報告政策摘要》（Atificial Intellgence Index Report 2025，Policy Highlingts），報告全面分析了全球人工智能領域的最新發展趨勢，涵蓋技術性能、行業投資、國家競爭格局以及政策治理等關鍵議題。啟元洞見編譯核心內容，旨在為政策制定者及相關受眾提供人工智能發展的全局視角與數據支持。

以下是針對政策制定者及其他政策相關受眾的人工智能指數報告關鍵摘要。完整報告可在hai.stanford.edu/ai-index/2025-ai-index-report查閱。

公共部門在尖端人工智能發展上仍落后于行業，計算需求持續飆升

行業在人工智能領域持續投入巨資，并在重要模型開發中保持領先地位。2024年，近90%的重要模型來自行業，而2023年這一比例為60%（見圖1）。

圖1：2003-2024年各領域重要人工智能模型數量

來源：Epoch AI，2025

盡管全球公共部門對人工智能的投資顯著增加（2023年以美國的8.31億美元公共支出為首）（見圖2），且學術界在過去三年中仍是高引用（前100名）人工智能出版物的主要生產者，但行業的領先地位依然穩固。

圖2：2023年部分國家人工智能相關公共合同支出（單位：百萬美元）

來源：人工智能指數，2025

大規模行業投資持續推動模型規模和性能提升，人工智能模型對計算能力和能源的需求也在不斷增加（見圖3）：重要人工智能模型的訓練計算量大約每五個月翻一番，大語言模型（LLM）的訓練數據集規模每八個月翻一番，訓練所需的電力每年都在增加。

圖3：2012-2024年各領域重要人工智能模型的訓練計算量（對數尺度）

來源：Epoch AI，2025

顯著的技術性能提升伴隨著標準化評估方法的缺失

人工智能模型的性能在尖端領域趨于接近。隨著越來越多的開發者推出高質量模型，人工智能領域的競爭日益激烈。例如，過去一年中，Chatbot Arena排行榜上第一名與第十名模型之間的差距從11.9%縮小至5.4%（見圖4）。

圖4：Chatbot Arena排行榜上領先模型的性能（按提供商分類）

來源：LMSYS，2025

特別是，開源權重模型正在迎頭趕上。截至2025年2月，Chatbot Arena排行榜上領先的開源權重模型與閉源權重模型之間的性能差距已縮小至1.70%（見圖5）。

圖5：Chatbot Arena排行榜上閉源與開源模型的性能對比

來源：LMSYS，2025

人工智能在新基準測試中的表現提升速度前所未有。2023年至2024年，人工智能在測試極限能力的基準測試（如MMMU、GPQA、SWE-bench）中的性能顯著提升，增幅從19%到67%不等。這促使研究人員不斷提出更具挑戰性的基準測試（如“人類的終極考試”“前沿數學”“BigCodeBench”）。

然而，研究表明許多基準測試設計不佳，凸顯了標準化評估的必要性，以確保可靠的人工智能評估并避免對模型性能的誤導性結論（見圖6）。使用負責任的人工智能標準評估系統仍不常見，旨在評估模型事實性和真實性的基準測試也未能得到廣泛采用。

圖6：部分基準測試的設計與可用性評分對比

來源：Reuel等，2024

美國在人工智能發展的許多方面仍保持領先，但與特定國家的競爭日益激烈

美國在重要人工智能模型數量（2024年40個，見圖7）、高引用（前100名）人工智能出版物數量（2021-2023年173篇）以及私人人工智能投資（2024年1090億美元）方面繼續領先于特定國家和歐洲。

圖7：2003-2024年部分地區重要人工智能模型數量

來源：Epoch AI，2025

然而，特定國家與美國在重要基準測試上的性能差距已大幅縮小（到2024年底普遍不到10個百分點，見圖8）。特定國家在人工智能研究出版物總量上領先，占全球人工智能出版物的23.2%和全球人工智能研究引用的22.6%。

圖8：美國與特定國家領先模型在部分基準測試上的性能對比

來源：人工智能指數，2025

盡管北美在組織使用人工智能方面保持領先，但其他地區正在迎頭趕上。大中華區的組織人工智能使用率同比增長顯著，增幅達27個百分點，緊隨其后的是歐洲，增幅為23個百分點（見圖9）。

圖9：2023年與2024年全球組織人工智能使用率對比

來源：麥肯錫公司調查，2024

隨著人工智能的經濟機遇顯現、事件增加及公眾不信任加劇，各國政府正通過監管和投資加強人工智能治理

人工智能開始在業務職能中產生財務影響，持續提升生產力并彌補技能差距。近期研究證實，人工智能對生產力有積極影響，并有助于縮小技能差距。企業報告稱，在服務運營、供應鏈管理和軟件工程等領域實現了成本節約，盡管大多數企業仍處于早期采用階段（見圖10）。

圖10：2024年生成式人工智能在各職能中的成本降低與收入增長

來源：麥肯錫公司調查，2024

各國政府正在大規模投資人工智能基礎設施。例如，加拿大宣布了一項24億美元的人工智能基礎設施計劃，而中國則啟動了475億美元的基金以促進半導體生產。

在美國，2024年引入的聯邦人工智能相關法規數量翻了一番；42個機構提出了59項人工智能相關法規。由于聯邦層面進展緩慢，各州在人工智能立法方面處于領先地位（見圖11）：2024年，州級人工智能相關法律通過數量較2023年翻了一番，而聯邦層面的提案數量僅增長29.2%。

圖11：2016-2024年美國各州通過的人工智能相關法案數量

來源：人工智能指數，2025

這些政策行動的背景是人工智能相關事件的持續增加（見圖12）以及全球公眾對人工智能公司保護個人信息和人工智能系統無偏見的信心顯著下降。

圖12：2012-2024年報告的人工智能事件數量

來源：人工智能事件數據庫（AIID），2024

免責聲明：本文轉自啟元洞見。文章內容系原作者個人觀點，本公眾號編譯/轉載僅為分享、傳達不同觀點，如有任何異議，歡迎聯系我們！

轉自丨啟元洞見

研究所簡介

國際技術經濟研究所（IITE）成立于1985年11月，是隸屬于國務院發展研究中心的非營利性研究機構，主要職能是研究我國經濟、科技社會發展中的重大政策性、戰略性、前瞻性問題，跟蹤和分析世界科技、經濟發展態勢，為中央和有關部委提供決策咨詢服務。“全球技術地圖”為國際技術經濟研究所官方微信賬號，致力于向公眾傳遞前沿技術資訊和科技創新洞見。

地址：北京市海淀區小南莊20號樓A座

電話：010-82635522

微信：iite_er

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

手機 / 數碼

房產 / 家居

斯坦福2025人工智能指數報告要點聚焦