越來越多的人開始思考:人工智能(AI)的真正經濟價值是什么?
包括 Sam Altman(OpenAI)、Dario Amodei(Anthropic)和 Demis Hassabis(Google DeepMind)等在內的頭部大模型公司首席執行官們認為:AI 的經濟價值主要體現在實現研發(R&D)自動化方面。
具備強大數據分析能力、模式識別和預測能力的 AI,似乎是進行 R&D 的最佳選擇。例如,在藥物 R&D 領域,AI 能夠通過分析大量的生物數據,篩選出有潛力的藥物靶點,顯著縮短 R&D 周期,提高 R&D 效率。
然而,來自 Epoch AI(專注于預測 AI 未來發展的非營利研究機構)的研究員Ege Erdil 和 Matthew Barnett 卻在一篇長文中反駁了上述觀點。
他們認為,AI 的經濟價值主要源于廣泛自動化而非 R&D,并從多個方面進行了論證,主要觀點如下:
AI 的真正價值將主要來自于大規模的自動化,而不僅僅依靠前沿的 R&D 突破;
廣泛的自動化能夠顯著提升經濟效率和生產率,推動整個社會和行業的變革;
自動化有助于使我們擺脫重復性工作,從而專注于更高價值和創造性的任務;
行業變革將由 AI 賦能的自動化驅動;
AI 成功的關鍵在于如何將現有的 AI 技術有效轉化為現實應用,解決實際問題。
學術頭條在不改變原文大意的情況下,對整體內容做了精編,如下:
業內很多有影響力的人認為,AI 對經濟的影響將通過「R&D 的 AI 自動化」來實現:
Dario Amodei 在其文章 中列舉了 AI 可能造福人類的 5 種方式,生物學、神經科學和經濟學 R&D 是其中的 3 種方式。然而,與加速 R&D 和改善經濟治理相比,他并沒有明確指出 AI 會因為在整個經濟領域的廣泛應用而帶來高速經濟增長。
AlphaGo之父 Demis Hassabis 則認為,R&D 是 AI 造福社會的主要渠道。他在一次采訪中提供了實現這一目標的具體機制:AI可以治愈所有疾病,并“解決能源問題”。他還提到了“極端的富足”(radical abundance,指 AI 解決重大問題后,人類進入資源極大豐富、物質極大滿足的時代)也是一種可能性,但是除了 R&D 渠道之外,他并沒有提到任何其他可以實現這一情況的途徑。
Sam Altman 則持相對溫和的觀點。他表示,AI 在某些方面最終可能會像晶體管一樣,成為一項能夠大規模應用并滲透到各個經濟角落的重大發現。即便如此,他仍特別強調,AI 對科學進步的影響很可能“超越其他一切影響”。
總體而言,盡管沒有任何嚴謹的經濟論證支持,這種觀點卻出人意料地產生了巨大的影響力。我們將在這篇文章中論證,這種觀點也很可能是錯誤的。
R&D 的經濟價值通常并不像人們認為的那么高。提高生產力和發展新技術對于長期經濟增長固然至關重要,但明確的 R&D 投入對這些進程的貢獻比人們普遍認為的要小。此外,即使這種貢獻大部分也是外部性的,并不體現在 R&D 公司的利潤中,這從一開始便降低了部署系統進行 R&D 的積極性。這種組合意味著, 大多數 AI 系統實際上將部署在與 R&D 無關的任務中,并從中賺取收入,而且總體而言,這些任務在經濟價值上也更高。
而且,R&D 工作的自動化也比想象中要難得多,因為研究人員工作中的大多數任務都不是“推理任務”,而是在很大程度上依賴于代理(agency)、多模態和長上下文一致性等能力。一旦 AI 的能力已經達到研究人員工作可以完全自動化的程度,那么經濟中其他大多數工作的自動化也將是可行的。
綜合以上兩點,我們沒有理由期待 AI 的大部分經濟價值在未來任何時候都來自 R&D。一種更可信的情況是,AI 的價值將由廣泛的經濟部署所驅動。雖然我們應該預期,由于規模回報的增加,這將導致生產力和人均產量的增加,但這種增加的大部分很可能并非來自明確的 R&D。
AI 的真正經濟價值:廣泛勞動自動化
接下來,我們想要區分兩個相關但稍有不同的主張,一個我們同意,另一個我們不同意:
如果一項技術能夠完全實現自動化 R&D,并且僅用于此目的,那么這項技術將非常有價值,每年至少可以為經濟增長增加幾個百分點。那么,我們認為這種說法是對的,而且很難反駁。
在現實世界中,這種技術最具社會或經濟價值的應用實際上是自動化 R&D。這就是我們要反駁的說法。雖然 R&D 很有價值,但我們認為,無論是 AI 在所有相關任務上的表現超過人類之前和之后,我們都不應期望 AI 的大部分經濟價值或增長效益來自 R&D。
要理解我們質疑第二種說法的論點,必須首先衡量 R&D 的實際經濟價值。R&D 的經濟價值主要是通過提高生產率來實現的,因此,為了量化 R&D 的影響,我們可以問一下,過去勞動生產率的增長有多少是由 R&D 支出及其相關的溢出效應造成的。據美國勞工統計局估計,從 1988 年到 2022 年,由私營企業資助的 R&D 支出僅占美國全要素生產率(TFP)增長的 0.2%/年左右,而同期全要素生產率的增長約為 0.8%/年,勞動生產率的增長約為 1.9%/年。
雖然公共 R&D 支出僅占美國經濟 R&D 支出總額的四分之一左右,但我們也可以預期它將產生更大的正外部效應,Fieldhouse 和 Mertens(2023)估計這兩種效應大致相抵:公共 R&D 平均對美國全要素生產率的增長做出了四分之一的貢獻,因此 R&D 對美國全要素生產率增長的總貢獻率約為 0.4%/年,即占總量的一半。這意味著自 1988 年以來,美國勞動生產率的增長只有 20% 是由 R&D 支出推動的。
在此期間,資本深化(Capital deepening)約占勞動生產率增長的一半,而在剩余部分中,大部分是由其他生產率來源解釋的,如更好的管理、從做中學、知識傳播等。R&D 所能解釋的剩余部分相對于整個“增長蛋糕”的規模來說貢獻較小,甚至大部分 R&D 可能需要研究人員以外的其他投入,如技術設備和實驗室設施。
圖|1988 年以后美國實際 GDP 增長率和勞動生產增長率,其中勞動生產率的增長只有 20% 來自 R&D。
我們對私人 R&D 對全要素生產率增長貢獻的估計,也大致反映經濟對 R&D 投資與資本積累投資的實際分配情況,至少在我們假設許多其他推動 TFP 增長的因素難以直接投資,而且 R&D 和資本形成在任何時候都面臨同樣急劇的收益遞減。由于資本深化占生產率增長的 50%,而私人 R&D 占 10%,我們可以預期資本投資大約是 R&D 投資的 5 倍,事實證明這種直覺是正確的:美國的資本投資總額約為 500 萬美元/年,私人 R&D 投資總額約為 100 萬美元/年。
那么,如果 R&D 相對來說占比很小,我們究竟應該在哪里部署我們的 AI 系統,以加快增長速度呢?最明顯的渠道是廣泛實現人類勞動自動化,因為在美國經濟中,產出的勞動彈性約為 0.6,這可能超過“R&D 產出彈性”(R&D elasticity of output)約 5 倍。此外,我們在廣泛應用勞動力方面的支出是用于明確 R&D 的勞動力支出的 20 倍左右。這個道理很簡單:如果你想產生最大的經濟價值,你就應該把當前經濟中最賺錢的東西自動化,這就使勞動力成為一個顯而易見的重點目標。由此產生的規模巨大的經濟體可以將其產出再投資于資本,并通過正規 R&D 以外的許多其他渠道(如從做中學)加快全要素生產率的增長。從總體上看,我們有充分的理由相信,這將帶來規模回報的增加,從而加速經濟增長,其速度可能比現在快 10 倍或更多。
對這一觀點的反駁是,數據低估了 R&D 對經濟增長的影響,而 R&D 支出相對于資本投資的低水平是由 R&D 中巨大的正外部性和更強的“踩腳效應”效應共同造成的。這些論點并非不可信,但從數量上看,當全要素生產率因許多其他原因而在空間和時間上發生變化時,似乎很難說 R&D 本身就能解釋全要素生產率的大部分增長。此外,即使我們效仿 Bloom 等人(2020)等有影響力的論文,毫無根據地假設全要素生產率(TFP)增長完全由 R&D 投入驅動,他們的參數估計也意味著 R&D 支出對產出的彈性約為 0.3,約等于資本,僅為勞動力的一半。
總之,目前絕大多數經濟增長并非來自 R&D,我們需要一個令人信服的理由,才能相信 AI 將扭轉這一格局。有兩個理由經常被提起:R&D 對 AI 特別重要,因為 AI 系統有可能實現自身 R&D 的自動化;一般來說,R&D 任務對 AI 來說會更容易,因此會比其他經濟領域更早實現自動化。我們認為這兩個理由都缺乏說服力。
R&D 的自動化,難獨自加速 AI 發展
雖然 R&D 的廣泛經濟價值并沒有我們預期的那么大,但對于 AI 技術而言,仍有一個特定的理由讓我們相信自動化 R&D 可能會產生“主導效應”。如果 AI 系統能夠實現自身軟件 R&D 過程的自動化,那么“純軟件奇點”就有可能出現:在固定的計算資源上,我們可以運行 AI 程序,讓其尋找改進自己算法的方法,這將使我們能夠運行更多的虛擬研究人員,以取得更多的軟件進步,等等。
這種反饋循環是否可行,關鍵取決于我們在提高軟件效率的過程中,“想法越來越難找”的速度有多快。在之前的工作中,我們已經對多個軟件領域的這種效應的大小進行了定量估算,并得出結論:如果研究人員的努力是 R&D 的唯一投入,那么“純軟件的奇點”可能會出現,也可能不會出現。然而,一個關鍵假設——即僅憑研究人員的努力就能實現軟件 R&D 的多個數量級進步——是整個論證的基礎,但這一假設很可能并不成立。
一個更可信的模型是,研究進展既需要認知努力,也需要數據,而這兩種投入之間存在一定程度的互補性。支持這一觀點的另一個事實是,在各種軟件領域中,AI 既是實驗計算擴展最快的領域,也是軟件進步速度最快的領域,目前兩者的年增長率都在 3-4 倍左右。這種巧 合表明,使用實驗計算生成數據至少對軟件的進步很重要,盡管我們無法僅憑這 一點來判斷它在多大程度上是研究人員工作的補充投入。
如果這兩種投入確實是互補的,那么任何軟件驅動的加速都只能持續到我們在計算方面遇到瓶頸,最終不得不去做獲取更多 GPU 的物理工作,以便運行更多實驗。當然,AI 也可以加快這一進程,但前提是它必須廣泛應用于整個半導體供應鏈,甚至可能更廣泛地應用于經濟領域,為這一行業提供所需的其他投入。
“純軟件奇點”能持續多少數量級,才能阻止瓶頸的出現,這在很大程度上取決于 AI R&D 中實驗與洞察力之間的互補性,遺憾的是,我們對這一關鍵參數還沒有很好的估計。然而,在經濟的其他領域,存在非對等互補性是很常見的,這也為我們評估 AI R&D 領域的情況提供了參考。僅舉一例,Oberfield 和 Raval(2014)估計,美國制造業中勞動力與資本之間的替代彈性為 0.7,這已經足以讓任何“純軟件奇點 ”在效率提高不到一個數量級后消失。
支持 R&D 過程中存在瓶頸的另一個證據是 ,我們已經將 R&D 過程中的重要部分自動化,但并未發現科學進步有任何顯著加速。例如,我們已經不斷地將大多數 R&D 所需的編程工作自動化,首先是通過開發專門的庫,最近是通過使用 LLM 驅動的工具來加速編碼;隨著時間的推移,我們還發明了許多種節省體力勞動的研究設備。然而,這一切都沒有帶來 R&D 進步的爆炸式增長:相反,其收益相當微薄,這與 R&D 任務之間具有相當強的互補性的情況是一致的。這并不能直接告訴我們整個 R&D 工作與實驗之間的互補性,但這是另一個應該納入我們先前考慮的證據。
所有這些證據的質量都不高,這意味著我們不能排除 AI R&D 可能是經濟中一個不尋常的部分,在這個部分中,關鍵投入之間的替代彈性等于或大于 1,這將確保互補性足夠弱,使得奇點在原則上成為可能。然而,通過與我們掌握數據的其他情況進行比較,我們應該對任何此類預測持謹慎態度。默認情況下,僅軟件或偏向軟件的奇點應被視為不太可能的結果,而不是可能出現的結果。
科學家會被 AI 取代嗎?
乍一看,科學家的工作似乎非常依賴抽象推理——產生想法、提出假設、分析數據、編碼和數學推理。如果這是真的,那就表明在不久的將來,科學家將是最有可能被推理模型取代的工作之一。這是因為,這些任務正是目前的推理模型最容易實現自動化的任務類型。
在這樣的世界里,AI 將大大加快 R&D 速度,然后才會在整個經濟中廣泛部署,取代零售工人、房地產經紀人或 IT 專業人員等更常見的工作。簡而言之,AI 將“首先實現科學自動化,然后實現其他一切自動化”。
但這種設想很可能是錯誤的。實際上,大多數 R&D 工作需要的遠不止抽象推理技能。以醫學科學家為例進行說明。下面是一份與醫學科學家相關的工作任務列表,摘自 O*NET 職業調查,按對該職業的重要性進行了排序。我們根據“是否普遍認為只需抽象推理技能就能完成每項任務”,對其進行了標注——在這里,這意味著它需要純粹的語言、邏輯或數學能力,包括撰寫報告、編碼或證明定理。
我們認為,在這 14 項任務中,只有 6 項需要單獨使用抽象推理才能完成。令人吃驚的是,在醫學科學家最重要的 5 項任務中,我們只將其中一項歸類為完全依賴抽象推理。總體而言,工作中最關鍵的方面似乎需要動手操作的技術技能、與他人的精準協作、專業設備的使用、長上下文能力以及復雜的多模態理解能力。
這種模式也適用于其他常見的研究職業。為了證明這一點,我們使用 GPT-4.5 將 12 種常見 R&D 職業中的任務分為 3 類,即是否只需要抽象推理技能就能完成任務、是否需要復雜的 computer-use 技能(但不需要親臨現場)、是否需要親臨現場才能完成任務。
圖|12 種常見 R&D 職業執行任務的需求。
這一情節揭示了科學研究的本質。與研究主要是一項抽象推理任務的假設相反,現實中的研究大多涉及物理操作和高級代理。要實現 R&D 工作的完全自動化,AI 系統可能需要具備自主操作計算機圖形用戶界面(GUI)的能力、與人類團隊有效協調的能力、在長時間內完成高度復雜項目的強大執行能力,以及操控物理環境進行實驗的能力。
然而,當 AI 達到以較高能力全面執行這些不同技能所需的水平時,很可能一大批常規工作已經實現了自動化。這與 AI 將“首先實現科學自動化,然后實現其他一切自動化”的說法相矛盾。相反,一個更合理的預測是,AI 自動化在達到全面接管 R&D 工作所需的水平之前,將首先在各行各業中實現大部分普通勞動力的自動化。
我們不應該期待 AI 革命從科學突破開始,然后再進入其他領域,而是應該預計在初期階段,自動化將首先接管大部分傳統工作,只有當 AI 掌握了現實世界中雜亂而復雜的工作需求后,科學和技術才會大幅加速發展。
即使在 AI 完全接管 R&D 工作之后,我們也可以合理地預期,AI 將主要通過非 R&D 任務的大規模自動化來加速科學技術的發展,而不是直接取代 R&D 研究人員。考慮到如前所述,明確的 R&D 目前只占整體經濟增長的一小部分,這種預期是合理的。
不是“天才爆發”,而是“全民自動化”
綜上所述,上述論點表明 ,即使在 AI 開始產生變革性的經濟或技術影響之前,其影響也很可能比許多關于 AI 飛速發展的報道所描述的要更加廣泛和顯著。 所謂“廣泛”,我們指的是 AI 驅動的自動化將廣泛出現并改變經濟的大部分,而不是狹隘地局限于 R&D 職業。所謂“顯著”,它的影響對大多數人來說都是顯而易見的,并且具有高度的破壞性——例如,它將大規模地取代勞動力。
此外,即使在 AI 開始對世界產生變革性影響之后,前面的論點也表明,顯性 R&D 的自動化在這些影響中只會起到次要作用。相反,這些影響將主要由整個經濟中更廣泛的自動化來支撐。
我們認為,與其想象未來幾年 AI 的飛速發展將以“數據中心中的天才之國”的形式進行 R&D 工作,不如想象以下另一種景象:
未來幾年,AI 的進步將繼續逐步擴大 AI 能夠執行的任務集。這種進步將主要通過擴展計算基礎設施來實現,而不是純粹的依賴認知 AI R&D 工作。
因此,AI 將被廣泛應用于整個經濟領域,使越來越多的勞動任務實現自動化,最終將大大加速經濟增長。
在 AI 對世界產生變革性影響之前——即在經濟、醫療或其他技術領域引發爆炸性進步之前,已經出現了一系列極具破壞性的自動化浪潮,從根本上重塑了全球勞動力市場和公眾對 AI 的看法。
在每一個時間點上,包括在 AI 能夠顯著地加速經濟、醫療或技術進步的時間點之后,AI 加速這些變量的主要渠道都將是大規模自動化而非 R&D 任務。
有人可能會把這種情況稱為“通用自動化爆炸”(general automation explosion),以強調支持加速的關鍵力量是 AI 自動化的廣度和規模,而不是來自 AI 擅長的任何具體事物。不過,我們承認,這個詞不如“智能爆炸”(intelligence explosion)來得朗朗上口。
啟示錄:從 3 方面看未來 AI
這一觀點對我們如何從商業、政策和個人角度看待 AI 的未來具有重要影響。
首先,從商業角度來看,我們認為在可預見的未來,AI 實驗室更應該把重點放在努力實現普通工作任務的自動化上,例如創建能夠勝任瀏覽互聯網、操作商業軟件和執行標準白領工作任務的 computer-use agent,而不是專注于開發“諾貝爾獎獲得者”級別的推理模型,從而能夠為生物學和醫學等領域的研究人員提供狹隘的幫助。我們還認為,與 AI 在 R&D 任務上的表現相比,這些普通能力可能更需要跟蹤和基準測試。
其次,從政策角度來看,我們認為必須認識到,從現在到 AI 開始對世界產生變革性影響(如爆炸性經濟增長或人類壽命延長方面的重大進展)這段時間內,公眾對 AI 的看法可能會發生深刻轉變。之所以會發生這種轉變,是因為當 AI 發展到那個階段時,社會已經經歷了一系列顛覆性的自動化浪潮,大規模地取代了工人。因此,我們認為,假設在變革性 AI 出現之前或之后,公眾對 AI 的看法將與現在大不相同。
第三,從個人角度來看,我們認為值得規劃和投資的未來是 AI 將在數年甚至數十年內逐步取代工作崗位,而不是在 AI 接管 AI R&D 流程后,人類勞動力一下子就被淘汰。我們認為,與其想象一個相對突然的事件,即 AI 通過遞歸式的 AI R&D 爆發出超級智能,不如預期經濟向全面自動化的平穩過渡更有成效。
我們認為,AI 很可能會在一段較長的時期內,在某些任務上超越人類,但在其他互補任務上仍不如人類。明確地說,我們承認 AI 最終將在幾乎所有有經濟價值的活動中超越人類,這將導致經濟增長顯著加速。不過,我們認為,這可能要經過數年或數十年日益廣泛和顛覆性的自動化之后才會發生——其影響將遠遠超出 R&D 領域。
https://epoch.ai/gradient-updates/most-ai-value-will-come-from-broad-automation-not-from-r-d
原文作者:
Ege Erdil(Epoch AI 高級研究員)、Matthew Barnett(Epoch AI 研究員)
整理:錦鯉
如需轉載或投稿,請直接在公眾號內留言
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.