新智元報道
編輯:英智 犀牛
【新智元導讀】AI編程智能體的能力正在飛速增長,最新研究揭示了這一「新摩爾定律」,如果AI智能體的任務時長繼續以每4個月翻倍的速度增長,到2027年它們可能完成長達167小時的月級任務!
編程智能體能完成的任務量,正以爆炸式的速度增長!
而且,這一趨勢還在加速。
2024到2025年,它們的任務處理能力每4個月翻一倍;而在2019到2025年,這個翻倍周期則是7個月。
22號,AI研究網站AI Digest發表了上述觀點,揭示了一個AI智能體的新摩爾定律。
博客地址:https://theaidigest.org/time-horizons
從圖表中可以清晰地看到這一趨勢,任務時長的增長軌跡幾乎是一條陡峭的指數曲線。
2019年,GPT-2只能處理不到1秒的簡單任務;2022年ChatGPT發布時,AI已經可以完成30秒的編程任務。
現在,智能體可以自主完成人類需要一小時才能完成的編程任務。
頂尖的AI系統可以完成的任務長度正在呈指數級增長——每7個月翻一番。
這個趨勢是METR的研究人員發現的。
他們選取了2019到2025年間最強的AI模型,測試了它們在大約200個任務上的表現。主要是編程任務,也有一些邏輯推理任務。
然后,他們把AI的成功率和每個任務的長度做了對比——任務長度指的是專業人士完成這些任務需要的時間,從不到30秒到超過8小時不等。
測試過所有模型后,出現了兩個明顯的規律:
任務長度和AI成功率高度相關(相關系數R2=0.83)。
AI成功率達到50%的任務長度——即「時間跨度」——正在呈指數增長。
接下來是什么?
這個指數增長的趨勢看起來很穩健,沒有停下來的意思。
如果按照這個趨勢推算下去,AI智能體將能夠完成:
2026年:2小時的任務;
2027年:1個工作日(8小時)的任務;
2028年:1個工作周(40小時)的任務;
2029年:1個工作月(167小時)的任務。
最近,這一趨勢還在加速。
2024-2025年間,時間跨度是每4個月任務長度翻一番,而2019-2025年間則是每7個月翻一番。
如果按照2024-2025年加速的趨勢(每4個月翻倍)推算,AI智能體可能在2027年就能完成月級任務(167小時)。
然而,僅觀察一年的數據給出預測可能會不太穩定,實際的進步速度也可能會放緩。
不過,考慮到這個趨勢已經開始加速,它很可能處于一個比指數增長還要快的增長軌道上。
這也很符合直覺:隨著增長軌道直線上升,1周和2周任務之間所需技能的差距,可能比1年和2年任務之間的差距更大。
此外,隨著AI能力的提升,它們在開發更強大AI方面的作用會越來越大,可能導致超指數級增長。
智能爆炸
AI智能體的能力提升會反過來加速更強大AI的研發,形成飛輪效應:更強大的AI智能體能夠更快地開發出更先進的AI系統,從而進一步提升能力。
這種正反饋循環可能導致超指數增長,甚至觸發「軟件智能爆炸」(software intelligence explosion),即AI能力在短時間內急劇提升,遠遠超過人類的水平。
此外,算法進步也在推動這一趨勢。
METR的研究表明,近年來AI在算法效率上的提升,顯著降低了計算資源需求。
通過更高效的預訓練和后訓練方法,即使硬件資源不增加,AI智能體的能力也能快速提升。
AI智能體任務時長的指數增長,可能成為人類歷史上最具變革性的趨勢之一。
它能在短時間內完成復雜任務,將徹底改變軟件開發、科學研究、醫療診斷等多個領域。
例如,一個能夠自主完成月級任務的AI智能體,可以完全自動化軟件工程項目,甚至獨立進行科學研究,從而大幅提高生產效率。
這一趨勢也帶來了潛在的社會挑戰。隨著AI智能體能力的快速提升,人類社會可能難以適應這種變化。
許多傳統職業可能面臨自動化,人類可能需要轉向更具創造性和策略性的角色。
參考資料:
https://theaidigest.org/time-horizons
https://x.com/AiDigest_/status/1914710297157493173
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.