99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

Ilya向全世界宣布:預訓練結束了!全球AI數據耗盡,超級智能才是未來

0
分享至


新智元報道

編輯:Aeneas 好困

【新智元導讀】全球頂會NeurIPS 2024中,Ilya登場演講,向全世界宣告:預訓練結束了!數據如同化石燃料般難以再生,未來,AI的發展方向就是具備自我意識的超級智能。

剛剛,Ilya現身NeurIPS 2024,宣布:預訓練從此將徹底終結。

短短16分鐘的發言,足以震撼全場。

是的,他的原話是——

正如我們所知的那樣,預訓練毫無疑問將會終結,與此同時我們也不會再有更多數據了。

原因在于,我們只有一個互聯網,訓練模型需要的海量數據即將枯竭,唯有從現有數據中尋找新的突破,AI才會繼續發展。

Ilya的預測是,以后的突破點,就在于智能體、合成數據和推理時計算。


未來,我們會走向何方?

Ilya告訴我們:接下來登場的就是超級智能(superintelligence)——智能體,推理,理解和自我意識。


十年再登巔峰,Ilya感謝前同事


論文地址:https://arxiv.org/abs/1409.3215

Ilya感謝了自己的兩位合著者Oriel Vinyals和Kwok-Lee,放出了下面這張圖。


這是在十年前,2014年蒙特利爾NeurIPS 會議上一次類似演講的截圖。Ilya說,那是一個更加純粹的時代。

而如今,圖中的三位青蔥少年已經長成了下面的模樣。


Ilya要做的第一件事,是展示10年前同一個演講的PPT。

他們的工作,可以用以下三個要點概括——

這是一個基于文本訓練的自回歸模型;它是一個大型神經網絡;它使用了一個大規模的數據集。


10層神經網絡,只需幾分之一秒

下面,Ilya與我們探討了「深度學習假設」。

如果你有一個10層的大型神經網絡,它就可以在幾分之一秒內,完成任何人類能做的事。

為什么要強調幾分之一秒內?

如果你相信深度學習的基本假設,即人工神經元和生物神經元是相似的,并且你也相信真實神經元的速度比人類快速完成任務的速度更慢,那么只要全世界有一個人能夠在不到一秒內完成某項任務,那么一個10層神經網絡也能做到。

只要把它們的連接,嵌入到你的人工神經網絡中。

這就是我們的動機。

我們專注于10層神經網絡,因為在那個時候,這就是我們能夠訓練的神經網絡。如果你能突破10層,你當然可以完成更多事。


下面這張PPT,描述的是他們的「主要想法」。

核心觀點就是,如果你有一個自回歸模型,并且它能夠足夠好地預測下一個Token,那么它實際上會抓取、捕獲、掌握接下來任何序列的真實分布。

在當時,這是一個相對新穎的觀點。

盡管它并不是第一個被應用于實踐的自回歸神經網絡,但Ilya認為,這是第一個令他們深信不疑的自回歸網絡:如果把它訓練得足夠好,那么你就會得到想要的任何結果。

當時,他們嘗試的是翻譯。這個任務如今看來平凡無奇,當時卻極具挑戰性。


接下來,Ilya展示了一些可能很多人從未見過的古老歷史——LSTM。

不熟悉的人會覺得,LSTM是Transformer出現之前,深度學習研究者所使用的工具。它可以被看作是一個旋轉了90度的ResNet,但更復雜一些。

我們可以看到積分器(integrator),如今被稱為殘差流(residual stream),還涉及一些更為復雜的乘法操作。


Ilya還想強調的一點是,他們當時使用了并行化。

不過并不是普通的并行化,而是流水線并行化(pipelining),每層神經網絡都分配一塊GPU。

從今天來看,這個策略并不明智,但當時的他們并不知道。于是,他們使用8塊GPU,實現了3.5倍的速度。


從這里,Scaling Law開始了

最終,ILya放出了那次演講中最為意義重大的一張PPT,因為,它可以說是「Scaling Law」的開端——

如果你有一個非常大的數據集,訓練一個非常大的神經網絡,那么可以保證成功。

從廣義上來說,后來發生的事情也的確如此。


接下來,Ilya提到了一個真正經得起時間考驗的想法——聯結主義(connectionism),這樣說深度學習的核心思想。

這種理念認為,如果你愿意相信人工神經元在某種程度上有點像生物神經元,那么你就會相信,超大規模神經網絡并不需要達到人類大腦的級別,就可以用來完成幾乎所有人類能做的事。

但它與人類仍然不同。因為人類大腦會弄清楚自己如何配置,它使用的是最優的學習算法,需要與參數數量相當的數據點。

在這一點上,人類仍然更勝一籌。


所有這些,最終都引出了「預訓練時代」。

這個時代,可以用GPT-2、GPT-3和Scaling Laws定義。

此處,ILya格外感謝了前同事Alec Radford,Jared Kaplan和Dario Amodei。

這項技術,是推動我們今日所見所有技術進步的核心驅動力。


預訓練時代,即將終結

然而,我們所知的預訓練路線,毫無疑問會終結。

為什么?

這是因為,盡管計算能力正通過更好的硬件、更優的算法和更大的集群不斷增長,但數據量并沒有增長——我們只有一個互聯網。

甚至可以說,數據是AI的化石燃料。它們是以某種方式被創造出來的,而如今,我們已經達到了數據峰值,不可能再有更多數據了。

當然,目前現存的數據,仍能支持我們走得很遠,但我們只有一個互聯網。


接下來會發生什么?Ilya給出了下列預測。(或者只是提到他人的猜測)

首先,智能體會有一些突破,這些能自主完成任務的AI智能體,就是未來的發展方向。

其次,還會有一些模糊的合成數據,但這到底意味著什么?很多人都會取得有趣的進展。

最后,就是推理時計算了,最引人矚目的例子,就是o1。在預訓練后,我們接下來該探索什么?o1給出了生動的例子。


下面,是一個來自生物學的例子。

這張圖,展示了哺乳動物的身體大小與大腦大小之間的關系。

在生物學中,一切都很混亂,但上面這個緊密聯系,卻是一個罕見的例子。

從人類及其近親的進化分支上看,包括尼安德特人、能人等等,大腦與身體比例的縮放指數都不同。

這意味著在生物學中,確實存在不同比例縮放的先例。

如今我們所擴展的,可以說是第一個我們知道該如何擴展的事物。這個領域中的每個人,都會找到解決辦法。

而我們在相關領域,也取得了驚人的進步。10年前這個領域的人,還會記得當時是多么無能為力。過去2年進入深度學習的人,可能都無法感同身受。


超級智能是未來,還會與意識結合

最后Ilya談到的,就是超級智能(superintelligence)了。它是公認的發展方向,也是研究人員們正在構建的東西。

從本質上來說,超級智能與現在的AI完全不同。

目前,我們擁有出色的LLM和聊天機器人,但它們也表現出某些奇怪的不可靠性——時常會感到困惑,但卻能在評估中表現出遠超人類的能力。

雖然我們還不知道如何調和這一點,但最終遲早會實現以下目標:AI將真正具備實際意義上的智能體特性,并將正學會推理。

由于推理會引入了更多的復雜性,因此一個會推理的系統,推理量越多,就會變得越不可預測。相比之下,我們熟知的深度學習都是可以預測的。

舉個例子,那些優秀的國際象棋AI,對于最頂尖的人類棋手來說就是不可預測的。

所以,我們將來不得不面對的,是一些極其不可預測的AI系統——它們能夠從有限的數據中理解事物,同時也不會感到困惑。

同樣,自我意識也是有用的,它構成了我們自身的一部分,同時也是我們世界模型中的一部分。

當所有這些特性與自我意識結合在一起時,就會帶來與現有系統完全不同性質和特性的系統,它們將擁有令人難以置信的驚人能力。


當然,雖然無法確定如何實現、何時實現,但這終將發生。

至于這種系統可能帶來的問題,就留給大家自己去想象吧。

畢竟預測未來是不可能的,任何事情都有可能發生。

參考資料:

https://x.com/_jasonwei/status/1867696401830096970

https://x.com/blueberry_feed/status/1867764724206629224

https://x.com/tmychow/status/1867695173783925071

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
又一女明星載了!曝張鈞甯因股災蒸發3900萬臺幣,趙薇、范冰冰等眾多女星曾炒股巨虧

又一女明星載了!曝張鈞甯因股災蒸發3900萬臺幣,趙薇、范冰冰等眾多女星曾炒股巨虧

金融界
2025-04-07 20:52:28
庫爾斯克上演第一滴血,俄軍士兵孤軍深入,血戰烏軍40天全身而退

庫爾斯克上演第一滴血,俄軍士兵孤軍深入,血戰烏軍40天全身而退

干史人
2025-04-07 20:30:04
杰倫-布朗談身體保養開銷:詹姆斯每年100萬 我大概在50萬到70萬

杰倫-布朗談身體保養開銷:詹姆斯每年100萬 我大概在50萬到70萬

直播吧
2025-04-08 05:52:06
河南一知名景區宣布停止售票!免費開放!

河南一知名景區宣布停止售票!免費開放!

魯中晨報
2025-04-07 19:07:04
王思懿變成“王大娘”,世間再無“潘金蓮”……

王思懿變成“王大娘”,世間再無“潘金蓮”……

印象逍遙子
2025-04-04 23:26:27
雷霆主場能否復仇?明日對陣湖人:杰林·威廉姆斯出戰成疑,其余主力均可出戰

雷霆主場能否復仇?明日對陣湖人:杰林·威廉姆斯出戰成疑,其余主力均可出戰

雷速體育
2025-04-08 08:00:16
二手特斯拉被鎖事件后續!原車主加回微信,矛盾再升級:法庭見!

二手特斯拉被鎖事件后續!原車主加回微信,矛盾再升級:法庭見!

振華觀史
2025-04-07 12:40:50
當年真不貴?恒大1920萬簽24歲塔利斯卡,31歲土超戴帽仍值1200萬

當年真不貴?恒大1920萬簽24歲塔利斯卡,31歲土超戴帽仍值1200萬

直播吧
2025-04-07 16:17:13
最后的沖刺!明天客戰太陽:勇士全員健康&都可以出戰

最后的沖刺!明天客戰太陽:勇士全員健康&都可以出戰

直播吧
2025-04-08 08:00:09
事關小米SU7!小米澄清:嚴重失實,已報案!

事關小米SU7!小米澄清:嚴重失實,已報案!

每日經濟新聞
2025-04-07 20:56:06
男子100萬買的房子,去交稅時卻被要求按照125萬去交稅,男子怒懟工作人員。

男子100萬買的房子,去交稅時卻被要求按照125萬去交稅,男子怒懟工作人員。

張曉磊
2025-04-07 11:50:01
有網友問DeepSeek:中國加稅美國貨,普通人生活會有什么改變呢!

有網友問DeepSeek:中國加稅美國貨,普通人生活會有什么改變呢!

翻開歷史和現實
2025-04-06 12:25:15
又一“網紅家電巨頭”跌落神壇!被爆以假亂真,暴跌85%成智商稅

又一“網紅家電巨頭”跌落神壇!被爆以假亂真,暴跌85%成智商稅

夢史
2025-04-07 12:58:44
湖人再贏2場就鎖定前三也可能掉第8 若第3對手為掘船勇狼熊!

湖人再贏2場就鎖定前三也可能掉第8 若第3對手為掘船勇狼熊!

直播吧
2025-04-08 06:25:15
中共中央、國務院:加強農村宅基地規范管理,允許農戶合法擁有的住房通過出租、入股、合作等方式盤活利用

中共中央、國務院:加強農村宅基地規范管理,允許農戶合法擁有的住房通過出租、入股、合作等方式盤活利用

澎湃新聞
2025-04-07 17:58:07
吃著中國飯,詆毀中國文化,700萬網紅遭央視打碼,人設徹底崩塌

吃著中國飯,詆毀中國文化,700萬網紅遭央視打碼,人設徹底崩塌

涵豆說娛
2025-04-07 11:02:24
中國某富二代事件,已經轟動全英…

中國某富二代事件,已經轟動全英…

腦袋空空的泡芙
2025-04-07 21:17:18
普通中產如何安全渡過大蕭條?來自一百年前的告誡

普通中產如何安全渡過大蕭條?來自一百年前的告誡

鄧小閑koki
2025-04-07 21:48:12
太陽倒灶最大受害者!大合同泡湯了,28歲當打之年,直奔底薪而去

太陽倒灶最大受害者!大合同泡湯了,28歲當打之年,直奔底薪而去

球毛鬼胎
2025-04-07 19:35:01
訪華請求被中國晾一邊,特朗普坐不住了,火速任命亞太“一把手”

訪華請求被中國晾一邊,特朗普坐不住了,火速任命亞太“一把手”

孜致博覽
2025-04-07 17:54:53
2025-04-08 08:31:00
新智元 incentive-icons
新智元
AI產業主平臺領航智能+時代
12486文章數 66006關注度
往期回顧 全部

科技要聞

特朗普堅持征收關稅 周一美科技股劇烈震蕩

頭條要聞

特朗普再對歐盟施壓:必須從美國購入能源

頭條要聞

特朗普再對歐盟施壓:必須從美國購入能源

體育要聞

刷屏中文互聯網,甲亢哥是怎么火的?

娛樂要聞

汪小菲身旁的朋友,對馬筱梅的評價

財經要聞

看好中國資本市場 "國家隊"增持

汽車要聞

途昂Pro的五套組合拳打完 看清油車的自我救贖

態度原創

旅游
藝術
教育
時尚
本地

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

教育要聞

還是熱愛最有力量!四年級的孩子,《科學》筆記做的讓人眼前一亮

這條裙子太好看了,可以從20歲穿到60歲

本地新聞

我在新昌當女主|大佛寺氛圍感拉滿 古偶頂流機位GET

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 郑州市| 黔江区| 阿克苏市| 宣武区| 巫山县| 新闻| 奉新县| 邵阳县| 黔东| 额尔古纳市| 龙江县| 东台市| 青田县| 宁德市| 京山县| 泗水县| 丹阳市| 景谷| 阜平县| 新竹县| 青海省| 策勒县| 鲁甸县| 大足县| 马尔康县| 城口县| 兴和县| 深水埗区| 吴忠市| 西华县| 肇源县| 三河市| 韩城市| 公安县| 鹤岗市| 双柏县| 成武县| 门头沟区| 涪陵区| 琼中| 封开县|