新智元報(bào)道
編輯:犀牛
【新智元導(dǎo)讀】Anthropic聯(lián)合創(chuàng)始人兼首席科學(xué)家Jared Kaplan拋出重磅預(yù)測(cè):人類(lèi)水平的AI(AGI)可能在2-3年內(nèi)實(shí)現(xiàn),而非此前預(yù)計(jì)的2030年。從AI能力的飛速擴(kuò)展到Claude 4的即將發(fā)布,再到DeepSeek等全球競(jìng)爭(zhēng)者的崛起,Kaplan為我們揭示了AI領(lǐng)域的最新突破與挑戰(zhàn)。
提到Anthropic,大家首先想到的可能是它的聯(lián)合創(chuàng)始人、CEO Dario Amodei。
這位明星CEO經(jīng)常出現(xiàn)在各種場(chǎng)合,不時(shí)拋出一個(gè)「爆炸」言論。
不過(guò),Anthropic的另一位聯(lián)合創(chuàng)始人,也是他們的首席科學(xué)家Jared Kaplan則鮮少露面。
近日,他參加了Azeem Azhar的一檔訪談節(jié)目,并拋出了一個(gè)與Dario類(lèi)似的觀點(diǎn)。
「人類(lèi)水平的人工智能兩三年內(nèi)就會(huì)到來(lái),不用等到2030年。」
這位略顯神秘的大佬表示,AI現(xiàn)在能夠處理的任務(wù)愈加復(fù)雜,甚至有些任務(wù)連人類(lèi)專家也需要花費(fèi)幾個(gè)小時(shí),甚至幾天才能完成。
AGI時(shí)間表
Kaplan曾在去年預(yù)測(cè)實(shí)現(xiàn)人類(lèi)水平的AI(AGI)需要到2030年,但現(xiàn)在他更傾向于2到3年內(nèi)到來(lái)。
不過(guò),「人類(lèi)水平」的AI并不是一個(gè)可以清晰界定的標(biāo)準(zhǔn)。
Kaplan提出了衡量AI能力的兩個(gè)重要維度。
一個(gè)是AI能夠操作的環(huán)境范圍。
從最初只能在圍棋棋盤(pán)上操作的AlphaGo,到如今可以理解文本、圖像,甚至最終可能化身為機(jī)器人進(jìn)入物理世界,AI的操作范圍不斷延伸。
其二是AI能夠處理任務(wù)的復(fù)雜程度。
他回顧早期的語(yǔ)言模型(如BERT)處理的都是1秒級(jí)的任務(wù),比如看一個(gè)句子找出里面的名詞。到了GPT-3,能處理的是10秒級(jí)的任務(wù)。
現(xiàn)在,像Claude 3.7 Sonet這樣的最新模型,已經(jīng)能夠完成人類(lèi)研究生需花費(fèi)半天的復(fù)雜任務(wù),例如分析和提煉長(zhǎng)達(dá)20,000字的文本。
AI在這兩個(gè)維度上都快速地?cái)U(kuò)展。
Kaplan表示,AI能力的快速提升有多種因素:
模型智能的整體提升使其能夠關(guān)注和處理更多不同的問(wèn)題。
上下文窗口長(zhǎng)度的持續(xù)擴(kuò)展使AI能夠理解和處理更長(zhǎng)的文本,從段落到書(shū)籍,從而增強(qiáng)其理解能力。
通過(guò)強(qiáng)化學(xué)習(xí)訓(xùn)練AI執(zhí)行更復(fù)雜的任務(wù)。
Claude 4六個(gè)月內(nèi)發(fā)布
Claude 3已經(jīng)發(fā)布了一年多的時(shí)間,Kaplan預(yù)計(jì)新一代的Claude 4將會(huì)在接下來(lái)的六個(gè)月內(nèi)發(fā)布。
「一方面,我們?cè)诤笥?xùn)練跟強(qiáng)化學(xué)習(xí)上有了改進(jìn),讓Claude能通過(guò)更多測(cè)試;另一方面,我們從預(yù)訓(xùn)練中提升了效率。」Kaplan說(shuō),短期內(nèi)這種勢(shì)頭不會(huì)減慢。
對(duì)于測(cè)試時(shí)擴(kuò)展(test-time scaling),Kaplan覺(jué)得這是個(gè)大突破。
簡(jiǎn)單來(lái)說(shuō),就是讓AI多想一會(huì)兒,性能就能可預(yù)測(cè)地變好,尤其是在那種光靠思考就能提高表現(xiàn)的困難問(wèn)題上。
比如讓Claude 3.7想2000個(gè)token、4000個(gè)token、8000個(gè)token,每次思考量翻倍,性能就能穩(wěn)定提升。
這種方式還能擴(kuò)展到同時(shí)生成好幾個(gè)答案,然后讓AI挑個(gè)最好的。
Kaplan解釋說(shuō):「對(duì)于特別難的任務(wù),你可以選一個(gè)更聰明的模型快速搞定,或者讓一個(gè)普通點(diǎn)的模型多花點(diǎn)時(shí)間,效果可能差不多。」
不過(guò)這也帶來(lái)了新挑戰(zhàn):模型得學(xué)會(huì)判斷什么時(shí)候多想一會(huì)兒。
Kaplan打了個(gè)比方:「就像你剛換了個(gè)新工作,老板給你個(gè)難題,你肯定得花大把時(shí)間琢磨,因?yàn)槟阆氪饘?duì),不想被炒魷魚(yú)。但一旦你適應(yīng)這個(gè)工作,可能隨手就給出一個(gè)答案。」
DeepSeek沒(méi)理由落后
DeepSeek發(fā)布的R1模型引發(fā)全球熱議,展現(xiàn)出了令人驚艷的推理能力。
Kaplan對(duì)此并不意外,「我關(guān)注DeepSeek的進(jìn)展至少有一年半了。他們一直在發(fā)表論文、優(yōu)化模型,所以這對(duì)我們或Anthropic來(lái)說(shuō)并不算太大的驚喜。」
這話透露出頂尖AI實(shí)驗(yàn)室之間對(duì)彼此的研究非常的熟悉。
他倒覺(jué)得全球的反應(yīng)挺有趣:「很多人驚呼,『哇,中國(guó)竟然有這么厲害的模型!』我跟一些美國(guó)人聊過(guò),他們過(guò)去總覺(jué)得中國(guó)可能落后好幾年。但看看DeepSeek的論文,他們的進(jìn)展其實(shí)很明顯,可能只差六個(gè)月,不會(huì)太遠(yuǎn)。」
這也反映出中美兩國(guó)在AI發(fā)展方面的差距正在縮小。
Kaplan表示,AI研究的突破來(lái)得特別快。這種飛速進(jìn)步不是因?yàn)榭茖W(xué)家突然變聰明了,而是因?yàn)锳I這個(gè)領(lǐng)域就像個(gè)秋天的果園,掛滿了低垂的果子,迭代改進(jìn)的空間很大。
他進(jìn)一步說(shuō),算力硬件限制可能會(huì)讓西方公司在硬件資源上占優(yōu),這對(duì)DeepSeek和其他公司來(lái)說(shuō)可能是個(gè)挑戰(zhàn)。
但在算法本身上,所有頂尖AI公司都在找簡(jiǎn)單、有效、可擴(kuò)展的方法。
DeepSeek的論文里也提到了這些思路和技術(shù),他們?cè)谒惴ㄉ贤耆懈?jìng)爭(zhēng)力,沒(méi)理由落后。
AI的影響
訪談的最后聚焦在了AI對(duì)經(jīng)濟(jì)和社會(huì)的潛在影響上。
AI對(duì)生產(chǎn)力和勞動(dòng)力市場(chǎng)的影響,可能會(huì)比歷史上的任何重大技術(shù)變革來(lái)得更快。
Kaplan對(duì)此深以為然,他坦言:「我覺(jué)得我們對(duì)AI會(huì)如何改變社會(huì)和生產(chǎn)力的思考,可能遠(yuǎn)遠(yuǎn)不夠。隨著AI能夠完成的事情越來(lái)越多,人類(lèi)可能會(huì)通過(guò)其他活動(dòng),或者用AI來(lái)放大自己的能力來(lái)實(shí)現(xiàn)不同。」
他同時(shí)強(qiáng)調(diào)了實(shí)證研究的關(guān)鍵作用。
比如AI是起到互補(bǔ)作用?還是提升了生產(chǎn)力?它會(huì)在多大程度上替代原本由人完成的任務(wù)?Kaplan說(shuō)他們正把這些數(shù)據(jù)開(kāi)放給經(jīng)濟(jì)學(xué)家去分析。
他還特別提到AI在軟件工程領(lǐng)域的應(yīng)用,拋出了一個(gè)更深層次的問(wèn)題:「像我們?cè)谲浖こ讨锌吹降倪@么多人用AI,這種趨勢(shì)會(huì)擴(kuò)散到所有知識(shí)工作嗎?還是會(huì)慢得多?它又會(huì)怎樣滲透進(jìn)我們的日常生活?」
從Claude 4的突破到DeepSeek的異軍突起,全球AI競(jìng)賽正以前所未有的速度推進(jìn)。
它將如何改變我們的工作、生活乃至整個(gè)世界?
正如Kaplan所言,答案或許藏在數(shù)據(jù)與實(shí)證研究中,而我們每個(gè)人都將是這場(chǎng)變革的見(jiàn)證者和參與者。
參考資料:
https://www.youtube.com/watch?v=tC_3KAyli4U
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.