99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

AI的「神之一手」,將在人類探索的每個領域再現|AlphaGo之父最新訪談

0
分享至


作為一個天才少年、新晉諾獎得主、Google DeepMind 聯合創始人兼首席執行官,以及人工智能(AI)行業最具影響力的人物之一,Demis Hassabis 對 AI 的技術發展、應用和未來趨勢有著前瞻性的理解。

他堅信,AI將成為有史以來最具變革性的技術,將影響整個世界,影響每一個行業,影響每一個國家。他將 AI 比作為“電”和“火”,并認為全世界都應該參與其中。

要讓)哲學家、社會科學家、經濟學家(都參與進來),而不僅僅是科技公司,也不僅僅是科學家,讓他們參與到決定如何建造以及如何使用 AI 的過程。

日前,在做客由美國知名風險投資家、LinkedIn 聯合創始人 Reid Hoffman 主持的播客頻道 Possible 時,他毫不吝嗇地分享了他對 AI、博弈論、多模態以及創造力的個人見解。

他不僅回憶了個人經歷——從童年時期就對國際象棋和圍棋等游戲充滿興趣,并最終將興趣轉向 AI 領域,還重點談到了 DeepMind 的兩個重要項目:AlphaGo(第一個在圍棋中擊敗人類世界冠軍的 AI)和 AlphaFold(解決了長達 50 年的蛋白質折疊問題)。

核心觀點如下:

  • AlphaGo 的“第 37 步”證明了機器能夠超越人類既定的知識框架,憑借經驗自學出前所未見的創造性策略,這正是我們追求的‘智能’標志。

  • 真正的創造力有三個層次:插值、外推法和發明。AI 目前能做到前兩個層次,但第三個層次仍然是我們尚未實現的目標。

  • AI 的最大價值在于加速科學發現。AlphaFold 在一年內完成了博士生 10 億年的研究工作,將蛋白質折疊問題從幾十年的難題變成了可解決的任務。

  • 被動感知可能足夠讓 AI 理解世界,但具身智能需要在現實世界中行動,才能真正掌握物理世界的復雜性。

  • AI 將成為人類創造力的延伸,讓創意人士和程序員能夠以全新的方式實現想法。未來的工作流程將更加流暢,效率提升 10 倍。

學術頭條在不改變原文大意的情況下,對完整訪談做了精編,如下:

REID

Demis,歡迎來到 Possible。在皇后區和你共進晚餐真是太棒了。從各方面來說,這都是一個特別的時刻。我想先從一個問題開始,這個問題出自你在巴貝奇劇院的講座,也出自你和 Mohamed El-Erian 的爐邊談話。我的問題是:請你分享一下,你如何從“我童年一直在玩國際象棋”轉變為“我想開始關于「思考」的思考。我想加速思考的過程,而計算機是實現這一目標的一種方式”。你是如何想到這一點的?當時你多大?是什么促使你有了這種元認知?

Demis Hassabis:

首先,感謝你的邀請。對我來說,國際象棋,以及游戲,其實就是一切的起點。我從 4 歲開始認真下棋,整個童年都如此,代表英格蘭大部分青少年隊參賽,還擔任過很多隊的隊長。很長一段時間里,我的主要目標是成為一名職業棋手,一位特級大師——也許有一天,成為世界冠軍。我的整個童年都圍繞著這個目標展開。除了上學,我一有空就去下棋,去世界各地,在國際比賽中與成年人對弈。大約 11 歲時,我突然覺得,雖然我熱愛國際象棋——直到現在我仍然熱愛——但它真的值得人們傾盡一生嗎?這是對我的思維的最佳利用嗎?這曾經是讓我有點困擾的一件事。但另一件事是,當我們和英格蘭國際象棋隊一起去訓練營時,我們開始使用早期的國際象棋計算機來嘗試提高棋藝。我記得我當時是這樣想的——當然,我們應該專注于改進國際象棋的開局、理論和戰術——但實際上,更令我著迷的是,有人竟然能夠通過編程讓這個毫無生氣的塑料塊跟我下得一手好棋。我對他們的實現方式非常著迷。我真的很想理解這一點,并最終嘗試編寫我自己的國際象棋程序。

ARIA:

這太有趣了。之前我跟 Reid 說過,我 7 歲的孩子所在的學校剛剛贏得了紐約州國際象棋錦標賽冠軍。所以他們要追上你還有很長的路要走,但他卻信以為真,說:“哦,對了,媽媽,我要去玩玩電腦上的 ChessKid。我要和電腦下幾盤。”這在幾十年前當然算得上是天方夜譚。我記得我上中學時,那場比賽顯然是 Deep Blue 對陣 Garry Kasparov,那是人機對決的時刻。你剛才提到,根據大師級的數據,這說明,這是蠻力對抗自學系統。你能詳細談談這種二分法嗎?

Demis Hassabis:

是的。首先,你兒子下棋真是太好了,我覺得這太棒了。我非常提倡在學校里把國際象棋作為課程的一部分。我認為這對思維能力的訓練非常棒,就像數學或編程一樣。它確實影響了我處理問題、解決問題、構思解決方案和制定計劃的方式。它教會了我所有那些令人驚嘆的元技能——如何應對壓力。所以你在小時候就能學到所有這些,這對你以后做其他事情都很有幫助。至于 Deep Blue,你說得對,大多數早期的國際象棋程序——后來 Deep Blue 成為了其中的巔峰——都是這類專家系統,在當時是研究人工智能的首選方式。實際上,解決問題的是程序員——在這個例子中,就是下棋。

然后,他們將解決方案封裝成一套啟發式規則,引導一種蠻力搜索,在本例中,就是為了找到好的棋步。我一直有這種想法,雖然我對這些人工智能象棋程序著迷——它們能做到這一點——但我也對它們略感失望。實際上,當我接觸到 Deep Blue 時——當時我已經在劍橋大學讀本科了——我對 Kasparov 的思維比對機器的印象更深刻,因為我當時已經開始學習神經科學了。因為這是一個非常強大的機器——它只會下棋。而 Kasparov 不僅能下棋達到差不多的水平,還能做其他所有人類能做到的令人驚嘆的事情。所以我想,這難道不正說明了人類思維的奇妙嗎?

更重要的是,這意味著 Deep Blue 和這些專家系統方法缺少了某種非常根本的東西。非常明顯。因為 Deep Blue 看起來并不智能——盡管它在當時是人工智能的巔峰之作——它缺少的是學習能力,學習新事物的能力。比如,Deep Blue 能達到國際象棋世界冠軍的水平,卻不精通井字棋,這太不可思議了。你必須重新編程,因為系統中沒有任何東西允許它玩井字棋。這很奇怪,這與人類大師級選手截然不同,他們顯然可以輕松地玩一些更簡單的游戲。而且,它也不具備通用性,就像人類思維那樣。我認為這些正是人工智能的標志。我從那場比賽中得到的啟示是,這些是智能的標志,如果我們想要攻克人工智能,這些標志是必不可少的。

REID:

稍微談一下深度學習,這顯然也是 DeepMind 命名的原因之一。我認為,你們提出的那個看似完全相反的假設——自我對弈和學習系統——部分原因是,這種學習方法正是生成這些重要系統的正確方法。所以,請簡單談談這個假設,比如穿越沙漠的旅程是什么樣的,以及最終找到尼羅河的結果是什么。

Demis Hassabis:

我們在 2010 年創立 DeepMind 時,工業界還沒有人研究這個,學術界也幾乎沒有這方面的研究。我們把公司命名為 DeepMind,一部分原因是因為深度學習。這也是對 Hitchhiker’s Guide to the Galaxy 中的“Deep Thought”(深思)以及 Deep Blue 和其他人工智能產品的致敬。但主要還是圍繞著一個想法——我們會押注這些學習技術。深度學習和分層神經網絡,它們才剛剛被發明出來,是 Jeff Hinton 和同事在 2006 年進行的開創性工作。所以它非常非常新。強化學習一直是 DeepMind 的專長。還有從反復試驗中學習,從經驗中學習的理念;然后制定計劃,并在現實中采取行動。

我們將這兩者結合起來,實際上,我們算是先行者,我們將這兩種方法稱為深度強化學習。深度學習用于構建環境模型,或者說你正在做的事情的模型——在這個例子中是游戲。然后強化學習進行規劃和行動,并真正實現并能夠構建能夠實現目標的 agent 系統——在游戲中就是最大化得分,贏得比賽。我們認為這實際上就是智能所需的全部內容。我們對此非常有信心的原因實際上是用大腦作為例子,基本上,這是大腦運作的兩個主要組成部分。大腦是一個神經網絡。它是一個模式匹配和結構查找系統。

但它也包含強化學習,以及通過反復試驗進行規劃和學習,并試圖最大化回報的理念,這實際上存在于人類大腦和動物大腦——哺乳動物的大腦——多巴胺系統實現了這一點。一種強化學習的形式叫做 TD(temporal difference,時間差分)學習。所以這給了我們信心,如果我們在這個方向上足夠努力,即使沒有人真正這樣做,最終也應該會成功,因為我們有人類思維存在的證據。當然,這也是我學習神經科學的原因。因為當你身處沙漠時,你需要任何水源或任何可能讓你走出沙漠的證據。即使是遠處的海市蜃樓,在你身處沙漠之中時,也能為你指明方向。當然,人工智能本身也處于這種困境之中,因為它已經失敗了好幾次。專家系統方法基本上已經達到了極限。

REID:

所以,這個學習系統最終創造的成果之一,顯然就是解決了之前被認為是無解的問題。甚至有人認為計算機無法解決圍棋問題,而它做到了。它不僅解決了圍棋問題,而且在經典的“第 37 步”中,展現了超越數千年圍棋、書籍和數百年比賽的獨創性和創造力。“第 37 步”對于理解人工智能的現狀有何意義?你認為下一個“第 37 步”是什么?

Demis Hassabis:

圍棋之所以比國際象棋難得多,最終也比國際象棋難得多,就是因為又花了 20 年時間,我們才有了 AlphaGo。所有用于國際象棋的方法,這些專家系統的方法,在圍棋上都失敗了,基本上連職業選手都贏不了,更不用說世界冠軍了。主要有兩個原因,一是圍棋的復雜性非常巨大,衡量這一點的一種方法是,圍棋有 10 的 170 次方種可能的走法,比宇宙中的原子還要多得多。你不可能強行破解圍棋;但更難的是,它是一項如此美麗、深奧、優雅的游戲,它被認為是一種藝術——實際上是一種亞洲的藝術形式。

因為它不僅在美學上很美,而且它關乎模式,而不是國際象棋更注重的那種粗暴計算。所以,即使是世界上最優秀的棋手也無法清楚地向你描述他們所使用的啟發式方法。他們只是直覺地感覺到正確的走法,他們有時會這么說。“這步棋,你為什么走這步棋?”“嗯,感覺是對的。”然后事實證明,他們的直覺——如果他們是一位天才棋手——是天才的,非常棒。這是一步非常漂亮和有效的棋步。但是,很難將其概括成一套啟發式方法和規則來指導機器如何下圍棋。這就是所有這些 Deep Blue 方法都不起作用的原因。

現在我們通過讓系統自學來解決這個問題——什么是好的模式,什么是好的落子,什么是好的動機和方法,以及哪些是我們有價值的、高概率的獲勝局面。所以它通過經驗自學,通過觀看數百萬盤棋局,并與自己對弈數百萬盤。這就是我們讓 AlphaGo 超越世界冠軍的原因。但更令人興奮的是,這意味著這類系統實際上可以超越我們程序員或系統設計師的認知范圍,沒有專家系統可以做到這一點,因為它當然受到我們已知知識和可以描述給機器的知識的嚴格限制。但這些系統可以自學。

這就是我們在著名的世界冠軍賽第二局中,也就是 2016 年在首爾對陣李世石的挑戰賽中,邁出的“第 37 步”的棋步。這真是一步極具創意的棋步。要知道,圍棋已有數千年歷史,是人類發明的最古老的游戲,也是最復雜的游戲。即便如此,盡管眾多杰出的人類棋手進行了如此多的探索,這“第 37 步”仍然是前所未有的。它甚至被認為是一個糟糕的策略,事實上,如果你去看 AlphaGo 的紀錄片,你會看到,當專業解說員看到“第 37 步”時,他們差點從椅子上摔下來,因為他們認為這是一個錯誤。

他們以為是電腦操作員 Aja 操作失誤,因為簡直無法想象有人會下出這樣的棋。當然,一百步之后,事實證明,“第 37 步”——棋子,也就是放在棋盤上的那個棋子——正好落在了決定整盤棋局的正確位置。所以現在它被當作圍棋的偉大經典、圍棋史——那盤棋和那步棋——來研究。更令人興奮的是,這正是我們希望這些系統能夠做到的。因為我和我的整目標,我一生致力于人工智能研究,就是為了利用人工智能來加速科學發現。而這些新的創新,盡管是在棋局中,正是我們從我們的系統中所尋求的。

REID:

我認為這很好地詮釋了為什么這些學習系統至今仍在進行原創性探索。你認為下一個“第 37 步”會是什么,它能讓我們更加深入地了解人工智能如何極大地提升人類思維、人類生活和人類科學的質量?

Demis Hassabis:

嗯,我覺得幾乎在人類探索的每個領域都會出現很多“第 37 步”。當然,從那時起,我一直關注的是如何將這些人工智能技術、學習技術、通用學習技術應用于科學。我將重要的科學領域稱為根節點問題。也就是說,如果你想象一下宇宙中所有知識的樹狀圖——你能否解鎖一些根節點,從而解鎖完整的分支或新的發現途徑,供人們日后在此基礎上進行探索,對我們來說,蛋白質折疊和 AlphaFold 就是其中之一,它始終是我的首選。我腦子里列著一份清單,記錄了我一生中遇到的所有這類問題,我對所有科學領域都很感興趣,并且一直在思考哪些問題適合——既能產生巨大的影響,又能適用于這些技術。

我認為,我們將在人類從事的非常重要的領域,見證這類新戰略、新理念的黃金時代。不過,我想說的是,我們還沒有完全掌握創造力,所以我不想聲稱我們已經掌握了。我認為創造力有三個層次,人工智能能夠做到前兩個層次。第一個層次是插值:你給它一百萬張貓的照片——一個人工智能系統,一百萬張貓的照片——然后你說:“給我畫一只原型貓?!彼粫λ娺^的所有一百萬張貓的照片取平均值,而那個原型貓不會出現在訓練集中,所以它會是一只獨一無二的貓,但從創造力的角度來看,這沒什么意思,這只是平均數。

第二點是我所說的外推法。這更像 AlphaGo,它玩過 1000 萬盤圍棋,也看過幾百萬盤人類圍棋比賽,然后它從已知知識中推斷出一個前所未見的新策略,比如“第 37 步”。這已經非常有價值了。我認為這才是真正的創造力。但還有第三個層次,我稱之為發明或跳出思維定式,也就是說,你不僅能想出“第 37 步”,還能發明 AlphaGo?;蛘呶蚁矚g用的另一個衡量標準是,如果我們回到 1900 年,也就是 20 世紀初愛因斯坦的時代,一個人工智能系統真的能用愛因斯坦當時掌握的相同信息來推導出廣義相對論嗎?顯然,今天的答案是否定的,它無法發明出像圍棋這樣偉大的游戲,也無法僅憑愛因斯坦當時掌握的信息就發明廣義相對論。所以,我們的系統仍然缺少一些東西來支持真正的突破思維定式。但我認為它終將到來,只是我們目前還沒有。

ARIA:

我想很多 AI 領域之外的人會驚訝于這一切都始于游戲,但這對我們正在做的事情來說卻是一種福音。我們就是這樣創建這些系統的。所以,我們從棋盤游戲轉向了電子游戲。你能否簡短地解釋一下,為什么像 AlphaStar 這樣能夠玩《星際爭霸 II》的 AI 比那些能夠下國際象棋或圍棋的 AI 更加先進、更加吸引人?

Demis Hassabis:

是的,AlphaGo 算是登上了棋盤游戲的巔峰,圍棋一直被認為是(棋盤)游戲中的“珠穆朗瑪峰”。但如果把電腦上能玩到的最復雜的策略游戲也算上,那么從某種程度上來說,還有更復雜的游戲?!缎请H爭霸 II》被公認為實時策略游戲的經典之作。它是一款非常復雜的游戲。你必須建立你的基地、你的單位等。所以每場游戲都是不同的,棋盤游戲的流動性非常強,你必須實時移動許多單位。我們解決這個問題的方法是增加一個額外的級別,讓 agent 聯盟相互競爭,每個 agent 的初始策略略有不同。

然后你就得到了一種適者生存的規則。所有 agent 之間會進行一場競賽。現在設置了一種多 agent 系統,在競賽中勝出的策略將進入下一個階段,然后圍繞該階段生成一些其他的新策略。如此反復,持續很多代。你既繼承了我們在 AlphaGo 中提出的自我對弈的理念,又加入了這種多 agent 競爭、近乎進化的動態機制。最終,你會得到一個 agent——或者一系列 agent,或者一組 agent——它們服從納什分布,沒有其他策略能夠勝過它們,但它們會主導大多數其他策略。然后你就得到了這種納什均衡,然后你從中選出最頂尖的 agent。這種策略在這種非常開放的游戲玩法中取得了巨大的成功。

所以它與國際象棋或圍棋截然不同,后者規則非常固定,棋子也總是相同的,而且它是一種非常有序的游戲。而像《星際爭霸》這樣的游戲則更加復雜。所以處理這個問題很有趣。它也包含隱藏信息。你無法一次看到整個地圖。你必須探索它。所以它不是一個完全信息的游戲,我們希望我們的系統能夠應對部分信息的情況,這實際上更像現實世界,在現實世界中,你很少真正掌握所有事情的完整信息。通常你只有部分信息,然后你必須推斷其他所有信息才能制定出正確的策略。

REID:

而這部分游戲方面的內容是——我想你聽說過“游戲的人”(Homo Ludens)理論。我們是游戲玩家。這是否能啟發我們思考游戲如何既具有戰略性,又能促進科學發展,促進創新的偶然性?除了適應度函數、自我博弈的進化以及游戲規模計算的能力之外,游戲的本質中是否還有其他更深層次的元素,能夠讓我們進行這種思考?

Demis Hassabis:

嗯,很高興你提到《游戲的人》 ,這是一本很棒的書,它的核心論點是玩游戲實際上是人類生存的基本組成部分,從很多方面來說,玩游戲本身就是一種人類本能,還有什么比它更人性化呢?當然,它還能激發創造力和樂趣。正如你所知,所有這些都建立在玩游戲的基礎上。所以我一直很喜歡玩游戲,把它作為一種練習和訓練思維的方式,在現實生活中你可能只會遇到少數幾次,但通常都非常關鍵的情境中,比如創辦什么公司、達成什么交易等等。所以我認為游戲是一種練習這些情境的方式。

如果你認真對待游戲,你實際上可以模擬人們在決策情境中會面臨的許多壓力。回到之前,這就是為什么我認為國際象棋是孩子們學習的絕佳訓練場,因為它確實教會了他們所有這些情況。當然,人工智能系統也是如此。我們早期的人工智能系統理念曾是完美的試驗場,部分原因是它們被發明出來是為了給人類帶來挑戰和樂趣。當然,游戲玩法也有不同的層次。所以我們可以從非常簡單的游戲開始,比如雅達利游戲,然后一路升級到最復雜的電腦游戲,比如《星際爭霸》,并不斷挑戰我們的系統。所以我們處于 S 曲線的最佳點。所以它不會太容易,不會太瑣碎,也不會太難,你甚至看不到自己是否取得了任何進展。

你想要達到 S 曲線的最大值,也就是你幾乎呈指數級增長。隨著系統的不斷改進,我們可以不斷選擇難度越來越高的游戲。游戲的另一個優點是,由于它們是現實世界的某種縮影,它們通常被歸結為非常明確的目標函數,所以贏得比賽或最大化得分通常是游戲的目標。這對于強化學習系統或基于 agent 的系統來說很容易實現。所以它非常適合爬山對抗,還可以衡量 Elo 分數、評級以及你的確切位置。最后,當然,你可以與最優秀的人類玩家進行比拼。這樣你就可以校準你的 agent 在它們自己的比賽中的表現。

最后,即使有了星際爭霸 agent,我們最終也不得不挑戰一位星際爭霸的職業大師,以確保我們的系統沒有過度擬合它們自己的比賽策略,實際上需要——我們以此為基礎——它可以是一位真正的人類星際爭霸大師級選手。當然,最后一件事是,你也可以用游戲生成任意數量的合成數據。這又開始流行了,因為數據限制、大語言模型、世界上還剩下多少個 token 以及它是否讀取了世界上的所有內容。顯然,對于像游戲這樣的事物,你實際上可以讓系統與自己對抗,并從正確的分布中生成更多數據。

ARIA:

你能稍微解釋一下嗎?就像您說的,現在很流行討論——我們的數據是否已經用完了?我們是否需要合成數據?你對這個問題持什么立場?

Demis Hassabis:

我一直是“模擬、模擬、然后人工智能”的堅定支持者。就計算系統而言,思考現實世界是什么也很有趣。所以,我一直在嘗試構建非常逼真的模擬系統。現在,這當然也與人工智能相互影響,因為你可以讓人工智能學習某個真實世界系統的模擬器,只需觀察該系統或該系統的所有數據即可。所以,我認為目前的爭論在于,這些大型基礎模型現在幾乎使用了整個互聯網。那么,一旦你嘗試從這些模型中學習,還剩下什么呢?這就是現有的所有語言。當然,還有其他形式,比如視頻和音頻。

我認為我們還沒有用盡所有這類多模態 token ,但即使這樣也會達到某個極限。那么問題就變成了,你能生成合成數據嗎?我認為,這就是數學和編碼領域取得如此巨大進步的原因,因為在這些領域,生成合成數據相當容易。因為合成數據的問題在于,你創建的數據是否來自正確的分布?它是否模擬了真實的分布?你生成的數據是否正確,當然,對于數學、編碼和娛樂(比如游戲)等方面,你可以在將最終數據輸入新系統的訓練數據之前,對其進行實際測試,并驗證其是否正確。所以,在某些領域,它非常適用。事實上,在人類思維中更抽象的領域,你可以驗證并證明其正確性。因此,這解鎖了創建大量合成數據的能力。

REID:

因此,除了圍繞數據的頻繁討論之外,還有一個問題是我們如何獲取更多信息,但其中一個問題是,為了實現人工智能,將其真正嵌入到世界中是否重要?

Demis Hassabis:

是的。有趣的是,如果我們 5 年前,或者 10 年前討論這個問題,我會說,需要一些現實世界的經驗,也許是通過機器人——通常我們談論具身智能時,我們指的是機器人,但它也可以是一個非常精確的模擬器,就像某種超逼真的游戲環境——才能完全理解你周圍世界的物理特性,以及你周圍的物理環境。實際上,神經科學中有一整套分支學科都以此為基礎,它被稱為“感知中的行為”。也就是說,除非你能夠在世界中行動,否則你無法真正完全感知世界。人們會爭論說,除非你能拿起東西并進行比較,然后對重量有概念,否則你怎么能真正理解重量的概念呢?你真的能僅僅通過觀察就能獲得這種概念嗎?

這看起來很難,對人類來說確實如此。我認為你需要在現實世界中行動起來。所以,在現實世界中行動是你學習的一部分。你有點像一個主動學習者。事實上,強化學習就是這樣,因為你做出的決定會給你新的體驗,但這些體驗取決于你采取的行動,但這些體驗也是你隨后學習的對象。所以,從某種意義上說,強化學習系統參與了它們自身的學習過程,因為它們是主動學習者。而且,我認為你可以很好地論證,這在物理世界中也是必需的。但現在,事實證明,我不再相信這一點了。因為現在有了我們的系統,尤其是我們的視頻模型,甚至連我都感到震驚,盡管我們正在構建這個系統,但基本上通過觀看大量的 YouTube 視頻,它就能弄清楚這個世界的物理原理。

針對視頻模型,有一種有趣的圖靈測試,某種意義上是“圖靈測試”。那就是,你能切西紅柿嗎?你能播放一段視頻,視頻中用刀切西紅柿,手指動作都恰到好處,西紅柿不會神奇地彈回原位,或者刀穿過西紅柿而沒有切開,等等。如果你仔細思考物理學的復雜性,就能理解你必須保持一致性等。這非常了不起。很難說它不了解物理學和現實世界的物理學,而且它不需要在這個世界上行動,就能做到這一點。當然也不會像機器人一樣在世界上行動。

Demis Hassabis:

所以,我目前還不清楚單純的被動感知是否存在局限性。有趣的是,我認為這對機器人作為一種具身智能的應用有著巨大的影響。因為我們構建的 Gemini、Veo,以及我們將在未來的某個時候將它們結合在一起——我們從一開始就將 Gemini 構建為多模態的。我們這樣做有兩個原因。首先,我們對通用數字助理的概念有一個愿景。一個可以隨身攜帶的助理,它既可以在數字設備上使用,也可以在現實世界中,比如在你的手機或眼鏡設備上。它可以在現實世界中真正地幫助你——向你推薦東西,幫你導航,幫助你處理烹飪等現實世界中的實際事務。

要做到這一點,你顯然需要了解你所處的環境。這不僅僅是我在聊天機器人中輸入的語言。實際上,你必須了解我所處的三維世界。我認為要成為一個真正優秀的助手,你需要做到這一點。當然,第二點也正是機器人所需要的。我們發布了我們第一個 Gemini robotics 研究成果,這是展示我們能夠利用這些多模態模型做什么的開始,這些模型能夠理解世界的物理特性,并在此基礎上進行一些機器人學微調,以處理機器人需要執行的動作、運動和規劃??雌饋硭鼤嘈?。所以實際上現在,我認為這些通用模型實際上將轉移到具身機器人環境中,而無需太多額外的特殊外殼、額外的數據或額外的工作。這或許是 5 年前大多數人甚至是頂尖機器人專家所無法預料的。

ARIA:

我的意思是,這太瘋狂了(笑)。想想基準測試,想想我們需要這些數字助理做什么。當我們深入研究這些大型人工智能模型時,會發現——嗯,有些人會說這是一種矛盾。所以,權衡的重點在于思考時間和輸出質量。我們需要它們快速,但我們當然也需要它們準確。所以,談談這種權衡是什么?現狀是怎樣的?

Demis Hassabis:

我們可以說是思維系統領域的先驅,因為我們最初的游戲系統都是這么做的,圍棋、AlphaGo。但實際上最著名的是 AlphaZero,它是我們的后續系統,可以玩任何雙人游戲。你總是需要考慮你的時間預算、計算預算,你必須真正做好規劃部分,所以你可以對模型進行預訓練,就像我們今天對基礎模型所做的那樣。所以你可以離線玩數百萬場游戲,然后你就有了你的國際象棋模型,或者圍棋模型,不管它是什么。但在測試時,在運行時,你只有一分鐘的時間來思考你的舉動,一分鐘乘以你運行的計算機數量。所以這仍然是有限的計算預算。

所以今天非常有趣的是,在使用更昂貴、更大的基礎模型時要有一個權衡,所以在我們的例子中,我們有不同大小的名稱,比如 Gemini Flash、Pro,甚至更大的 Ultra。但這些模型運行成本更高,所以運行時間更長,但它們更準確,功能更強大。所以你可以運行一個規劃步驟更少的更大模型,或者你可以運行一個非常高效、更小的模型,雖然功能稍弱,但可以運行更多步驟。實際上,我們發現,兩者大致相同。當然,我們想要找到的是這個模型的帕累托前沿 (Pareto frontier) ,就是在模型大小、運行該模型的成本與你所需的思考時間以及單位計算時間能夠完成的思考步驟之間找到一個恰當的平衡點。我認為這實際上是目前相當前沿的研究,所有領先的實驗室可能都在進行實驗。我認為現在還沒有一個明確的答案。

REID:

所有主要的實驗室,包括 DeepMind 和其他一些公司,都在積極研發編程助手。原因有很多。首先,它是加速整個前端生產力的因素之一。它擁有良好的適應度函數。當然,它也是提高每個人生產力的方法之一,那就是擁有一個軟件副駕駛 agent 來提供幫助。原因有很多?,F在,有一件事情變得有趣,那就是在構建這些軟件時,顯然人們傾向于從為人類設計的計算機語言入手。那么,哪些計算機語言是為人工智能或 agent 世界設計的呢?或者說,哪些計算機語言是為人類和人工智能的混合過程設計的?這是一個開始研究這些計算機語言的好時機嗎?它將如何改變我們的計算理論、語言學等?

Demis Hassabis:

我認為我們正在進入一個編碼的新時代,這將會非常有趣。正如你所說,所有領先的實驗室都在推進這一前沿領域的研究,原因有很多。創建合成數據很容易,這也是每個人都在推進這一方向的另一個原因。我認為我們將進入一個新世界——有時被稱為氛圍編碼——你基本上是在用自然語言進行編碼。我們以前在計算機上見過這種情況,我記得上世紀 80 年代我剛開始編程時,我們用的匯編語言。當然,現在看來這很瘋狂,比如為什么要用機器代碼?你一開始用的是 C 語言,然后是 Python 等。

實際上,我們可以看到編程語言的抽象層級越來越高,而某種意義上,越來越多的底層實現細節留給編譯器,這是自然而然的演進?,F在,我們可以將其視為自然而然的最終步驟——“好吧,我們就用自然語言吧?!?然后一切都變成了高級編程——超高級編程語言。我認為最終我們或許會達到這個目標。令人興奮的是,它當然會讓一系列全新的人群,包括創意人士,更容易理解編程,設計師、游戲設計師、應用程序編寫者,如果沒有程序員團隊的幫助,他們通常無法實現自己的想法。

所以,我認為從創造力的角度來看,這將非常令人興奮。對程序員來說,這也可能非常有利,至少在未來幾年是這樣。因為我認為這些人工智能工具的普遍情況是,最初從中獲益最多的人將是該領域的專家,他們也知道如何以正確的方式使用這些工具。無論是提示還是與現有代碼庫交互。我認為會有這樣一個過渡期,屆時那些擁抱這些新工具的專家——無論是電影制作人、游戲設計師還是程序員——將會像超人一樣,展現出他們的能力。我看到我的一些電影導演和電影設計師朋友,他們能夠在一天之內獨立完成新電影創意的設計。但這是一個質量非常高的宣傳方案,他們可以爭取到 1000 萬美元的預算。

通常情況下,他們得花費數萬美元才能完成那個融資演示,這對他們來說是一個巨大的風險。我認為這將會是一系列全新的、令人難以置信的機遇。還有一個問題是,如果你考慮創意,考慮創意藝術,是否會有新的工作方式。更加流暢。你不用再使用 Adobe Photoshop 之類的工具,而是用這個流暢響應的工具來共同創作。這有點像我想象中的少數派報告(Minority Report),但這需要人們適應全新的工作流程,才能最大限度地利用它。但我認為,當他們這樣做時,對那些人來說可能是不可思議的。他們的工作效率會提高 10 倍。

ARIA:

所以,我想回到我們之前討論的多模態世界,也就是現實世界中的機器人。目前,大多數人工智能不需要實時地實現多模態,因為互聯網本身就不是多模態的。對于我們的聽眾來說,這意味著需要同時吸收多種類型的輸入——語音、文本、視覺。你能否更深入地談談,你認為真正實時的多模態人工智能會帶來哪些好處?要達到這一點,又面臨哪些挑戰?

Demis Hassabis:

首先,我們生活在一個多模態的世界,我們擁有 5 個傳感器,這就是我們之所以為人的原因。所以,如果我們希望我們的系統成為出色的工具或輔助工具,我認為最終它們必須理解我們所處的世界——空間和時間的世界。而不僅僅是語言和數學的世界,抽象思維的世界。我認為它們需要能夠在現實世界中行動、規劃和處理事物,并理解現實世界。我認為機器人技術的潛力巨大,還沒有迎來 ChatGPT 或 AlphaFold 那樣的時刻,比如在科學和語言領域,或者 AlphaGo 那樣的時刻。我認為這些即將到來,我們已經很接近了,正如我們之前談到的,為了實現這一點——我認為最短的路徑就是這些通用的多模態模型最終足夠好,可以安裝在機器人身上,也許我們離這個目標并不遠了。

現在還存在額外的挑戰,比如你必須把它安裝在本地,或者本地芯片上,確保延遲足夠快等等。但眾所周知,只需再等幾年,今天最先進的系統明天就能裝在小小的移動芯片上。所以,我認為從機器人、輔助以及創造力的角度來看,多模態是非常令人興奮的。

我覺得大家似乎真的很喜歡使用它。你現在是在和一個多模態聊天機器人對話,你可以讓它用圖片表達情感?;蛘吣憧梢越o它一張圖片,讓它修改,然后再用文字描述繼續處理。比如,“你能去掉那個背景嗎?你能做到這個嗎?”所以這又回到了我們之前提到的關于編程或任何這類在新工作流程中運用創意的事情。這僅僅是個開始。當然,它還能處理視頻、編碼以及各種各樣的東西。

REID:

人們經常猜測的一件事就是人工智能工作的地理定位。顯然,在美國,我們會密切關注西海岸發生的一切。我們也密切關注 DeepMind,還有 Mistral 和其他公司。對于世界來說,了解歐洲的發展有哪些真正關鍵的東西?擁有多個主要創新和發明中心有什么好處?不僅僅是西海岸,顯然還有倫敦的 DeepMind,巴黎的 Mistral,以及其他一些地方。有哪些事情值得人們關注——為什么它很重要以及正在發生什么,尤其是在英國和歐洲的人工智能生態系統中?

Demis Hassabis:

我們在倫敦創立了 DeepMind,并將總部設在這里,背后有很多原因。首先,這里是我成長的地方,是我熟悉的環境,我的人脈也大多在這里。

從競爭角度來看,我們認為英國和歐洲的人才質量可以媲美美國頂尖高校,尤其是應屆畢業生。你知道,我的母校是劍橋大學,還有牛津大學,這些學校和麻省理工、哈佛、常春藤盟校齊名,通常都排在世界大學排名的前十位。但如果你在劍橋拿到物理博士學位,不想進入倫敦的對沖基金做金融,而是想繼續接受智力挑戰,留在英國,選擇其實并不多。因為深科技初創公司很少。我們是第一家真正證明這條路是可行的公司,也因此對整個歐洲都產生了強大的吸引力。我們從慕尼黑、瑞士等地的技術大學招募了許多頂尖人才,這在很長一段時間內都是我們的核心競爭力之一。另外,相比美國西海岸,這里的薪資水平更低,也幾乎不用與大型科技公司正面競爭,這對我們來說是非常有利的。

我選擇這樣做的另一個原因是,我知道通用人工智能(AGI)是一個需要 20 年完成的使命。這是我們從一開始就計劃的,先解決智能問題,然后以此解決其他所有問題,也是我們闡明的使命宣言,時至今日我仍然認同這個框架。如今我們已經完成了 15 年,雖然難以置信,但已大致步入正軌,這對于任何長達 20 年的計劃來說都是很少見的。如果你投身于深入的技術、科學使命中,就不想受到太多干擾。比如我發現硅谷的一個問題是,雖然硅谷有很多好處——人脈、支持系統、資金和眾多人才,但它很容易讓人分心。就像每個人都想創辦一家他們認為會改變世界的初創公司,但結果往往只是一個照片應用程序之類的東西。當然,這也有可能催生一些偉大的成果,但對于真的想致力于一項自認為是最重要的長期使命者來說,其中會有很多干擾。你和你的員工難免會動搖:“如果我跳槽,趕緊做個游戲應用什么的,說不定能賺個一億美元!”我認為至少在當時,硅谷的環境就是這樣的?,F在情況可能已經有所改變,當下的初創企業可能更注重使命。但我也想證明,這樣的使命在其他地方也能做到。

我認為,還有一個非常關鍵的原因是:人工智能將影響整個世界,涉及所有行業、每一個國家。我相信,它將成為人類歷史上最具變革性的技術,甚至比電力、火、互聯網或移動設備的影響更大。

既然如此,讓全世界都參與到它的設計和治理中,就顯得尤為重要。不同地區有著不同的價值觀,比如來自西歐和美國的民主價值體系。我們不希望這種影響力僅僅局限在加州那一小塊區域內。我們需要廣泛的、多樣化的投入——不僅僅是地理層面的,也包括來自哲學家、社會科學家、經濟學家、學術界和公民社會的聲音。不應該只是科技公司和科學家的專屬。我們從一開始就非常重視這一點。讓英國和歐洲參與頂層設計是件好事。

ARIA:

所以,Demis,當有人問我:“嘿,Aria,我知道你對人工智能很感興趣,但它能幫我寫郵件嗎?它有什么特別之處嗎?” 我會說:“不,想想它在醫學領域能做什么?!?我總是談論 AlphaFold。我會告訴他們 Reid 正在做的事情。我對這些突破感到非常興奮。你能不能稍微介紹一下——你們在 AlphaFold 上取得了開創性的突破,它將對醫學的未來產生什么影響?

Demis Hassabis:

我一直覺得,人工智能最重要的用途有兩個。一是人類健康——試圖解決和治愈可怕的疾病,這是最重要的。二是幫助實現能源可持續性和氣候問題,我們稱之為地球健康。這兩個領域正是我們科學小組關注的。就我們從一開始就大力推動這兩個領域而言,我們的小組在人工智能實驗室中是相當獨特的。蛋白質折疊對我來說尤其重要。30 年前,我在劍橋讀本科時就接觸過蛋白質折疊。它一直縈繞在我的心頭,就像一個奇妙的謎題,能夠解開無數的可能性。

關于蛋白質的結構。生命中的一切都依賴于蛋白質,我們需要了解蛋白質的結構才能了解它們的功能。如果我們了解了它們的功能,就能理解疾病的根源,并且如果了解蛋白質的三維結構,我們就能設計出與蛋白質表面正確位置結合的藥物和分子。這是一個非常有趣的問題。它也涉及到我們之前討論的所有計算問題。你能列舉嗎?你能從這片無限可能中看透一切嗎?蛋白質折疊的方式多種多樣。有人估計 Levinthal 在 20 世紀 60 年代就做出了著名的猜想——平均來看,1 種蛋白質折疊方式有 10 到 300 種。那么,如何列舉這些天文數字般的可能性呢?然而,有了這些學習系統,這一切都成為可能。

這就是我們對 AlphaFold 所做的。以前,根據經驗,一名博士生需要花費整個博士學位的時間才能發現一種蛋白質結構,也就是 4、5 年。而科學界已知的蛋白質種類有 2 億種。而我們在一年內就將它們全部折疊。換句話說,我們在一年內完成了博士生 10 億年的研究工作。然后將其免費提供給全世界使用。全球已有 200 萬研究人員使用過它。我們成立了一家名為 Isomorphic 的新公司,試圖進一步深入下游領域,開發所需的藥物,并嘗試縮短這一時間。

ARIA:

這真是太棒了。Demis,他們授予你諾貝爾獎是有原因的。非常感謝你在這個領域所做的所有工作。這真的太棒了。

REID:

現在快速提問一下,有沒有一部電影、一首歌或一本書讓你對未來充滿樂觀?

Demis Hassabis:

我看過很多電影,它們都給了我很大的啟發。比如 《銀翼殺手》 。它可能是我最喜歡的科幻電影。但它可能沒那么樂觀。如果你想看一部樂觀的電影,我會推薦 Iain Banks 的 《文明》 系列。我認為這是對后通用人工智能宇宙的最佳描繪,在這個宇宙里,基本上就是人工智能、人類、甚至外星物種組成的社會,以及人類在銀河系中最大程度的繁榮。這是我對人類未來美好而激動人心的期盼。

ARIA:

你希望人們經常問你什么問題?

Demis Hassabis:

我經常想,為什么包括我在內的人們,不怎么討論現實的一些基本屬性?實際上,這些問題在我小時候就促使我思考如何構建人工智能,將其作為科學的終極工具。例如,我不明白為什么人們不去思考時間是什么?引力是什么?這些其實就是現實的基本結構,它每時每刻都在我們身邊。所有這些顯而易見的事情都在影響著我們。而我們卻對它們究竟是如何運作的一無所知。我不知道為什么人們沒有對此感到困擾(笑)。這讓我很困擾,我很想和大家就這些話題進行更多探討。但實際上,大多數人似乎都回避這些話題。

REID:

在你的行業之外,哪些進步或動力可以激勵你?

Demis Hassabis:

這個問題很難回答,因為人工智能非常普遍,幾乎觸手可及。除了人工智能之外,還有什么行業?我不確定有多少。也許量子領域的進展很有趣。我仍然相信人工智能會先被構建出來,然后或許會幫助我們完善量子系統。但我和我的一些量子領域的朋友,比如 Hartmut Neven,一直打賭他們會先構建量子系統,然后這將有助于我們加速人工智能的發展。所以我一直密切關注量子計算系統的進展。

ARIA:

最后一個問題。你能否給我們提個醒:如果一切都超過了人類的預期,人類會在未來 15 年內面臨哪些可能?實現這一目標的第一步是什么?

Demis Hassabis:

我希望,我們在醫學領域能取得真正的突破。我想,也許在未來 10年、15 年,我們真的能夠攻克所有疾病,這就是 Isomorphic 的使命。我認為,通過 AlphaFold,我們展示了以數字速度進行科學研究的潛力。為什么這不能也應用于藥物研發呢?我希望 10 年、15 年后,我們回顧今天的醫學,就像回顧中世紀以及當時的醫學發展一樣。我認為,這將是我們能想象到的 AI 帶來的最不可思議的好處。

https://www.possible.fm/podcasts/demis/

編譯:錦鯉

如需轉載或投稿,請在公眾號內留言

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
專打國家元首的金牛座導彈抵烏!紅場勝利日閱兵式需要掂量了

專打國家元首的金牛座導彈抵烏!紅場勝利日閱兵式需要掂量了

大風文字
2025-04-25 18:56:10
又美又颯!吳艷妮13米00奪第七:戰斗天使真美,挑戰世界頂尖選手

又美又颯!吳艷妮13米00奪第七:戰斗天使真美,挑戰世界頂尖選手

李喜林籃球絕殺
2025-04-26 21:09:17
調度中心不雅畫面人員被停職調查,知情者披露兩人疑似身份內情

調度中心不雅畫面人員被停職調查,知情者披露兩人疑似身份內情

Likepres
2025-04-25 22:29:07
儲戶慌嗎?存款方面迎來4個方面的調整,已存的人咋辦?

儲戶慌嗎?存款方面迎來4個方面的調整,已存的人咋辦?

話史官1
2025-04-26 15:03:19
深圳殉情男子遺書稱想與妻子合葬 岳母:連女兒的牙刷他都不舍得丟 想不到他深情到這個地步

深圳殉情男子遺書稱想與妻子合葬 岳母:連女兒的牙刷他都不舍得丟 想不到他深情到這個地步

閃電新聞
2025-04-26 10:42:31
小米YU9曝光,雷軍讓3億中產沸騰了

小米YU9曝光,雷軍讓3億中產沸騰了

互聯網品牌官
2025-04-24 16:06:32
喬-科爾:希望穆里尼奧回英超,想在三、四年內奪冠找他就對了

喬-科爾:希望穆里尼奧回英超,想在三、四年內奪冠找他就對了

直播吧
2025-04-26 21:55:12
2025年一季度出口值30強城市:蘇州、寧波環比大增,鄭州漲勢喜人

2025年一季度出口值30強城市:蘇州、寧波環比大增,鄭州漲勢喜人

Data居士
2025-04-26 10:59:59
美麗的新娘

美麗的新娘

動物奇奇怪怪
2025-04-27 00:35:07
69年九大名單出爐,毛主席發怒:怎么沒他?此人痛哭:主席記得我

69年九大名單出爐,毛主席發怒:怎么沒他?此人痛哭:主席記得我

可樂88
2024-04-26 09:14:34
不滿裁判吹罰?崔康熙:大家都是足球人 有些問題我沒法直說

不滿裁判吹罰?崔康熙:大家都是足球人 有些問題我沒法直說

球事百科吖
2025-04-27 04:40:14
航母才是最大的捕魚船?遼寧艦每次帶回數十噸海鮮,全部銷毀!

航母才是最大的捕魚船?遼寧艦每次帶回數十噸海鮮,全部銷毀!

百態人間
2025-04-22 16:26:25
中年女人有意讓你“拿下”,會有一個表現:兩個字

中年女人有意讓你“拿下”,會有一個表現:兩個字

蓮子說情感
2025-01-11 10:26:07
王勵勤遇當頭一棒!國乒大潰敗,單打16人參賽15人出局;日本強勢

王勵勤遇當頭一棒!國乒大潰敗,單打16人參賽15人出局;日本強勢

莼侃體育
2025-04-26 08:27:26
王菲現身謝霆鋒演唱會!《玉蝴蝶》唱響時,王菲陶醉起舞,太甜了

王菲現身謝霆鋒演唱會!《玉蝴蝶》唱響時,王菲陶醉起舞,太甜了

叨嘮
2025-04-26 02:45:58
1-0大冷門,90分鐘絕殺,英冠第22掀翻英冠第6,蘭帕德率隊2連敗

1-0大冷門,90分鐘絕殺,英冠第22掀翻英冠第6,蘭帕德率隊2連敗

側身凌空斬
2025-04-26 21:39:34
北京房價:泡沫與走勢分析

北京房價:泡沫與走勢分析

流蘇晚晴
2025-04-26 21:36:36
殺人誅心!大S離世后,小玥兒的第一個生日現場曝光,網友集體破防了

殺人誅心!大S離世后,小玥兒的第一個生日現場曝光,網友集體破防了

瞎說娛樂
2025-04-26 10:55:49
大比分2-1!塔圖姆空砍36+9,黑馬雙星合砍61分,凱爾特人遭逆轉

大比分2-1!塔圖姆空砍36+9,黑馬雙星合砍61分,凱爾特人遭逆轉

老梁體育漫談
2025-04-26 10:06:15
突降6℃!湖北接下來大反轉

突降6℃!湖北接下來大反轉

魯中晨報
2025-04-26 11:20:10
2025-04-27 05:28:49
學術頭條
學術頭條
致力于學術傳播和科學普及,重點關注人工智能、生命科學等前沿科學進展。
1247文章數 5069關注度
往期回顧 全部

科技要聞

百度心響實測:“能用版Manus”開了個好頭

頭條要聞

特朗普將舉行集會慶祝執政100天 美媒:時機不妙

頭條要聞

特朗普將舉行集會慶祝執政100天 美媒:時機不妙

體育要聞

廣廈19分勝遼寧獲開門紅 孫銘徽13分3助崴腳

娛樂要聞

金掃帚獎出爐,包貝爾意外獲“影帝”

財經要聞

韓國的"宇樹科技" 是怎樣被財閥毀掉的?

汽車要聞

充電5分鐘續航100公里 探訪華為兆瓦超充站

態度原創

游戲
藝術
家居
數碼
公開課

夢幻西游:出了雙固傷玉魄卻難過,口袋版成刷80級環裝首選

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

家居要聞

清徐現代 有溫度有態度

數碼要聞

AMD修補高危安全漏洞!歷代Zen架構CPU 100%中招

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 广宗县| 邢台市| 丰都县| 瑞昌市| 娄底市| 定襄县| 南部县| 锡林浩特市| 静宁县| 景洪市| 页游| 修武县| 常宁市| 金湖县| 舞阳县| 临猗县| 大田县| 营山县| 绥阳县| 晴隆县| 贡山| 大庆市| 穆棱市| 威宁| 大港区| 中阳县| 平武县| 木里| 阿尔山市| 咸宁市| 西平县| 玉树县| 班玛县| 鲁甸县| 瑞昌市| 双城市| 富阳市| 常宁市| 伊宁市| 嘉善县| 泰顺县|