99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

人工智能加速科學仿真、設計、控制和發現

0
分享至


摘要

近年來,隨著AI for Science(科學智能)的蓬勃發展,人工智能與各門科學的交叉融合逐漸成為一個顯著的科學研究趨勢。但是,AI for Science所涉及的范圍很廣,學科眾多,因此,將其梳理成一個統一的體系能夠更好地為初入領域的研究者導航。本文認為,盡管各門科學研究的對象、方法看似千差萬別,但人工智能可以為科學研究提供一套普適的范式和方法,解決各科學領域內的重要問題。本文將從科學仿真、設計和控制、發現三個方面展開綜述,明確任務設置,梳理當前的代表性工作,并通過具體的例子,闡釋人工智能如何為科學研究助力,以期使讀者能夠更好應用已有的方法,或者研究新的方法。


本文發表于《計算物理》,經同意轉載。

研究領域:人工智能;科學仿真;設計;控制;科學發現

吳泰霖 | 作者

0. 引言

近年來,人工智能(AI)與科學領域的交叉融合迅猛發展,AI for Science(科學智能)已經成為一個蓬勃發展的交叉學科。盡管各門科學(例如物理、化學、生命科學、材料等)研究的對象、方法看似千差萬別,但是 AI for Science 有希望為各門科學提供統一的范式和方法,并極大加速其發展。本文認為,人工智能可以在仿真、設計和控制、發現等三方面,為科學研究提供一套普適的方法,解決領域內重要問題。為此,本文將介紹人工智能用于科學仿真、設計和控制、發現三方面的任務設置和當前進展。在介紹過程中,將著重從一些代表性工作和具體例子出發進行闡釋,不求面面俱到,目的是讓讀者對這一領域有一個初步的認識,從而可以更容易應用已有的方法,或者研究新的方法。

1. AI for Science:從微觀到宏觀

圖 1 畫出了不同學科在時間和空間尺度上所研究的對象的大致范圍,從微觀的粒子物理、量子計算等,介觀的材料科學、細胞生物學等,到宏觀的機械、大氣、能源、天文學等,我們可以看到,不同學科的研究對象跨越了三十多個空間數量級和二十多個時間數量級。


圖 1 不同科學領域的大致空間尺度(橫軸)和時間尺度(縱軸)

盡管如此,這些不同的學科的研究具有極其顯著的共性。具體來說,(1)它們都需要預測所研究系統的狀態隨時間的演化,或者基于邊界條件、結構等預測其穩態和性質,我們稱為仿真或模擬。(2)與以上正向問題相反,研究人員通常需要設計系統的參數、結構,逆向優化某些設計目標(逆向設計),或者根據系統當前的稀疏觀測推測系統完整的參數和初始條件(逆問題)。同時,研究人員需要控制系統的狀態以優化控制目標。(3)此外,研究人員需要從數據以及已有理論出發,發現系統的重要變量和簡單普適的方程,構建描述系統的理論和模型,并通過實驗驗證(科學發現)。以上三類問題,在大多數科學領域中都是普遍存在的核心問題。而人工智能可以為以上問題的解決,帶來新的范式和方法,并且成數量級地加速系統的仿真、設計和控制、發現。同時,人工智能結合學科已有的先驗知識和方法,可以取得更好的效果。以下三節,將分別進行闡述。

2. 人工智能用于科學仿真

2.1 問題定義和方法分類

仿真,是科學研究中的最重要的普適問題之一。從粒子物理中對粒子衰變的仿真、可控核聚變中等離子體仿真、流體力學仿真,到分子動力學仿真、細胞仿真、天體物理仿真等等,我們都需要根據系統的初始條件和邊界條件,模擬一個系統的演化或者預測其穩態。基于此,研究人員可以更好地控制系統的演化,以及優化系統的參數和結構。人工智能用于科學仿真,目的就是提高科學仿真的速度和精度。

首先,我們需要明確系統的描述(圖 2)。我們把系統在時間的狀態稱為,?為系統的演化(可能來自真實物理系統的演化,或者求解器)。為外界在時間對系統的控制輸入,為系統的不隨時間變化的參數,為系統的邊界條件。這一描述可以包含大多數系統的演化。


圖 2 對于系統動力學的描述設置。

如圖 3 所示,根據運用第一性原理和數據驅動的比例,我們可以把不同的仿真方法放在一個光譜上。光譜的最左端是基于第一性原理的傳統數值方法,包括分子動力學求解器,有限元、有限差分等偏微分方程數值方法等。光譜的最右端是基于數據驅動的方法。在光譜的中間區域,為兩者的有機結合。


圖 3 不同仿真方法在第一性原理的傳統數值方法(最左端)到數據驅動(最右端)光譜上的分布,以及其優勢(藍色)和局限性(橙色)。

在光譜的最左端,是基于第一性原理的傳統數值方法。例如,對于如下一般的二階非線性偏微分方程(PDE):

人們通常將其在時間和空間上進行離散化,形成離散的時間狀態,以及通過空間上規則或者非規則的網格來表示系統的狀態(圖 4)。接下來,便可通過有限差分、有限元、有限體積等數值方法進行求解。


圖 4 傳統數值方法將偏微分方程在時間和空間上離散化,以便于數值求解。

盡管傳統數值方法在準確度、可解釋性、誤差保證等方面有優勢,且經過幾 十年的發展,在各領域都建立了各自的求解器,但是,其主要局限性在于求解速度非常慢,往往需要幾小時到幾天才能模擬一個網格量級千萬級以上的大型系統。近幾年興起的基于深度學習的代理模型(簡稱 AI 仿真模型),能夠成數量級地加速以上仿真過程,加速倍數可以達到 10-104 倍。加速的原因在于神經網絡可以學習使用更大的時間步長和空間步長,學習效率更高的表示(例如在隱空間進行演化),或者直接學習從初始和邊界條件到方程解的映射。此外,如果觀測數據量足夠,那么 AI 仿真模型可以比傳統數值方法更為精確。這是因為傳統數值方法基于給定的方程進行離散求解,這些方程往往是真實演化規律的簡化或近似;而深度學習直接從觀測數據中學習,有望捕捉更為復雜的關系。由此,基于 AI仿真模型為科學仿真帶來了新的范式。


圖 5 AI 仿真模型學習一個代理模型,最小化預測誤差。

具體來說,給定一個包含系統狀態軌跡和外界控制序列和參數(但不需要提供方程)的數據集,系統動力學仿真的目標是學習一個 AI 仿真模型模擬系統的演化。通過深度神經網絡參數化一個函數,這一神經網絡根據時刻的系統狀態以及參數、邊界條件和外界控制來預測下一時刻的系統狀態。通過最小化預測狀態與 + 1時刻真實系統狀態+1之間的誤差來進行學習,其優化目標為:

這里(?;?)為損失函數,通常為 MSE、MAE 或者其他合適的函數。在推理時,用訓練的代替求解器,迭代預測系統狀態隨時間的演化。

深度學習方法的效果取決于合適的神經網絡架構和學習模式。表 1 和表 2 分別列出了 AI 仿真模型常用的神經網絡架構和學習范式及其優缺點。這里不同的神經網絡架構以及學習范式可以根據需要進行組合。例如,可以將神經算子架構結合物理信息范式[1-2],這樣可以同時利用其超分辨率的優點以及已知的物理方程減小訓練數據的需要量。又比如,可以將生成模型與物理信息兩個學習范式結合[3],基于 PDE 和數據生成高維、長程的物理仿真。

表 1:AI 仿真模型常用神經網絡架構及其優缺點


表 2:AI 仿真模型常用學習范式及其優缺點


在圖 3 光譜的中央,有著一系列結合第一性原理以及數據驅動范式的神經網絡架構和學習范式。它們結合兩者的優點,適用于已知一部分物理以及有一部分數據(但無大量數據)這一實際中最常見的場景,也是當前 AI+科學仿真的研究前沿。例如,從傳統數值方法出發,可以結合神經網絡構建 solver-in-the-loop 的范式,通過神經網絡學習求解器在低精度網格仿真與真實結果的殘差[4-5],或者根據物理先驗構建代理模型的架構[6-7],從而大大減少訓練數據的需要量,提高預測的精確度。另外,從純數據驅動范式出發,可以在神經網絡架構中考慮系統已知的對稱性和守恒律,并將其植入到神經網絡架構中,使得它們被嚴格滿足。這方面代表性工作有等變圖神經網絡(EGNN[8])、深勢分子動力學(DPMD[9])、 Schnet[10]、考慮規范對稱性的卷積神經網絡[11],以及[12]提出一套普適方法,可以通過標量或者標量與矢量的乘積,將各連續對稱性的等變性或者不變性植入神經網絡使其被嚴格滿足。另外,物理信息神經網絡(PINN[13])將方程以及邊界條件作為損失加入優化目標,也是一類有效的物理先驗植入方法。

2.2 案例研究:圖神經網絡用于物理系統仿真

在這里,我們以圖神經網絡(GNN)舉例,闡明 AI 仿真模型在具體領域的應用及發展的脈絡。首先,2020 年DeepMind 提出Graph Network Simulato(r GNS,圖神經網絡求解器)架構[14],將物理系統建模成為粒子系統,通過圖神經網絡學習粒子之間的相互作用關系,來建模不同的物質(例如流體、沙子、膠泥)的動力學,取得了較好的預測效果(圖 6)。


圖 6 GNS 將物理系統建模成粒子系統,模擬水流(左)、沙子(中)、膠泥(右)的含時演化。(a) GNS 預測結果;(b) 經過渲染后的結果。圖來自[14]。

神經網絡架構上,該工作提出 GNS 模型作為代理模型,由時刻系統的狀態(所有粒子的位置和速度)預測 + 1時刻的狀態(圖 7)。GNS 模型首先通過一個編碼器(圖 7(c)),將每一個粒子的位置和速度分別映射到一個高維隱空間,并構建圖結構。如果兩個粒子之間的距離小于設定的閾值,則連接邊。邊上也可以包含特征,例如相對距離。


圖 7 GNS[14]網絡架構。系統在時刻的狀態(各粒子的位置和速度)作為輸入,經過(c)編碼器, (d)消息傳遞, (e)解碼器,預測 + 1時刻的加速度,經過歐拉法預測 + 1時刻的系統狀態。

接下來,通過層的消息傳遞(message passing),實現圖狀態的更新。對于每一層的信息傳遞,包括三步:(1)學習相互作用:首先在每一條邊上,根據邊的特征和相連的兩個節點的特征,通過一個可學習的多層感知機(MLP),預測消息;(2)聚合相互作用:在每個節點上進行消息的聚合,聚合通常采取相加、平均或者取最大值等對于交換不變的操作;(3)學習聚合的相互作用如何影響節點特征:在每個節點上,將聚合的消息與節點當前層的特征進行級聯(concatenation),通過另一個可學習的多層感知機,預測節點下一層的特征。

最后,將以上結果輸入解碼器,預測下一個時間每個節點的狀態。在訓練時,通過最小化預測誤差,反過來學習以上的編碼器、解碼器和消息傳遞中的可學習的多層感知機。總而言之,該方法基于實際觀測或者仿真數據,通過最小化預測誤差,來學習粒子間的相互作用以及相互作用如何改變粒子的狀態,本質上是學習了系統的動力學。最后,該工作進行了一系列的實驗驗證,取得了較好的準確度和效果。

基于該工作,文章[15]提出混合圖神經網絡(圖 8),首次將圖神經網絡用于百萬以上網格的地下流體物理仿真。為了降低長期預測誤差,該方法提出訓練時最小化多步預測誤差(而不是單步預測誤差),提高長期預測的精度。同時,由于圖神經網絡是一個局域模型,其本質上學習的是任何節點如何受到周圍節點的作用,因此,該方法只需要十多條系統演化軌跡數據,通過空間的多樣性,就可以泛化到全新的初始條件和靜態參數。實驗表明,該方法相比起傳統數值求解器加速 18 倍,相比起之前的深度學習模型,能夠更加精確地預測地下流體 20 個月的演化。該方法已經部署于沙特阿美(全球最大石油公司)的仿真管線中,搭配原有求解器,可以實現不同設計和逆問題的快速驗證。


圖 8 (a) HGNS 架構[15]; (b) HGNS 對水流體積的預測結果(截面)與真實值比較,可見其在20 個月內預測效果與真實值精確符合。

此后,借鑒 HGNS 的多步預測方法,DeepMind 進一步提出 GraphCast 架構 [16](圖 9)用于全球天氣預報。這是一個多尺度圖神經網絡架構,在全球大氣的三維網格基礎上,添加了六個尺度的粗粒化網格,每個尺度的邊跨越距離呈指數增加,并在消息傳遞時,同時匯聚所有尺度的消息。如此一來,該網絡可以學習某一位置的大氣的未來狀態如何受到臨近尺度(幾十公里)直到全球尺度(幾千公里)大氣的影響。由于該方法所學數據來源于實際觀測并且數據充足,該方法的精度超過了傳統求解器,并且將十天預測的仿真時間由傳統求解器的小時量級降到了分鐘量級。

除了以上重點介紹的工作之外,基于圖神經網絡的 AI 仿真涌現出了相當多其他各類重要工作。例如[17]提出 MeshGraphNets(網格圖網絡),通過非規則網格建模多個剛性或柔性物體,并模擬他們之間的相互作用。[18]提出 LAMP(多分辨率物理仿真)架構用于建模多分辨率物理仿真,通過兩個 MeshGraphNets 分別學習系統狀態演化和網格的粗化和細化,同時優化預測誤差和計算成本。另外,幾何圖神經網絡[6]通過將系統對平移、旋轉的等變性融入圖神經網絡的設計中,可實現對分子性質、動力系統演化的更好預測。

由于能夠靈活的建模各類對象的相互作用及影響,圖神經網絡不僅廣泛用于宏觀系統偏微分方程的仿真,也運用于粒子物理預測[19]、等離子體物理仿真[20]、凝聚態物理基態求解[21]、材料物理性質預測[22]、分子物理仿真[23]、天體物理仿真[24]等。同時,圖神經網絡的仿真仍有以下重要開放問題:(1)如何進一步增大圖神經網絡的表達能力,捕捉更高階的相互作用;(2)如何將圖神經網絡拓展到更大規模的仿真問題,進一步提高其效率和精度;(3)如何更好建模多尺度、多物理場問題。以上開放問題值得領域研究者進一步探索,其中(2)(3)也是其他神經網絡架構用于科學仿真的開放問題。

2.3 案例研究:神經算子用于仿真和預測


圖 9 GraphCast 架構[16]。其構建的多尺度圖神經網絡,可以同時匯聚局域和多尺度的信息。

除了 2.2 節介紹的圖神經網絡之外,Transformer、U-Net、神經算子等都是常用的神經網絡架構。這里重點介紹神經算子(neural operator)。不同于通常的神經網絡將有限維的向量空間映射到有限維的向量空間,神經算子可將無限維的函數映射到另一無限維的函數。因此,其非常適合于偏微分方程的仿真問題。例如,對于邊值問題,神經算子可以將參數函數()(包含邊界)直接映射到方程的解函數()(圖 10)。對于初值問題,神經算子可以將初始條件( = 0, )映射到整個方程的解(, )。相比物理信息神經網絡(PINN[13]),其不需要對每一個新的參數或者邊界條件都重新訓練模型,大幅提升了求解速度。


圖 10 神經算子可以將無限維的函數映射到另一個無限維函數。

在這里,我們著重介紹傅立葉神經算子(Fourier Neural Operator,FNO)[25],一類代表性神經算子。傅立葉神經算子(圖 11)首先將參數函數()在規則網格上的采樣結果映射到一隱空間0(),接下來通過層的傅立葉層(Fourier layer)實現函數映射,其映射方式包含在原空間的卷積操作,加上一個局域的線性變換,最后經過一個非線性函數:

+1() ? (() + ((; ))()) (3)

其中,由于原空間的卷積操作對應于頻域空間中的相乘操作,因此傅立葉神經算子將卷積操作進一步簡化為:

這里為可學習的矩陣。通過這種方式,傅立葉神經算子可以同時捕捉全局和局域的信息,并進行高效、準確的預測。

基于基本模型架構,FNO 已經被應用于許多重要的科學領域。例如,文章[26]中提出了 FourCastNet,一個基于深度學習的全球高分辨率天氣預報模。其結合了基于傅立葉變換的 token-mixing 和 Vision Transformer (ViT) 骨干網絡,傅立葉變化使得模型可以在分辨率無關的方式下學習,而 ViT 骨干網絡擅長處理長程依賴。實驗表明,它比傳統數值模型快 45,000 倍,能夠以極低的計算成本生成大規模集成預報,尤其在極端天氣事件的預報中表現出色。


圖 11 傅立葉神經算子[26]的網絡架構。

除此之外,FNO 也被應用在碳捕集與封存(Carbon Capture and Storage, CCS) 領域中。現有的數值方法在大規模下進行高精度儲層壓力和氣體羽流遷移建模時,計算成本非常高,導致評估存在顯著不確定性,進而阻礙了大規模 CCS 的部署。文章[27]中提出了嵌套傅立葉神經算子(Nested FNO),用于在盆地尺度上進行高分辨率的 3D CO2 儲存的動態建模。與現有方法相比,Nested FNO 將流動預測速度提升了近 70 萬倍,并通過學習偏微分方程組的解算子,為不同儲層條件、地質異質性和注入方案提供了通用的數值模擬替代方案,實現了前所未有的實時建模和概率模擬,支持全球 CCS 部署的擴展。

3. 人工智能用于科學設計和控制

除了仿真,設計和控制也是各個科學領域的核心、普適問題。對于設計和控制問題,人們通常給定一個目標函數([0,], [0,]),其為狀態軌跡[0,]和控制序列[0,]的函數。設計和控制的任務設置便是優化初始條件0,控制序列[0,],

參數以及邊界,使得目標函數最小化,如下圖 12 所示。


圖 12 科學設計和控制的任務設置。根據目標,優化初始條件0,控制序列[0,],參數或者邊界。

對于不同的待優化變量和優化目標,可以分為以下三類任務:

(1)逆向設計:根據設計目標函數,優化邊界、初始條件0或者參數 。

(2)逆問題:根據稀疏觀測,推測系統的初始條件0或者參數,使得模型對系統的預測與觀測相符。這里的目標函數一般為預測誤差(例如 MSE)。由于逆問題與逆向設計問題非常相似,我們這里將其歸類到設計問題當中。

(3)控制:根據控制目標,求解接近最優的控制序列[0,]。

一般來說,上述設計和控制問題具有很大的挑戰性,具體表現為以下三個方面:

(1)高維的設計/控制變量優化空間:對于很多問題,其需要優化的設計變量(例如網格表示的形狀、蛋白質序列)或者控制變量(例如軟體機器人的形狀控制)本身就是高維的,如何在這一高維空間中優化出接近最優的結果具有很大挑戰。

(2)復雜的系統動力學:給定設計和控制變量,系統本身的仿真本身可能就非常復雜、耗時(如第 2 節所述),而每一次改變設計和控制變量,傳統方法都可能要重新進行一次仿真,因此更加耗時。

(3)泛化到全新設計/控制:對于基于 AI 的設計和控制,往往需要泛化到超出訓練集的設計和控制的分布,從而構造出之前沒有的新的設計,或者具有更加優越性能的控制序列。這對神經網絡的泛化性提出了更高的要求。

對于控制問題,在科學和工程中最常用的是 PID(比例-積分-微分)方法,將當前系統狀態與目標狀態的差值通過比例、積分和微分運算反饋到對系統的控制輸入中,促使系統狀態趨向目標。盡管 PID 方法十分容易編程,但調節其系數需要很多的專家經驗。同時,對于高維、強耦合的系統,PID 方法難以勝任。對于設計問題,常用的傳統方法是將系統的仿真作為內循環,從初始的設計開始,每一次改變設計都需要重新用傳統求解器做一次仿真,再根據仿真結果改進系統的設計,因而非常耗時。

由于人工智能的快速發展,近幾年涌現出了非常多基于 AI 的設計和控制方法,包括代理模型結合反向傳播、深度強化學習、生成模型、PINN、貝葉斯推斷、直接映射等。本文將重點介紹前四類方法。

3.1 代理模型結合反向傳播方法用于設計和控制

基于第二節所述的 AI 仿真模型,我們可以直接將其用于下游的設計和控制任務。由于 AI 仿真模型是可導(differentiable)的,因此,我們可以用反向傳播(backpropagation),將目標對所需優化的變量(例如邊界、參數、控制序列等)求導,以得到更好的設計參數或者控制序列。例如,DeepMind 的工作[28]提出這一方法進行系統邊界形狀的設計。首先,其通過 MeshGraphNets 來學習系統的仿真代理模型。這一代理模型根據系統的邊界形狀以及初始條件,預測系統未來的演化。在設計邊界的時候,將代理模型的整個仿真軌跡展開,根據給定的設計目標反向傳播,以此優化系統邊界形狀。文章[28]在流體邊界形狀優化、飛機翼型優化(圖 13)等任務中展現了優異的性能,達到或者超過傳統求解器(例如 DAFoam)的優化結果,并且效率更高。


圖 13 在工作[28]中對飛機翼型的設計,優化目標為減小阻力。文章提出的基于代理模型+反向傳播的方法達到傳統求解器(DAFoam)優化的性能,并且速度更快。

這一工作之后,不同工作進行了進一步改進。例如,[29]提出在可學習的隱空間進行仿真和反向傳播設計,相對于在原空間進行設計,顯著提高了設計的效率。[30]發現,對于逆問題,當需要優化的參數或者初始條件變量維度很高時,直接在原空間進行優化會出現很多具有高頻噪聲的對抗樣本(如圖 14 中第一行 without prior 所示)。這是由于在訓練時,代理模型只看到了真實系統的演化,而當輸入維度很高時,在真實樣本的周圍,基于神經網絡的代理模型會有很多“對抗樣本”,其本身并不符合物理,但神經網絡仍有可能優化出使得設計目標很好的結果。對于這一問題,[30]提出在隱空間進行優化,由于隱空間的每一個向量都能映射到一個符合先驗的初始條件,因此避免了對抗樣本的問題。在后文的 3.3節,我們會介紹生成模型方法,也可以解決這個對抗樣本的問題。

3.2 深度強化學習用于設計和控制


圖 14 文章[30]中實驗結果。對于逆問題,如果在原空間進行反向傳播優化系統初始條件(第一行,without prior),則會優化出具有高頻噪聲的對抗樣本。而根據文章所提出的在隱空間進行設計,由于有了先驗知識,則能優化出與真實值非常一致的初始條件。

除了代理模型結合反向傳播的方法,另一類重要的設計和控制方法為深度強化學習。強化學習的設置如下,其包含一個智能體(agent)和環境(environment)的交互(圖 15),在每一個時間步,智能體根據當前狀態,決策下一步行動,環境根據當前狀態和行動得到下一步的狀態+1和給智能體的獎勵+1。強化學習的目標是學習一個策略函數(|),使得其長期的期望獎勵[]最大化:

當策略函數用深度神經網絡參數化時,稱為深度強化學習。


圖 15 強化學習設置。

深度強化學習已在各類科學控制任務中得到廣泛應用。例如,Degrave 等[16]首次將深度強化學習用于磁約束可控核聚變中托卡馬克裝置的控制。可控核聚變如果成功,即穩定實現輸出能量大于輸入能量,那么人類就能獲得幾乎無盡的免費能源,并可同時解決全球變暖的挑戰。磁約束可控核聚變將上千萬到上億度的等離子體通過磁場約束在一個輪胎型的大型托卡馬克裝置中(圖 16),由于溫度極高,質量較輕的原子核會碰撞聚變成更重的原子核,同時釋放巨大的能量。這一工作的實驗任務是根據 92 個傳感器的信號,調節 19 個線圈的電流,產生磁場控制信號,使得等離子體能夠被囚禁在裝置中并穩定放電。由于裝置極其復雜,等離子體動力學往往跨越多個尺度,控制頻率非常高(10kHz 頻率),導致這一控制任務非常困難,傳統的 PID 控制方法(圖 17f)難以勝任這一任務。


圖 16 位于瑞士的 TCV 磁約束可控核聚變托卡馬克裝置。

基于以上挑戰,作者首次提出基于深度強化學習的方法用于托卡馬克裝置的控制(圖 17)。首先,作者在基于傳統數值方法的求解器仿真環境中,對強化學習智能體進行訓練。其將環境定義為托卡馬克裝置,系統狀態為 92 個傳感器的信號,動作空間為 19 個控制線圈的電流,獎勵通過等離子體的多個目標參數(包含其位置、形狀等)定義。在仿真環境中訓練后,作者直接將訓練好的模型部署于實際裝置中,并進行了一系列實驗,表明了該方法的優越性能,包括能夠精確控制等離子體的各類參數,以及能夠形成新的等離子體位形。這一突破性進展,首次證明了深度強化學習用于控制大型科學設施的可行性,為人工智能在科學控制任務的更多應用揭示了巨大的潛力。


圖 17 文章[31]中的深度強化學習與托卡馬克裝置交互示意圖。

除了以上代表性工作,由于其范式的普適性以及優異的效果,深度強化學習已在其他控制和設計任務中廣泛應用,例如流體控制[32]、分子設計[33]等等。

3.3 生成模型用于設計和控制

生成模型是一種新的機器學習范式。近幾年來,以擴散生成模型為代表,生成模型在圖像生成(例如 DALL-E 2)、視頻生成(例如 Sora [34])、3D 模型生成、具身智能等領域涌現出眾多令人驚艷的成果。擴散模型對于高維、復雜變量的全局概率建模能力,使其不僅在以上 AI 核心應用領域大放光彩,也使其在科學設計和控制任務中具有巨大潛力。

例如,在工作[35]中,作者針對逆向設計問題,提出基于擴散模型的組合逆向設計方法。其核心在于將仿真和逆向設計融為同一任務,在訓練時(圖 18 左),

給定系統仿真軌跡[0,]和參數(包含其空間參數、邊界等)的數據樣本,其可以學習系統仿真軌跡[0,]和參數的聯合概率分布([0,], ),通過參數化的能量函函數([0,], )表示,其與概率分布的對應關系為,這個關系表明能量越低,觀測概率越高。


圖 18 文章[35]中訓練和推理的方法架構。

推理時(圖 18 右),該方法將系統仿真軌跡和參數同時生成,并在生成時加上設計目標([0,], ),使得生成的樣本既符合物理(即仿真軌跡與參數符合訓練集中的聯合分布),又能同時優化設計目標。這個同時生成的范式避免了前文 3.1 節方法中每一次改變參數,都需要重新進行仿真的低效做法,同時由于其通過對樣本加上噪音再訓練去噪網絡的方式進行訓練,可以有效避免 3.1 中的對抗樣本問題。此外,通過能量函數的疊加,該方法能夠組合式生成比訓練集中更加復雜的參數設計。例如,在飛機翼型設計的實驗中,盡管該方法只在訓練中見過單個機翼與氣流的作用,其在推理中卻能同時設計出兩個翼型的形狀以及相對位置,并發現“編隊飛行”的模式能夠減小總飛行阻力,實現最大化升阻比的設計目標(圖 19)。


圖 19 文章[35]中的方法能同時生成系統仿真軌跡(左:氣流水平速度場;中:氣流垂直速度場,右:壓強場)和機翼形狀(中間紅色和藍色形狀所示),并發現在訓練中未見的“編隊飛行”模式。

除此之外,擴散生成模型在其他科學設計和控制任務中也開始廣泛應用,例如機械超材料設計[36],流體控制[37],蛋白質設計(例如 RFdiffusion[38],AlphaFold 3[39])等。基于其在蛋白質設計方面的杰出貢獻,David Baker 獲得了 2024 年諾貝爾化學獎。其最新的蛋白質設計工作主要基于擴散生成模型。由此可以看到擴散模型等生成模型的潛力,以及廣泛應用于各領域的令人興奮的前景。

3.4 PINN 用于設計和控制

物理信息神經網絡(PINN, Physics-Informed Neural Networks)[13]是一種將物理約束與神經網絡相結合的數值方法。PINN 通過將 PDE 的具體形式嵌入神經網絡的損失函數中,使得網絡在學習數據的同時,滿足物理定律。它可以用于解決正問題(預測系統的未來狀態)和逆問題(根據觀測推斷系統的未知參數或初始條件),廣泛應用于流體動力學、材料科學和氣象學等領域。PINN 的優勢在于不需要大量數據,也能基于已知的物理模型進行高效的模擬與推斷。

給定 PDE 的顯式公式,一種自然的想法就是可以利用 PINN,通過同時在損失函數中包含 PDE 和設計、控制目標,可以獲得能夠最小化目標的設計參數和控制序列。對于逆向設計,考慮到 PINN 中所有約束都是軟約束,hPINN 通過使用懲罰法和增廣拉格朗日法施加硬約束[40]。之后,為了提高 PINN 的精度和訓練效率,gPINN 利用 PDE 殘差的梯度信息并將其整合到損失函數中[41]。Bi-PINN[42]進一步提出了一種新穎的雙層優化框架,通過解耦目標和約束的優化,避免了無約束問題中細微超參數的設置。另一項研究[43]提出了一種貝葉斯方法,使用數據驅動的基于能量的模型(EBM)作為先驗,以提高層析重建的整體準確性和質量。對于利用 PINN 進行控制問題,[44]提出了一種簡潔的兩階段方法。首先, 他們通過解決正向問題來訓練 PINN 的參數。隨后,他們使用一種簡單但有效 的線性搜索策略,通過評估控制目標,利用一個單獨的 PINN 正向計算將 PINN的最優控制作為輸入進行控制。相比之下,控制物理信息神經網絡(Control PINNs)[45]是一種單階段方法,能夠同時學習系統狀態、伴隨系統狀態以及最優控制信號。

第一種方法可能計算量大,且由于模型中的間接關系,可能產生非物理結果。至于第二種方法,它可以直接計算變量,并更高效地處理復雜系統,但可能會導致較大的方程組。

3.5 神經算子用于設計和控制

對于偏微分方程(PDE)的一大類逆問題,其定義通常是從算子映射到函數。然而,現有的算子學習框架主要是將函數映射到函數,需要對其進行修改才能從數據中學習逆映射。[46]中提出了一種新的架構,稱為神經逆算子(Neural Inverse Operators, NIOs),用于解決這些 PDE 逆問題。受底層數學結構的啟發,NIO 基于深度算子網絡(DeepONet[47])和傅立葉神經算子(FNOs)的適當組合,來近似從算子到函數的映射。通過多種實驗表明,NIO 在解決 PDE 逆問題時,表現顯著優于基線模型,具有魯棒性和高準確性,并且相比現有的直接方法和 PDE 約束優化方法快了數個數量級。

4. 人工智能用于科學發現

科學發現是一個最激動人心的過程,而人工智能正在并且將為科學發現提供一系列強大工具。本文認為,人工智能可以在以下方面,為科學發現助力:(1)發現高維、復雜、強耦合系統中的核心的宏觀變量;(2)根據數據,得到變量之間滿足的符號方程;(3)發現系統的對稱性和守恒量;(4)與人類專家交互,共同證明數學定理;(5)提出實驗方案,更好地驗證或者證偽當前理論等。

例如,研究者在[48]中提出了 SINDy 算法,其關于模型結構的唯一假設是:只有少數重要的項支配著動力學,因此方程在可能的函數空間中是稀疏的;這一假設在許多物理系統中在適當的基底下成立。具體來說,它使用稀疏回歸來確定動態控制方程中所需的最少項,以準確表示數據。這樣可以生成既保證準確性又避免模型過度復雜的簡約模型,避免過擬合。SINDy 在流體系統上的結果展示了該方法能夠發現系統的潛在動力學,該問題花費了領域專家近 30 年才解決。并且,該方法能夠推廣到參數化的系統、時變的或有外力項的系統。

基于 SINDy 算法,研究者們還提出了許多的變體。比如考慮到現實中觀測到的數據會帶有噪聲,SINDy-PI [49]開發了一種優化和模型選擇框架,將隱式的 SINDy 問題重新轉換為凸問題,使其具有噪聲魯棒性。[50]基于從噪聲測量數據中系統發現問題的弱形式和離散化,提出了提出了 weak-SINDy。這一算法用線性變換和方差縮減技術取代逐點導數近似,能夠比標準的 SINDy 算法的精度提高幾個數量級。

AI 費曼[51-52]方法(圖 20a)也是一個用于發現物理規律的算法,它將分而治之、遞歸、對稱性發現的原理融成統一整體,能夠從數據中發現其隱含的復雜方程(圖 20b),并且對噪聲有較強的魯棒性。AI 龐加萊方法[53]能夠發現物理系統隱含的對稱性。例如,其重新發現了著名的古爾斯特蘭德-佩恩利夫度量,該度量在非旋轉黑洞的史瓦西度量中體現了隱藏的平移對稱性。物理學家用了 17 年才發現這一對稱性。


圖 20 AI 費曼架構(a)及其重新發現的部分方程(b)。


圖 21 KAN 架構[54]

另一個最近的代表性工作便是 KAN(柯爾莫哥洛夫-阿諾德網絡,圖 21)[54]。基于柯爾莫哥洛夫-阿諾德表示定理,KAN 將激活函數放在神經網絡的邊上,而不是像標準的多層感知機(MLP)把激活函數放在神經網絡的節點上。實驗表明, KAN 具有很好的可解釋性,并能夠更快收斂。其在發現系統重要變量、發現神經網絡的模塊化結構、發現物理系統的方程[55]方面展現了強大的性能以及巨大潛力。

還有的工作提出基于強化學習來進行方程的發現,[56]提出了有限表達法 (finite expression metho, FEX),它通過強化學習來發現包含有限解析表達式集合的函數空間中的控制方程,其關鍵概念是通過卷積學習偏微分方程(PDE)解的導數。具體來說,它引入了一種緊湊的操作數樹結構,并利用一元運算符,該運算符以具有可訓練卷積參數的線性組合的不同操作數作為輸入,這一設計有效降低了優化問題的復雜性。

利用遺傳算法來進行科學發現也是一個方向,文章[57]中提出了一種符號遺傳算法,用于直接從數據中發現開放形式的 PDE(SGA-PDE),并且無需預先了解方程結構。SGA-PDE 使用符號數學來實現任意 PDE 的靈活表示,將 PDE 轉換為一個森林,并將每個函數項轉換為二叉樹;并且采用一種專門設計的遺傳算法,通過迭代更新樹的拓撲結構和節點屬性來有效優化這些二叉樹。在實驗中, SGA-PDE 不僅成功發現了非線性Burgers 方程、Korteweg-de Vries 方程和Chafee- Infante 方程,還處理了傳統的 PDE 發現方法無法解決的有分形結構和復合函數的 PDE。

此外,近年來,許多文章利用大規模語言模型(LLMs)來進行科學發現。通過大語言模型與搜索的交互,[58]提出 FunSearch 方法,其能夠生成新的程序來解決數學問題,并在組合數學中得到了新的發現。[59]提出 AlphaGeometry 架構用于幾何定理的證明,并在 30 個數學奧林匹克賽題中成功解出 25 道題,接近人類金牌選手的水平。而[60]將 AI 用于化學實驗的自動化研究,其將大語言模型作為“中央處理器”,用于調用文檔搜索、代碼執行和實驗自動化等模塊,實現化學實驗的自動化設計和實施。[61]提出新方法訓練 Transformer 以及產生數據集,用于發現動力系統的全局李雅普諾夫函數(Lyapunov functions),以判別系統的穩定性,而這個問題之前沒有普適解法。該方法成功發現了一些系統的全局李雅普諾夫函數,超過了傳統方法。 [62]討論了 DiscoveryWorld,一個虛擬環境,用于測試 AI 代理在端到端科學發現中的表現,涵蓋了多種挑戰,如放射性同位素定年和火箭科學,提供了一個全面的基準來開發科學推理能力。不過,[63]中介紹了 ScienceAgentBench,一個用于評估 LLM 驅動的語言代理在數據驅動科學任務中的基準,其結果突顯了當前 LLM 在實現科學研究端到端自動化中的局限性,即使是表現最好的代理在專家支持下也只能獨立解決 34%的任務,因此在這個方向還會有很多的進步空間。以上例子只是 AI 在科學發現中的初步應用,其潛力值得廣大研究人員的深入探索。

5. 總結

5.1 未來研究方向和開放問題

在人工智能助力科學的仿真、設計和控制領域,讓模型更加準確、快速和可信,并能在實際中大規模部署,是一個長期的總體目標。對于仿真領域,目前基于機器學習的方法還難以達到和傳統數值方法相近的精度、難以處理復雜的幾何結構等等。可能的未來研究方向包括:(1)對于具有多物理場、復雜幾何結構、高度非線性或者多尺度特征的系統,開發更好的表示方式和AI仿真方法;(2)開發融合物理先驗、仿真數據、實驗觀測的全新機器學習框架;(3)利用預訓練的基礎模型 (Foundation Model) 為科學計算多樣性場景、數據匱乏的情況下帶來優勢;(4)開發更加可信的仿真模型,能在全新的環境下預測并給出可證明的誤差保證,這對于模型在實際中被大規模采用至關重要。

關于設計與控制,深度學習技術在其上的研究工作相較于仿真還較少。其中一個問題是由與真實物理系統交互的高昂代價,導致的對求解器的需求,甚至是可微的仿真器的需求。此外,如何進行大規模的組合設計,尤其設計出比訓練集更加復雜的系統,這在合成生物學、芯片設計、制造業等方面將有廣泛應用。此外,另一個重要的研究方向是如何解決現實場景中十分重要的有安全約束的控制問題,使得模型在全新環境下的控制不會超過安全區間。

在人工智能助力科學發現領域,構建一個“AI 科學家”,并真正幫助人類科學家在各門學科實現各類新的發現,是一個令人興奮的長期總體目標。在這里,[64]提出“AI 笛卡爾”架構(圖 22),構想了一個未來的“AI 科學家”可能的組成部分,包括:根據觀測數據和先驗知識提出新的猜想和理論,通過推理進一步精煉理論,提出實驗方案,實際實驗驗證得到新的觀測數據,以上形成一個閉環。我們相信,這樣的 AI 科學家將在不久后出現,結合強大的大語言模型作為 “大腦”,并加上人類積累的所有科學知識作為“知識庫”,未來將能有效助力各門學科科研的進展。在此之前,這一 AI 科學家的不同部分,包括自動猜想生成、定理自動證明、自動化實驗(auto-lab)、科學文獻大語言模型等方面將會有突飛猛進的發展。


圖 22:AI 笛卡爾架構[64]

5.2 總結

人工智能與科學的結合是近幾年出現的最激動人心的進展和趨勢之一。將人工智能的強大能力滲透到科學研究的各個方面,既能讓廣大科技工作者擁有一系列強大的工具,加速科研發展;同時,在解決問題的過程中發展出來的新的科學理論和方法,也能反過來推進人工智能的發展。本文從人工智能加速科學仿真、設計和控制、發現三方面,闡述了這些領域的任務設置和一些代表性工作,以期讀者能夠初步熟悉這些領域。相信隨著人工智能與各門科學的進一步交叉、融合,人工智能和科學的發展能夠進一步加速,同時會有更多激動人心的發現。

參考文獻

[ 1 ] WANG Sifan, WANG Hanwen, PERDIKARIS P. Learning the solution operator of parametric partial differential equations with

physics-informed DeepONets[ J] . Science Advances, 2021, 7(40) : eabi8605.

[ 2 ] LI Zongyi, ZHENG Hongkai, KOVACHKI N, et al. Physics-informed neural operator for learning partial differential equations[ J] . ACM / JMS Journal of Data Science, 2024, 3(1) : 1-27.

[ 3 ] SHU Dule, LI Zijie, BARATI FARIMANI A. A physics-informed diffusion model for high-fidelity flow field reconstruction[ J] . Journal of Computational Physics, 2023, 478: 111972.

[ 4 ] UM K, BRAND R, HOLL P, THUEREY N. Solver-in-the-Loop: Learning from differentiable physics to interact with iterative pde-solvers[C] . Thirty-fourth Annual Conference on Neural Information Processing Systems( NeurIPS) ,Vancouver, Canada,2022.

[ 5 ] PESTOURIE R, MROUEH Y, RACKAUCKAS C. et al. Physics-enhanced deep surrogates for partial differential equations[ J] . Nature Machine Intelligence, 2023, 12(5) : 1458-1465.

[ 6 ] RAO Chengping, REN Pu, WANG Qi, et al. Encoding physics to learn reaction – diffusion processes[ J] . Nature Machine Intelligence, 2023, 5(7) :765-779.

[ 7 ] WANG H, LI J, DWIVEDI A, et al. BENO: Boundary - embedded neural operators for elliptic PDEs [ C] . The Twelfth International Conference on Learning Representations( ICLR) ,Vienna, Austria, 2024.

[ 8 ] SATORRAS V G, HOOGEBOOM E, WELLING M. E ( n ) equivariant graph neural networks [ C ] . The Thirty - eighth International Conference on Machine Learning( ICML) , 2021.

[ 9 ] ZHANG Linfeng, HAN Jiequn, WANG Han, et al. Deep potential molecular dynamics: a scalable model with the accuracy of quantum mechanics[ J] . Physical Review Letters, 2018, 120(14) : 143001.

[10] SCHüTT K T, KINDERMANS P J, SAUCEDA H E, et al. SchNet: A continuous - filter convolutional neural network for modeling quantum interactions[ C] . The Thirty - first Annual Conference on Neural Information Processing Systems ( NIPS) , Long Beach California USA, 2017.

[11] WEILER M, FORRé P, VERLINDE E, et al. Coordinate independent convolutional networks - - isometry and gauge equivariant convolutions on riemannian manifolds [ C ] . The Twelfth International Conference on Learning Representations( ICLR) ,Vienna, Austria, 2024.

[12] VILLAR S, HOGG D W, STOREY-FISHER K, et al. Scalars are universal: Equivariant machine learning, structured like classical physics[C] . The Thirty-fifth Annual Conference on Neural Information Processing Systems(NeurIPS) , 2021.

[13] RAISSI M, PERDIKARI P. KARNIADAKIS G E. Physics-informed neural networks: A deep learning framework for solving forward and inverse problems involving nonlinear partial differential equations[ J] . Journal of Computational Physics, 2019, 378: 686-707.

[14] SANCHEZ-GONZALEZ A, GODWIN J, PFAFF T, et al. Learning to simulate complex physics with graph networks[C] . The Thirty-seventh International Conference on Machine Learning( ICML) , 2020.

[15] WU Tailin, WANG Qinchen, ZHANG Yinan, et al. Learning large-scale subsurface simulations with a hybrid graph network simulator[ C] / / Proceedings of the 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining. New York: Association for Computing Machinery, 2020: 4184-4194.

[16] LAM R, SANCHEZ-GONZALEZ A, WILLSON M, et al. Learning skillful medium-range global weather forecasting [ J ] . Science, 2023, 382(6677) : 1416-1421.

[17] PFAFF T, FORTUNATO M, SANCHEZ-GONZALEZ A, et al. Learning mesh-based simulation with graph networks[C] The Ninth International Conference on Learning Representations( ICLR) ,2021.

[18] WU T, MARUYAMA T, ZHAO Q, et al. Learning controllable adaptive simulation for multi - resolution physics [ C] . The Eleventh International Conference on Learning Representations( ICLR) , Kigali, Rwanda,2023.

[19] SHLOMI, J, BATTAGLIA P, VLIMANT J R. Graph neural networks in particle physics[ J] . Machine Learning: Science and Technology, 2020, 2(2) : 021001.

[20] WU Tailin, SUN M, JASON Chou H G, et al. Learning efficient Hybrid particle-continuum Representations of Nonequilibrium N-body systems[EB / OL] . (2023-05-06) . https: / / openreview. net / forum? id = Rd68eTARk4.

[21] LI He, WANG Zun, ZOU Nianlong, et al. Deep-learning density functional theory Hamiltonian for efficient ab initio electronic-structure calculation[ J] . Nature Computational Science, 2022, 2(6) : 367-377.

[22] XIE T, FU X, GANEA O E, et al. Crystal diffusion variational autoencoder for periodic material generation[ C] . The Tenth International Conference on Learning Representations( ICLR) , 2022.

[23] LI Z, MEIDANI K, YADAV P, FARIMANI A B. Graph neural networks accelerated molecular dynamics[ J] . https: / / arxiv.org / abs/ 2112. 03383, 2022.

[24] VILLANUEVA-DOMINGO P, VILLAESCUSA-NAVARRO V, ANGLéS-ALCáZAR, D, et al. Inferring halo masses with graph neural networks[ J] . The Astrophysical Journal, 2022, 935(1) : 30.

[25] LI Z, KOVACHKI N, AZIZZADENESHELI K, et al. Fourier neural operator for parametric partial differential equations[C] . The Ninth International Conference on Learning Representations( ICLR) ,2021.

[26] PATHAK J, SUBRAMANIAN S, HARRINGTON P, et al. FourCastNet: A global data-driven high-resolution weather model using adaptive fourier neural operators[C] . The Eleventh International Conference on Learning Representations( ICLR) ,Kigali, Rwanda,2023.

[27] WEN Gege, LI Zongyi, LONG Qirrui, et al. Real-time high-resolution CO2 geological storage prediction using nested Fourier neural operators[ J] . Energy & Environmental Science, 2023, 16(4) : 1732-1741.

[28] ALLEN K R, LOPEZ-GUEVARA T, STACHENFELD K, et al. Physical design using differentiable learned simulators[ C] .The Twelfth International Conference on Learning Representations( ICLR) , Vienna, Austria,2024.

[29] WU Tailin, MARUYAMA T, LESKOVEC J. Learning to accelerate partial differential equations via latent global evolution

[EB / OL] . Advances in Neural Information Processing Systems, 2022: 10404055(2022-01-01) [ 2024-07-25] . https: / /par. nsf. gov / biblio / 10404055-learning-accelerate-partial-differential-equations-via-latent-global-evolution.

[30] ZHAO Qingqing, LINDELL D, WETZSTEIN G. Learning to solve PDE-constrained inverse problems with graph networks[C] . International Conference on Machine Learning,PMLR,2022.

[31] DEGRAVE J, FELICI F, BUCHLI J, et al. Magnetic control of tokamak plasmas through deep reinforcement learning[ J] .Nature, 2022,602(7897) : 414-419.

[32] RABAULT J, Ren Feng, Zhang Wei, et al. Deep reinforcement learning in fluid mechanics: A promising method for both active flow control and shape optimization[ J] . Journal of Hydrodynamics, 2020, 32: 234-246.

[33] YOU J, LIU B, YING R, et al. Graph convolutional policy network for goal - directed molecular graph generation [ C] . The Thirty-second Annual Conference on Neural Information Processing Systems(NeurIPS) , Montreal, Canada,2018.

[34] OpenAI team. Video generation models as world simulators [ EB / OL] . ( 2024 - 02 - 15) [ 2024 - 07 - 25] . https: / / openai.com / index / video-generation-models-as-world-simulators/ .

[35] WU T, MARUYAMA T, WEI L, et al. Compositional generative inverse design[C] . The Twelfth International Conference on Learning Representations( ICLR) ,Vienna, Austria,2024.

[36] JAN-HENDRIK B, DENNIS M. K. Inverse design of nonlinear mechanical metamaterials via video denoising diffusion models[ J] . Nature Machine Intelligence, 2023, 5(12) : 1466-1475.

[37] WEI L, HU P, FENG R, et al. DiffPhyCon: A generative approach to control complex physical systems[ C] . The Thirty -eighth Annual Conference on Neural Information Processing Systems(NeurIPS) ,New Orleans,2024.

[38] WATSON J L, JUERGENS D, BENNETT N R, et al. De novo design of protein structure and function with RFdiffusion[ J] . Nature, 2023, 620(7976) : 1089-1100.

[39] ABRAMSON JOSH, ADLER JONAS, DUNGER J, et al. Accurate structure prediction of biomolecular interactions with AlphaFold 3[ J] . Nature, 2024, 630: 493-500.

[40] LU Lu, PESTOURIE R, YAO Wenjie, et al. Physics-informed neural networks with hard constraints for inverse design[ J] . SIAM Journal on Scientific Computing, 2021, 43(6) : B1105-B1132.

[41] YU J, LU Lu, MENG Xuhui, et al. Gradient-enhanced physics-informed neural networks for forward and inverse PDE problems[ J] . 2022, 393: 114823.

[42] HAO Z, YING C, SU H, et al. Bi-level physics-informed neural networks for PDE constrained optimization using Broyden's hypergradients[C] . The Eleventh International Conference on Learning Representations( ICLR) ,Kigali, Rwanda, 2023.

[43] POKKUNURU A, ROOSHENAS P, STRAUSS T, et al. Improved training of physics-informed neural networks using energybased priors: A study on electrical impedance tomography[EB / OL] . [ 2024- 07- 30] . https: / / ml4physicalsciences. github.io / 2022 / files/ NeurIPS_ML4PS_2022_92. pdf.

[44] MOWLAVI S, NABI S. Optimal control of PDEs using physics-informed neural networks [ J ] . Journal of Computational Physics, 2023, 473: 111731.

[45] BARRY-STRAUME J, SARSHAR A, POPOV A A, et al. Physics-informed neural networks for PDE-constrained optimization and control[DB / OL] . arXiv, 2022: 03377(2022-08-18) [2024-07-30] . https: / / arxiv. org / abs/ 2205. 03377.

[46] MOLINARO R, YANG Y, ENGQUIST B, et al. Neural inverse operators for solving PDE inverse problems[C] . The Fortieth International Conference on Machine Learning( ICML) ,Honolulu, Hawaii, USA, 2023.

[47] LU Lu, JIN Pengzhan, PANG Guofei, et al. Learning nonlinear operators via DeepONet based on the universal approximation theorem of operators[ J] . Nature Machine Intelligence, 2021, 3(3) : 218-229.

[48] BRUNTON S L, PROCTOR J L, KUTZ J N. Discovering governing equations from data by sparse identification of nonlinear dynamical systems[ J] . Proceedings of the National Academy of Sciences of the United States of America, 2016, 113( 15) :3932-3937.

[49] KAHEMAN K, KUTZ J N, BRUNTON S L. SINDy-PI: a robust algorithm for parallel implicit sparse identification of nonlinear dynamics[ J] . Proceedings. Mathematical, Physical, and Engineering Sciences, 2020, 476(2242) : 20200279.

[50] MESSENGER D A, BORTZ D M. WEAK SINDy: GALERKIN-BASED DATA-DRIVEN MODEL SELECTION[ J] . Multiscale Modeling & Simulation, 2021, 19(3) : 1474-1497.

[51] UDRESCU S M, TEGMARK M. AI feynman: a physics-inspired method for symbolic regression [ J] . Science Advances,2020, 6(16) : eaay2631.

[52] UDRESCU S M, TAN A, FENG J, et al. AI Feynman 2. 0: Pareto-optimal symbolic regression exploiting graph modularity

[C] . Thirty-Fourth Annual Conference on Neural Information Processing Systems(NeurIPS) ,Vancouver, Canada,2020.

[53] LIU Ziming, TEGMARK M. Machine learning hidden symmetries[ J] . Physical Review Letters, 2022, 128(18) : 180201.

[54] LIU Ziming, WANG Yixuan, VAIDYA S, et al. KAN: Kolmogorov-Arnold Networks[DB / OL] . arXiv, 2024: 19756(2024-04-30) [2024-07-30] . https: / / arxiv. org / abs/ 2404. 19756.

[55] LIU Ziming, MA Pingchuan, WANG Yixuan, et al. KAN 2. 0: Kolmogorov-arnold networks meet science[ DB / OL] . arXiv, 2024: 10205(2024-08-19) [2024-07-30] . https: / / arxiv. org / html / 2408. 10205v1.

[56] JIANG Z, WANG C, YANG H. Finite expression methods for discovering physical laws from data [ C ] . The Twelfth International Conference on Learning Representations( ICLR) ,Vienna, Austria, 2024.

[57] CHEN Yuntian, LUO Yingtao, LIU Qiang, et al. Symbolic genetic algorithm for discovering open-form partial differential equations( SGA-PDE) [ J] . Physical Review Research, 2022, 4(2) : 023174.

[58] ROMERA-PAREDES R B, BAREKATAIN M, NOVIKOV A, et al. Mathematical discoveries from program search with large language models[ J] . Nature, 2024, 625(7995) : 468-475.

[59] TRINH T H, WU Yuhuai, LE Q V, et al. Solving olympiad geometry without human demonstrations[ J] . Nature, 2024, 625:476-482.

[60] BOIKO D A, MACKNIGHT R, Kline B, et al. Autonomous chemical research with large language models[ J] . Nature, 2023,624(7992) : 570-578.

[61] ALFARANO A, CHARTON F, HAYAT A, et al. Global Lyapunov functions: a long-standing open problem in mathematics,with symbolic transformersp[C] . The Twelfth International Conference on Learning Representations( ICLR) ,Vienna, Austria,2024.

[62] JANSEN P, C?Té M A, KHOT T, et al. DiscoveryWorld: A virtual environment for developing and evaluating automated scientific discovery agents[ C] . The Thirty-eighth Annual Conference on Neural Information Processing Systems( NeurIPS) ,New Orleans,2024.

[63] MAJUMDER B P, TAFJORD O, CLARK P. ScienceAgentBench: Toward rigorous assessment of language agents for data-driven scientific discovery[ C] . The Twelfth International Conference on Learning Representations( ICLR) , Vienna, Austria,2024.

[64] CORNELIO C, DASH S, AUSTEL V, et al. Combining data and theory for derivable scientific discovery with AI-Descartes[ J] . Nature Communications, 2023, 14(1) : 1777.

參考文獻可上下滑動查看

非平衡統計物理讀書會啟動!

2024年諾貝爾物理學獎授予人工神經網絡,這是一場統計物理引發的機器學習革命。統計物理學不僅能解釋熱學現象,還能幫助我們理解從微觀粒子到宏觀宇宙的各個層級如何聯系起來,復雜現象如何涌現。它通過研究大量粒子的集體行為,成功地將微觀世界的隨機性與宏觀世界的確定性聯系起來,為我們理解自然界提供了強大的工具,也為機器學習和人工智能領域的發展提供了重要推動力。

為了深入探索統計物理前沿進展,集智俱樂部聯合西湖大學理學院及交叉科學中心講席教授湯雷翰、紐約州立大學石溪分校化學和物理學系教授汪勁、德累斯頓系統生物學中心博士后研究員梁師翎、香港浸會大學物理系助理教授唐乾元,以及多位國內外知名學者共同發起。讀書會旨在探討統計物理學的最新理論突破,統計物理在復雜系統和生命科學中的應用,以及與機器學習等前沿領域的交叉研究。讀書會從12月12日開始,每周四晚20:00-22:00進行,持續時間預計12周。我們誠摯邀請各位朋友參與討論交流,一起探索愛因斯坦眼中的普適理論!

詳情請見:

1.

2.

3.

4.

5.

6.

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
打了46分鐘!東契奇:我的表現不能因上場時間長就受到影響

打了46分鐘!東契奇:我的表現不能因上場時間長就受到影響

直播吧
2025-04-28 15:21:08
高宇洋否認接受中國足球歸化:他們寫的東西讓我看不懂

高宇洋否認接受中國足球歸化:他們寫的東西讓我看不懂

雷速體育
2025-04-28 08:58:11
“大罷免” 對臺灣絕非好事

“大罷免” 對臺灣絕非好事

中國青年報
2025-04-27 21:37:05
特朗普下最后通牒?限中國一個月內簽字,否則臺海、南海出事

特朗普下最后通牒?限中國一個月內簽字,否則臺海、南海出事

近史閣
2025-04-27 16:39:26
你見過最神秘的體質是啥?網友:一看老婆的女同事就有沖動的想法

你見過最神秘的體質是啥?網友:一看老婆的女同事就有沖動的想法

解讀熱點事件
2025-04-27 00:10:02
特朗普為什么慫了?美國人第一次感受到了什么叫“本土作戰”

特朗普為什么慫了?美國人第一次感受到了什么叫“本土作戰”

愛下廚的阿釃
2025-04-28 14:11:39
A股:重磅!財政部、央行、證監會發聲!經濟日報“穩”不是保守!

A股:重磅!財政部、央行、證監會發聲!經濟日報“穩”不是保守!

虎哥閑聊
2025-04-28 08:55:47
曝特斯拉Model Y長軸距版即將投產:三排座位設計

曝特斯拉Model Y長軸距版即將投產:三排座位設計

手機中國
2025-04-28 09:54:16
不準關閉大壩,巴鐵通電王毅外長,中方遞出18個字,印度直接泄洪

不準關閉大壩,巴鐵通電王毅外長,中方遞出18個字,印度直接泄洪

平祥生活日志
2025-04-28 12:15:54
68歲仍未婚的蔡英文還有人要嗎?翻翻她的情史,難怪會嫁不出去

68歲仍未婚的蔡英文還有人要嗎?翻翻她的情史,難怪會嫁不出去

通文知史
2025-04-27 13:40:03
23歲住家保姆哭訴:高薪背后,竟隱藏雇主的禽獸要求

23歲住家保姆哭訴:高薪背后,竟隱藏雇主的禽獸要求

清茶淺談
2025-04-26 19:21:42
面對新式紅衛兵,一個歷史老師的無奈:誰之罪?

面對新式紅衛兵,一個歷史老師的無奈:誰之罪?

霹靂炮
2025-04-23 23:16:50
600噸中國“空中巨無霸”運40橫空出世,改寫全球航空格局!

600噸中國“空中巨無霸”運40橫空出世,改寫全球航空格局!

書中自有顏如玉
2025-04-28 04:15:56
央視曝光假進口保健品:警惕!保稅倉發貨不等于真進口

央視曝光假進口保健品:警惕!保稅倉發貨不等于真進口

澎湃新聞
2025-04-27 21:24:16
多家美巨頭無視特朗普指令:恢復從中國進口,關稅將由美承擔

多家美巨頭無視特朗普指令:恢復從中國進口,關稅將由美承擔

華人星光
2025-04-28 13:17:34
中國減少進口美國農產品后,日媒爆料:除了大豆,日本還準備擴大進口美國玉米?

中國減少進口美國農產品后,日媒爆料:除了大豆,日本還準備擴大進口美國玉米?

王爺說圖表
2025-04-27 16:52:51
寧波63歲老太太查出艾滋病,尋找感染源頭,醫生發現了特別之處

寧波63歲老太太查出艾滋病,尋找感染源頭,醫生發現了特別之處

黑貓故事所
2025-04-03 11:52:35
面相都變了!再看59歲曾華倩和59歲劉嘉玲,才明白兩人差別在哪里

面相都變了!再看59歲曾華倩和59歲劉嘉玲,才明白兩人差別在哪里

聯友說娛
2025-04-27 18:06:35
被妻子舉報的中日友好醫院醫生:簡歷已撤下,曾入選骨干人才

被妻子舉報的中日友好醫院醫生:簡歷已撤下,曾入選骨干人才

南方都市報
2025-04-28 10:00:43
賴清德:你們應該去北京天安門,美國“挑唆”臺灣,大陸如何應對

賴清德:你們應該去北京天安門,美國“挑唆”臺灣,大陸如何應對

三分亮劍
2025-04-27 22:39:29
2025-04-28 15:56:49
集智俱樂部 incentive-icons
集智俱樂部
科普人工智能相關知識技能
5063文章數 4630關注度
往期回顧 全部

科技要聞

大廠圍獵AI人才:部分實習生日薪可達2000

頭條要聞

國家發改委副主任被朋友問"關稅問題" 本人公開回應

頭條要聞

國家發改委副主任被朋友問"關稅問題" 本人公開回應

體育要聞

我們來自北極圈,我們有全球最恐怖的主場!

娛樂要聞

王寶強座位引眾怒 論演技誰能壓得了

財經要聞

事關穩就業、穩經濟!四部門聯合發聲

汽車要聞

2025上海車展,再看比亞迪

態度原創

游戲
房產
手機
教育
家居

經典游《春風戰隊V-FORCE》版權拍賣 起價3.3億

房產要聞

爆發!三亞,開啟新一輪超大規模征收!

手機要聞

努比亞 Z70S Ultra 攝影師版手機發布:國產定制主攝、可外接鏡頭

教育要聞

小升初數學思維:等積變形

家居要聞

慢度設計 溫暖與沉靜的體驗

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 竹北市| 子洲县| 福贡县| 扶绥县| 馆陶县| 沅江市| 东丰县| 内黄县| 河津市| 民权县| 大姚县| 横山县| 贞丰县| 泾源县| 图木舒克市| 聂拉木县| 景宁| 海兴县| 桐乡市| 新宁县| 东阿县| 蓝山县| 石阡县| 福鼎市| 大埔县| 华池县| 社会| 玉环县| 南平市| 张家港市| 新安县| 乳山市| 文成县| 长子县| 邮箱| 景德镇市| 淮滨县| 大洼县| 新疆| 柏乡县| 邢台县|