導語
機器學習是求解偏微分方程的一種有前途的方法,也是當前一個十分活躍的研究領域。然而,現有研究真能很好地證明機器學習在求解偏微分方程問題上的良好性能嗎?《自然·機器智能》雜志采訪了多位該領域的著名專家學者,他們各自發表了自己的觀點。
研究領域:偏微分方程、機器學習、數值方法、基準數據集、評估框架
編輯社論| 作者
徐子龍
| 譯者
宋鵬舉
| 審校
論文題目:尋找偏微分方程問題的機器學習解決方案 論文地址:https://www.nature.com/articles/s42256-025-00989-w
在科學與工程領域中,偏微分方程 (Partial differential equations,PDEs) 被廣泛用于描述從流體力學到量子力學等復雜系統的行為。這些方程構成了理解和模擬自然現象的基礎框架。然而,傳統的數值方法求解這些方程往往需要巨大的計算資源和時間。近年來,機器學習模型作為一種新興工具,顯示出了求解偏微分方程的巨大潛力,為科學家和工程師提供了新的視角和可能性。
盡管如此,通過與多位領域內專家的交流發現,關于機器學習模型在實際應用中的優勢以及如何準確評估其性能,仍存在諸多疑問。專家們指出,雖然機器學習在某些情況下展示了顯著的速度提升,但其泛化能力、穩定性和對不同問題類型的適應性還需要進一步研究。因此,明確機器學習模型在解決偏微分方程方面的具體應用場景及其局限性,對于推動這一領域的健康發展至關重要。
當前核心任務
偏微分方程能夠對時空物理系統的行為進行建模,用簡潔的符號形式來描述自然物理學定律。對于復雜問題,這些方程通常難以求得解析解,通常需要采用計算密集型的數值近似方法來求解。然而,近年來機器學習 (Machine learning, ML) 方法的發展帶來了新的數據驅動解決方案,為解決偏微分方程提供了全新的視角。這種新方法在流體動力學、熱傳遞和波傳播等工程領域展現出了變革性的應用潛力 [1]。
盡管機器學習在求解偏微分方程方面已迅速成為一個高度活躍的研究領域,但在學術研究之外的實際應用仍面臨諸多挑戰。目前,該領域的核心任務之一是達成關于合適基準數據集和評價指標的共識。具體而言,雖然機器學習模型在某些特定應用場景中展示了顯著的速度和效率優勢,但其泛化能力、穩定性和適應性仍需進一步驗證。此外,如何準確評估這些模型的性能,確保它們在實際工程問題中的可靠性和有效性,也是亟待解決的問題。
圖1 偏微分方程可以用于描述流體動力學
最新進展
作為近期研究領域的重大成果,在2024年度的神經信息處理系統大會 (NeurIPS 2024) 上,研究人員提出了一個名為“The Well”的大規模數據集 [2]。該數據集包含了從聲波到活性物質和天體物理現象等不同尺度時空物理系統的數值模擬。這一資源旨在為科學和工程領域中的偏微分方程機器學習求解器提供更復雜、更具挑戰性的基準問題。
哈佛大學教授 Petros Koumoutsakos 對此評價道:“這項工作是‘走在正確方向上的一步’,它提供了一個方便且豐富的模擬數據存儲庫。” 他強調了該數據集在推動機器學習方法應用于實際物理系統中的重要性。通過整合多種類型的模擬數據,“The Well”不僅為研究人員提供了測試和驗證其模型的新平臺,還促進了跨學科的合作與知識共享。Koumoutsakos 教授的研究興趣十分廣泛,主要研究方向是計算和人工智能在理解、預測和優化工程、納米技術和醫學中的流體流動方面的基礎和應用,還涉及數據科學、活性物質、仿生機器人以及能源、環境和可持續性等多個領域。
總而言之,“The Well”似乎是為滿足當前對更復雜、更具挑戰性的基準問題的需求而做出的嚴肅嘗試,這些問題可用于測試科學和工程領域中偏微分方程的機器學習求解器。
圖2 Petros Koumoutsakos,哈佛大學工程與應用科學學院教授,慕尼黑工業大學的特聘兼職教授,美國國家工程院(NAE)外籍院士。曾獲歐洲研究理事會高級研究員獎和 ACM 超級計算戈登-貝爾超級計算獎。,曾在加州理工學院并行計算中心、斯坦福大學湍流研究中心和美國國家航空航天局艾姆斯分局從事博士后研究,還曾在加州理工學院、東京大學、麻省理工學院、哈佛大學拉德克利夫高等研究院擔任客座研究員。
當前存在的問題及解決思路
此前,時任普林斯頓大學研究人員的 Nick McGreivy 和普林斯頓等離子物理學實驗室的首席研究物理學家 Ammar Hakim 在該雜志發表了一篇分析文章 [3]。通過調研82篇相關文獻,他們探討了流體動力學中基于機器學習的偏微分方程求解器的研究進展。在這篇文章中,作者提出了兩個令人擔憂的問題。
首先,他們發現與標準數值方法的比較往往不公平。具體來說,這種不公平性體現在兩個方面:一是所使用的基線方法并非針對特定問題的最先進方法;二是將較低精確度的機器學習模型的運行時間與更精確但運行時間較長的標準數值方法進行對比。這樣的比較方式可能導致對機器學習模型性能的誤解。
其次,作者還發現了存在系統性少報道消極結果的現象。許多研究傾向于強調積極成果,而忽視或淡化負面結果和局限性。這種做法可能會導致對該領域實際進展的過度樂觀估計。
總體而言,McGreivy 和 Hakim 的結論指出,目前對于機器學習模型在求解流體相關的偏微分方程問題上的能力存在過度樂觀的看法。他們的研究揭示了現有研究中的潛在偏差,并呼吁更加嚴謹和透明的評估方法。
McGreivy 教授目前的研究方向涵蓋機器學習、科學計算、等離子體物理、核聚變能和核政策等領域。他在普林斯頓大學時主要研究機器學習和自動微分在核聚變能和等離子體物理問題中的應用。
圖3 Nick McGreivy,普林斯頓大學教授 ,畢業于賓夕法尼亞大學,獲得物理學學士學位和計算機科學輔修學位。
Johannes Brandstetter 是約翰·開普勒林茨大學 (Johannes Kepler University Linz) 的助理教授,同時也是林茨新成立的人工智能研究機構 NXAI 的首席研究員。他在歐洲核子研究中心學習期間主要研究高能物理學。當他在“基于邊界圖神經網絡三維模擬” (Boundary graph neural networks for 3D simulations) 研究課題中工作時,第一次接觸到基于深度學習的模擬。后來他在阿姆斯特丹機器學習實驗室工作的幾年里,完全轉向了偏微分方程的神經網絡建模的研究,目前主要研究方向為機器學習、幾何深度學習、偏微分方程等。
在本期的《新聞與觀點》 (News & Views) 文章中,Brandstetter對分析報告中提出的問題進行了評論,并提出了兩個基礎性問題。
首先,為什么對于領域而言,讓機器學習模型和數值方法之間做公平比較是如此有挑戰性的?Brandstetter 指出,這種困難源于多種因素,包括不同應用場景下用戶對速度、準確性、不確定性量化、泛化能力和實際實現的不同需求。具體來說,不同的應用可能對這些指標有不同的優先級,而現有的基準測試往往未能全面涵蓋所有這些需求,導致目前的性能比較是不夠公平和全面的。
其次,另一個關鍵問題:機器學習模型是否真正具備優勢?盡管機器學習在某些特定任務中展示了顯著的速度提升,但其在其他方面的表現 (如準確性、泛化能力等) 仍需進一步驗證。
Brandstetter 認為,為了推動該領域的發展,需要設計更加綜合的基準挑戰,以評估機器學習模型在解決偏微分方程中的實際性能。他建議借鑒蛋白質結構預測領域的“關鍵評估”(Critical Assessment of protein Structure Prediction, CASP)模式,創建類似的標準測試框架。這樣的基準挑戰應結合多種用戶需求,如速度、準確性、不確定性的量化、泛化性和實際實現,從而提供更為全面和客觀的評估標準。
圖4 Johannes Brandstetter,約翰·開普勒林茨大學助理教授、林茨NXAI實驗室首席研究員 Johannes Brandstetter,博士畢業于歐洲核子研究中心,曾任職于阿姆斯特丹機器學習實驗室。
我們跟 Brandstetter 和 McGreivy 深入地討論了他們關于該領域進展的觀點。McGreivy 同意我們需要類似CASP的基準問題,他表示“在此之前,基于機器學習的流體相關偏微分方程求解器仍然是尋找問題的解決方案”。
他強調了一個有價值的基準問題的三個一般關鍵特性:
(1)應該是當前方法不可解的;
(2)應該是可驗證的,以保證答案是正確的;
(3)應該是對科學知識或者真實世界工業應用有貢獻的。
然而,McGreivy 表示,因為當前只能用高保真建模,例如直接數值模擬方法來提供真實解,因此偏微分方程求解器的基準問題無法同時滿足計算上不可解且可驗證的要求。這給研究者提出有影響力的挑戰性問題造成困難。
圖5 物理信息神經網絡(physics-informed neural network, PINN)
未來發展方向
Brandstetter 深信我們需要改變研究視角,研究人員應當尋找現有數值方法無法解決的問題。因此,他正在探索比以往解決的系統規模大一個數量級的復雜偏微分方程問題。他認為,只有這種復雜度才能真正發揮深度學習的優勢。
“我們不應該忘記,數值方法本身也只是近似工具。如果一個問題通過這些近似方法能夠幾乎完美且高效地解決,那么幾乎沒有理由去取代它們。” Brandstetter 補充道。具體來說,Brandstetter 認為當前的研究應該專注于那些現有數值方法難以處理的高度復雜的偏微分方程問題。他希望 通過挑戰這些問題,能夠揭示出深度學習在解決復雜物理系統中的真正潛力。
現在的當務之急是設計出有價值且具有挑戰性的基準問題,使得機器學習方法能夠在其中表現出色,并成為首選解決方案。這樣的努力將極大地受益于與領域專家的緊密合作。正如 Koumoutsakos 告訴我們的,“選擇信息豐富的基準問題需要豐富的領域知識,而不僅僅是求解方程和收集數據”。具體來說,設計有用的基準問題不僅涉及技術層面的挑戰,還需要深入理解特定領域的實際需求和背景知識。只有通過這種跨學科的合作,才能確保所設計的基準問題既能反映真實世界的復雜性,又能有效評估機器學習模型的性能。
參考文獻
1. Brunton, S. L. & Kutz, J. N. Nat. Comput. Sci. 4, 483–494 (2024).
2. Ohana, R. et al. In 38th Conf. Neural Information Processing Systems (NeurIPS 2024) Track on Datasets and Benchmarks (2024).
3. McGreivy, N. & Hakim, A. Nat. Mach. Intell. 6, 1256–1269 (2024).
AI+Science 讀書會
AI+Science 是近年興起的將人工智能和科學相結合的一種趨勢。一方面是 AI for Science,機器學習和其他 AI 技術可以用來解決科學研究中的問題,從預測天氣和蛋白質結構,到模擬星系碰撞、設計優化核聚變反應堆,甚至像科學家一樣進行科學發現,被稱為科學發現的“第五范式”。另一方面是 Science for AI,科學尤其是物理學中的規律和思想啟發機器學習理論,為人工智能的發展提供全新的視角和方法。
集智俱樂部聯合斯坦福大學計算機科學系博士后研究員吳泰霖(Jure Leskovec 教授指導)、哈佛量子計劃研究員扈鴻業、麻省理工學院物理系博士生劉子鳴(Max Tegmark 教授指導),共同發起以”為主題的讀書會,探討該領域的重要問題,共學共研相關文獻。讀書會已完結,現在報名可加入社群并解鎖回放視頻權限。
詳情請見:
1.
2.
3.
4.
5.
6.
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.