導語
從未來回望,2025年將被定義為“人工智能與科學發現深度融合的元年”。而這源于2024年兩項諾貝爾獎均授予了AI深度參與其中的研究。物理學獎授予了科學家John J. Hopfield和Geoffrey E. Hinton,以表彰他們在使用人工神經網絡進行機器學習方面的基礎性發現和開創性貢獻。諾貝爾化學獎則頒發給了科學家David Baker、Demis Hassabis和John M. Jumper,以表彰他們在計算機蛋白設計及蛋白質結構預測領域的杰出成就。
為了梳理這一快速發展的全新領域,上海科學智能研究院、集智科學研究中心和阿里云共同發布了“AI X Science十大前沿觀察”,梳理出35個研究前沿,來推動科學發展的黃金時代到來。報告全文可以掃描下方二維碼獲取,并可快速鏈接論文原文。
掃描二維碼 下載完整報告
出品:漆遠、吳力波、張江 運營:孟晉宇、王婷 撰稿:張江、楊燕青、王婷、王朝會、十三維、周莉、梁金、袁冰、江千月、劉志毅 鳴謝(按姓氏拼音順序,排名不分先后):曹風雷 、陳小楊 、程遠、杜沅豈 、段郁、方榯楷 、付彥偉、 高悅、黃柯鑫、李昊、劉圣超、譚偉敏、吳泰霖、吳艷玲、向紅軍、張驥、張艷、朱思語
序章
AI X Science,即人工智能與科學研究的深度融合,具體包括兩方面:將AI技術應用于領域學科的新興研究方法(AI for Science);將領域學科知識用于AI算法和架構的理解和改進工作(Science for AI)。
2024年諾貝爾物理學獎授予的是將物理學用于AI系統設計的研究,即Science for AI,而諾貝爾化學獎授予的是人工智能算法用于解決化學領域重要問題的研究,即AI for Science。
AI for Science
隨著數據的快速積累和文獻的爆炸式增長,人類科學家自身的信息處理能力已經成為了制約某些學科快速發展的瓶頸。而越來越多的科學研究領域在面對復雜問題的挑戰時難以利用傳統的數學和物理方法,例如蛋白質結構預測、新材料的設計、復雜流體系統的模擬等等。
另一方面,隨著大數據時代的降臨和算力的提升,人工智能技術正飛速發展。以ChatGPT為代表的大語言模型(Large Language Model,簡稱LLM)是AI發展史上的重大突破,而近期推理模型異軍突起,例如GPT-o1/o3和Deepseek R1已經具備了強大的學習能力和推理能力,甚至可以成為科研人員重要的助手,輔助解決一定級別的科研問題。因此,如何將AI先進技術用于具體的科學領域,加速科學研究的速度成為了AI for Science研究領域的重要挑戰。
已有的AI for Science案例包括:
AlphaFold
用AlphaFold3預測的精準蛋白質結構 | 來源:Abramson, J., Adler, J., Dunger, J. et al. Accurate structure prediction of biomolecular interactions with AlphaFold 3. Nature630, 493–500 (2024).
斬獲2024年諾貝爾化學獎的Baker、Hassabis和Jumper的研究工作就是將深度學習技術應用于蛋白質結構預測與設計這一經典領域。蛋白質是生命的“基礎建筑塊”,它不僅可以催化生化反應、調節生理機制,還可以調控基因表達,運輸生命必需物質以及用于抵抗病毒、細菌入侵等重要功能。Hassabis與Jumper開發的AlphaFold系列工作,可以精準預測蛋白質結構,準確度已經接近專家水平,速度則遠超人類。最新版本的AlphaFold則可以預測幾乎所有分子類型的蛋白質復合物結構。
氣象預測大模型
GraphCast:用于更快速、更準確的全球天氣預報的人工智能模型 | 來源:Remi Lam et al., Learning skillful medium-range global weather forecasting.Science382,1416-1421(2023)
隨著全球變暖,極端天氣會越來越多的影響人類生活生存環境。因此,如何更加精準地對未來天氣發展進行準確預測,特別是防患極端天氣的到來越來越成為意義重大的科學問題。然而,傳統的氣象學研究受限于數據的缺乏、人類知識和經驗的局限以及氣象系統內在的不確定性因素等影響,無法給出較長期而精準的預測。因此,如何將大模型等最新的AI技術引入氣象領域,已經成為了近年來AI for Science研究的焦點之一。近年來,若干氣象預測大模型被陸續開發出來,包括Google的GraphCast、華為的盤古大模型、英偉達的FourCastNet、復旦大學-上海科學智能研究院的伏羲氣象大模型等都取得了顯著進展。
AI可控核聚變
通過深度強化學習控制聚變等離子體以避免撕裂不穩定性的模型框架 | 來源:Seo, J., Kim, S., Jalalvand, A. et al. Avoiding fusion plasma tearing instability with deep reinforcement learning. Nature626, 746–751 (2024)
核聚變是一種清潔、安全、便利的新型能源。與化石燃料相比,聚變能的使用可以顯著減少對環境的影響,有助于應對氣候變化。核聚變反應需要在極高溫度和壓力下進行,因此等離子體的穩定性是實現可控核聚變的關鍵。AI技術可以用于實時監測和控制等離子體狀態,預測不穩定性并及時調整實驗參數,以保持等離子體的穩定。2024年初,普林斯頓大學和普林斯頓等離子體物理實驗室的研究人員在可控核聚變領域取得突破,他們發現了一種方法,可以利用AI預測這種潛在的不穩定性,并且實時防止實驗中斷。相關研究成果發表在了2024年2月份的Nature刊物上。
Science for AI
即使已獲重大突破,但AI技術仍然面臨數據稀缺、算力稀缺、耗能過大、解釋性較差等重大挑戰。另一方面,人類科學家已經積累了各個學科領域的海量知識。如何將科學家的經驗和知識,甚至一些不成型的啟發式想法,轉化為AI系統的能力,讓AI系統與人類專家能夠更好地互動、協作,構成了Science for AI研究領域的重大挑戰。
目前,已有的Science for AI案例包括:
Hopfield網絡與受限Boltzmann機
ISING模型、Hopfield網絡以及受限Boltzmann機 | 來源:https://www.nobelprize.org/prizes/physics/2024/press-release/
本次諾貝爾物理學獎授予的兩名學者,Hopfield和Hinton正是將統計物理中的經典模型的變種應用于神經網絡架構設計,從而大大提升了機器學習問題的求解效率,為人類進入深度學習時代開辟了先河。Hopfield所提出的Hopfield網絡模型是在統計物理的ISING模型的基礎上改進而得到的,它可以通過訓練學習記憶一些固定的模式,并在應用階段激活、回憶起這些模式。在Hopfield網絡模型的基礎上,Hinton所提出的受限Boltzmann機模型則可以通過大量數據的訓練,學習數據的壓縮表征,并可以通過拼接多層的方式,獲得數據在多個尺度上的深層次表征。這些表征可以進一步用來分類或預測。
視覺架構啟發的CNN網絡
用于圖像識別的卷積神經網絡架構 | 來源:Hoeser, T.; Kuenzer, C. Object Detection and Image Segmentation with Deep Learning on Earth Observation Data: A Review-Part I: Evolution and Recent Trends. Remote Sens. 2020, 12, 1667.
對真實生物神經網絡結構的研究有助于人們提出更先進的人工智能系統架構。例如,卷積神經網絡(CNN)的提出就受到了生物神經網絡研究的啟發,尤其是對視覺系統的理解。早在20世紀60年代,神經科學家David Hubel和Torsten Wiesel通過對貓的視覺皮層進行實驗,發現了視覺神經元的不同反應特性。他們觀察到,某些神經元對特定方向的邊緣或圖案表現出強烈的反應,稱為簡單細胞;而另一些神經元則對更復雜的視覺刺激(如形狀和運動)有反應,稱為復雜細胞。這種對視覺神經元功能的理解為CNN的設計提供了重要的理論基礎。CNN模擬了生物視覺系統中的層次結構,通過多層網絡逐步提取特征。最初的卷積層相當于簡單細胞,負責檢測圖像中的基本特征,如邊緣和角落;而后續的層則類似于復雜細胞,能夠識別更高層次的特征,如形狀和物體。此外,CNN中的卷積操作和池化操作也受到生物神經網絡的啟發。卷積操作通過局部感受野的方式,模擬了生物神經元對局部區域的敏感性,而池化操作則通過下采樣減少特征圖的維度,增強了模型對位置變化的魯棒性。這種設計不僅提高了計算效率,還使得網絡能夠更好地處理圖像中的變換和扭曲。
等變神經網絡
等變神經網絡網絡工作原理示意圖 | 來源:V??ctor Garcia Satorras, Emiel Hoogeboom, Max Welling
Proceedings of the 38th International Conference on Machine Learning, PMLR 139:9323-9332, 2021.
在分子建模、蛋白質預測、計算機視覺和機器人等領域中,很多數據都具備幾何空間上的對稱性,如一組點云在旋轉、平移或縮放變換下會保持一定的不變性。如果用普通的神經網絡技術處理數據就很難捕獲到這種幾何對稱性。于是,人們提出了等變神經網絡(Equivariant Neural Networks,EGNN)技術,可以將幾何上的對稱性作為一個先驗偏置編碼進神經網絡的架構中,使得網絡在輸入經過某種變換時,輸出能夠以相應的方式變化,從而保持對稱性和不變性。等變神經網絡在建模分子結構、模擬多體物理系統、計算機視覺、機器人等領域具有廣泛的應用場景,是將幾何學、群論和剛體運動等數學、物理學知識應用于神經網絡設計的典型案例。
盡管剛剛起步,人工智能和科學研究的深度融合已呈現出“井噴式”增長:不同領域的科學家紛紛將AI融入自己的研究,同時科學領域的研究者也在關注人工智能發展,力求理解其工作原理,以期實現更好的改進。為了梳理這一快速發展的全新領域,上海科學智能研究院、集智科學研究中心和阿里云共同發起了“AI X Science十大前沿觀察”項目,希望能夠把脈和提煉這一新興領域的最新發展動態。
在與上海科學智能研究院、復旦大學和大量集智俱樂部社區中的從事前沿研究的學者深度訪談基礎上,我們做了大量的文獻梳理,并最終凝練了“AI X Science十大前沿觀察”的三個維度和十個具體方向。三個維度包括:AI for Science、Science for AI和基礎設施,其中,AI for Science的前沿方向包括基于LLM的科學研究、垂直領域科學大模型、融入先驗知識的AI模型、AI科學家、復雜世界的多智能體建模,以及AI仿真與系統模擬;Science for AI的前沿方向則覆蓋了物理世界的第一性原理和科學啟發的AI新架構;基礎設施前沿方向包括合成數據和數據基礎設施、新型智能計算。在十個具體方向上,我們梳理出共計35個研究前沿。需要指出的是:這十個方向的具體研究案例未必都是共識的權威成果,但在科學問題設定、方法論建構、精度和效率的提升等方面,這些研究不僅效果顯著,且令人耳目一新。展望未來,AI X Science大幕已啟,正如DeepMind在2024年11月發布的研究報告所預見,一個科學發現的黃金時代正在到來。
AI X Science十大前沿觀察
《AI X Science十大前沿觀察》的具體內容,請掃描二維碼下載報告全文,并且集智俱樂部公眾號也會繼續發布各章節詳細內容。
掃描二維碼 下載完整報告
展望
特殊挑戰
通觀全局,AI X Science尚處起步階段,但其發展速度卻非常迅速。同時,這一領域雖然發展迅猛,但也存在著嚴重的挑戰并蘊含著巨大的機遇。與一般的AI研究領域不同,我們認為,AI X Science在未來可能需要面對兩大特殊的挑戰:
Science for AI:AI如何與人類共享知識
這既包括如何將專家的知識融入AI系統,也包括如何提高AI系統的可解釋性。
目前已知的大量AI系統架構上面的里程碑式進展,往往都伴隨著人類將一大類先驗知識融入到了AI體系架構的設計之中。例如卷積神經網絡(CNN)的架構設計就是融入了空間平移對稱性的考慮;基于擴散的生成式模型,則是由擴散物理過程轉變而來的一種全新架構。知識圖譜、向量數據庫等技術則將人類知識轉變為一種外部模塊,從而被AI系統所應用。然而,這些進展只在一定程度上解決了共享人類專家知識的問題,如何更好地將專家知識轉變為AI系統可用的模塊、架構或外部知識仍然是未來的重要挑戰之一。
其次,隨著AI模型的規模越來越大,這些大模型的工作機理將會變得越來越不透明,特別是大模型涌現現象的存在,使得模型能力的提升變得撲朔迷離。因此,如何將AI大模型學習到的知識更好地同步給人類,甚至于找到AI大模型運作的基本原理,則是未來有待解決的另一重大挑戰。
我們認為這兩個方面的挑戰將成為未來Science for AI研究的重要方向。
AI for Science:AI如何具備實驗思維
縱觀人類數百年的科學活動,做實驗是科學研究活動中不可或缺的重要組成部分。如何設計巧妙的實驗,從而用最小成本獲取最關鍵信息,是一種不同于被動學習、演繹和推理的全新的思維方式——即實驗思維。
然而,目前的科學智能研究絕大部分都集中在如何讓AI系統具備人類一樣的邏輯思維和基于被動數據的歸納思維模式,卻相對缺乏基于干預數據的反事實推理能力,以及與真實世界互動并主動獲得數據的能力。之所以出現這一問題,部分原因在于目前的AI系統的犯錯誤成本過高,因此尚難以具備與真實世界互動的能力。特別是,由于AI系統的不可解釋、不透明性,人類難以信任AI系統自行與真實世界互動。這一能力的缺乏才是導致數據稀缺的本質,也將大大限制AI科學家達到人類科學家的水平。
因此,我們認為,未來AI for Science研究的一大挑戰將是如何巧妙地設計實驗,自主從世界獲取新的數據,以促進AI系統的學習,從而更有效的完成學習任務。
科學世界模型框架
為了應對這兩大特殊挑戰,我們嘗試提出一個科學世界模型框架:
科學世界模型框架
該框架包含了兩大智能主體和兩個交互界面。兩大智能主體包括:數據驅動為主的基礎模型(Foundation Model)和人機交互為主的深思者(Deep Thinker)。兩個交互界面主要包括:人機對齊界面(Human-AI Alignment)和AI-現實互動(AI-Reality Interaction)界面。下面分別展開論述:
數據驅動模型
數據驅動模型是一個單一領域,或跨領域的AI模型,可以通過機器學習的方式從多源、多模態數據之中提取有用的模式和規律。但該基礎模型不僅包括學習和建模,理想化的終極形態應該是一個代理模型(Surrogated Model),該模型將可以替代真實的研究對象,從而完成預測、模擬、問題求解等一系列下游任務。
然而,面向科學智能的基礎模型還應具備一種全新的能力,即“做實驗”——如何為了學到更好的替代模型而直接與真實世界互動,從而獲取新的干預數據。這部分干預世界、獲取反饋的功能則將專門由實驗設計模塊(Experiment Designer)完成。考慮到AI與世界互動的成本過高的問題,因此如何在盡可能少而輕地與真實世界互動的前提下,獲取更多的有用信息乃至補全數據,將會是實驗設計模塊的重要任務。
從一定意義上說,基礎模型模塊所完成的類似于人類大腦中的系統I的功能。但是,與人腦中的系統I不同的是,該基礎模型還包括了一定程度上的問題求解能力和實驗設計能力。
深思者
目前的AI系統無法替代人類科學家來單獨探索世界。我們認為,在今后較長的一段時間內,科學研究仍將通過人類科學家和機器的協作來完成。在數據驅動的模型之外,融合第一性原理、先驗知識和領域機理的深度推理模型必不可少,類似o1、o3和R1這些推理模型,以及神經符號體系中的Lean,這就是“深思者”。 深思者在一定程度上類似于人腦中的系統II,數據驅動模型需要和“深思者”深度融合,將深度學習的感知和符號推理的嚴謹、可解釋相結合。
一方面,深思者會充分獲取人類專家的知識和經驗,這包括從大量科學文獻中獲取知識、完成推理;也包括將人類專家的知識(以知識圖譜、概率圖模型等形式呈現)存儲在單獨的處理模塊中,并與基礎模型深度結合起來;還包括將人類專家的經驗性知識、領域的第一性原理以歸納偏置(Inductive Bias,例如對稱性的考量等)的方式,轉變為基礎模型模塊融入神經網絡架構設計之中,這一功能可通過構建某種通用的神經網絡架構設計語言來完成。
另一方面,深思者還需要將基礎模型學習到的隱性知識以對人類更友好的方式展示出來,從而與人類科學家對齊。這包括但不限于生成具有啟發性和洞察力的科學報告、友好的可視化界面,以及對數據驅動模型思考過程的解釋等等,甚至于深思者自發總結的新科學規律。
AI與現實的交互
為了更好地探索真實世界,基礎模型主體應具備重要的“做實驗”的能力,從而通過主動地與世界互動,以獲得更多反饋數據。這一交互過程將主要由AI-現實交互界面完成。
一方面,基礎模型應通過“實驗設計器”規劃出一個如何干預世界以更好地獲得信息的方案,再根據這一規劃來與真實世界互動。但是,由于現實中的互動往往是成本高昂的(需要考慮到實驗成本和犯錯誤成本),因此這一互動過程并非類似于具身智能那樣頻繁而直接,它更應該以一種弱交互的方式來干預世界。
另一方面,基礎模型應能直接從真實世界獲取反饋,這既包括對智能體的評價反饋,也包括從真實世界收集到的全新數據。這些新的數據往往可以反映出對現實世界進行干預之后的反饋,因此也可以被理解為一種干預數據。這些干預數據可以進一步更新到訓練數據集之中,從而更好地訓練基礎模型。這種以主動完成數據收集和機器學習的方式,往往可以獲得更好的效果。
人類專家與AI系統的對齊
人類-AI對齊界面主要負責人類與AI系統的信息和知識的共享,從而達到人機能夠更好地協作這一重要目的。這包括兩方面:
首先,對于任何學科,目前絕大部分知識是掌握在人類專家手中的,因此,如何將人類專家的知識、經驗以及一些靈感性的啟發式思考,融入基礎模型這樣的以機器學習為主的系統之中,就是一個亟待解決的難題。盡管目前已普遍應用的知識圖譜、向量數據庫等技術可以部分解決這個問題,但是,更新的技術仍有巨大的應用潛力。例如,可以根據人類的直覺經驗而自動構造神經網絡架構、選擇合適超參的工具。
其次,可解釋性問題仍然是一個桎梏AI發展的重要卡點。如何設計更友好的人機交互界面,從而將AI的思考、推理過程展現給人類是未來待解決的重要問題。
AI+Science 讀書會
詳情請見:
1.
2.
3.
4.
5.
6.
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.