深度原理 | 作者
在化學(xué)的微觀世界里,過渡態(tài)(TS)就像化學(xué)反應(yīng)中的 "能量高峰"—— 當(dāng)分子們?yōu)榱税l(fā)生奇妙的化學(xué)變化而劇烈碰撞時,必須跨越這個轉(zhuǎn)瞬即逝的能量頂峰。然而,這個關(guān)鍵的中間狀態(tài)就像閃電一樣難以捕捉:實(shí)驗(yàn)儀器的 "快門速度" 跟不上它的變化節(jié)奏,而傳統(tǒng)的量子化學(xué)計算方法又如同用慢鏡頭拍攝煙花,即使是最強(qiáng)大的超級計算機(jī),解析一個過渡態(tài)的結(jié)構(gòu)也可能需要連續(xù)工作數(shù)小時甚至數(shù)天。這種困境讓科學(xué)家們在探索復(fù)雜反應(yīng)網(wǎng)絡(luò)指導(dǎo)化工生產(chǎn)、設(shè)計性能更優(yōu)的催化劑時舉步維艱。
圖一|二維勢能面上的反應(yīng)物(R),過渡態(tài)(TS),產(chǎn)物(P),以及最小能量路徑(minimal energy pathway)
近日,深度原理 Deep Principle聯(lián)合佐治亞理工大學(xué),康奈爾大學(xué)等機(jī)構(gòu)聯(lián)合提出了一種革新性的過渡態(tài)檢索方法--React-OT,采用最優(yōu)傳輸(Optimal Transport, OT)的方法,從反應(yīng)物和產(chǎn)物的結(jié)構(gòu)插值開始,推導(dǎo)出高度精確的過渡態(tài)結(jié)構(gòu),相關(guān)成果已作為封面文章發(fā)表在Nature Machine Intelligence上,同時MIT News也對文章的第一兼通訊作者,深度原理 Deep Principle的創(chuàng)始人兼CTO段辰儒博士進(jìn)行了專訪報道。
本文將帶你深入了解 React-OT 的核心原理、與傳統(tǒng)方法的對比,以及它如何突破計算化學(xué)的瓶頸,大幅提升 TS 搜索的效率與精度,為反應(yīng)機(jī)理研究和催化劑設(shè)計提供全新工具。
一、方法創(chuàng)新
從 OA-ReactDiff 到 React-OT
OA-ReactDiff是深度原理 Deep Principle于2023年推出的首個生成3D化學(xué)反應(yīng)的擴(kuò)散生成模型,這項成果已在Nature大子刊Nature Computational Science上發(fā)表,并被選為封面論文。OA-ReactDiff僅依賴反應(yīng)物和產(chǎn)物的3D幾何形狀即可生成過渡態(tài)結(jié)構(gòu),比傳統(tǒng)量化方法預(yù)測過渡態(tài)速度提升1000倍。但是由于擴(kuò)散模型采樣過程中的隨機(jī)性,OA-ReactDiff生成的過渡態(tài)也是隨機(jī)的,往往需要多次采樣才能獲得理想的過渡態(tài)結(jié)構(gòu)。
作為OA-ReactDiff的迭代升級版本,React-OT在OA-ReactDiff的基礎(chǔ)上,針對給定的反應(yīng)物和生成物(雙端搜索)進(jìn)行了改進(jìn),基于最優(yōu)傳輸理論,通過流匹配方法,從反應(yīng)物和產(chǎn)物直接推導(dǎo)TS結(jié)構(gòu),單次采樣即可生成確定性的TS結(jié)構(gòu)。
最優(yōu)傳輸(OT)
最優(yōu)傳輸是一種數(shù)學(xué)理論和計算方法,用于描述兩個概率分布之間的距離或者對應(yīng)關(guān)系。它的核心概念是如何以最佳方式將一組資源(如質(zhì)量、能量等)從一個位置傳輸?shù)搅硪粋€位置。類比初中學(xué)習(xí)的線性規(guī)劃問題:三個城市(A, B, C)分別有1、0.5、1.5噸煤,另外有兩個城市(D, E)分別需要2、1噸煤,由于不同城市之間的運(yùn)輸成本不同,城市需求也不同,需要制定策略給出最優(yōu)運(yùn)輸路線,這些“最優(yōu)路線”在化學(xué)反應(yīng)中就代表了最合理化學(xué)反應(yīng)路徑以其對應(yīng)的過渡態(tài)結(jié)構(gòu)。
技術(shù)亮點(diǎn)速覽
1. 初始過渡態(tài)結(jié)構(gòu):OA-ReactDiff從高斯噪音中隨機(jī)采樣,所以生成的過渡態(tài)也存在隨機(jī)性。React-OT則是從反應(yīng)物和產(chǎn)物的線性插值出發(fā),并且通過平移旋轉(zhuǎn)等操作確保初始結(jié)構(gòu)的等變性和唯一性,獲得相對合理的初始猜測,將采樣路徑推向更接近最優(yōu)傳輸?shù)姆较颉?/strong>
2. 采樣過程:OA-ReactDiff采用擴(kuò)散模型,過渡態(tài)生成是一個隨機(jī)采樣過程。而React-OT將采樣過程模擬為常微分方程,而不是擴(kuò)散模型中的隨機(jī)微分方程,將反應(yīng)物、產(chǎn)物和過渡態(tài)的聯(lián)合分布視為動態(tài)傳輸問題,通過流匹配(flow matching)方法,直接從反應(yīng)物和產(chǎn)物推導(dǎo)TS結(jié)構(gòu),不再需要多次隨機(jī)采樣。
3. 更大數(shù)據(jù)集的預(yù)訓(xùn)練:使用RGD1-xTB 數(shù)據(jù)集對React-OT進(jìn)行預(yù)訓(xùn)練,然后再在Transition 1x數(shù)據(jù)集上進(jìn)行模型的微調(diào),RGD1-xTB包含95萬個基于 GFN2-xTB 計算的化學(xué)反應(yīng),對比訓(xùn)練OA-ReactDiff使用的Transition1x 數(shù)據(jù)集(1 萬個反應(yīng)),RGD1-xTB的數(shù)據(jù)量大幅增加,可為 React-OT 提供更廣泛的化學(xué)環(huán)境和結(jié)構(gòu)信息。
圖二 | 擴(kuò)散模型和最佳傳輸模型生成TS結(jié)構(gòu)的工作概述(左)OA-ReactDiff的隨機(jī)推理過程。(右)React-OT的確定性推理過程
二、結(jié)果一覽
擠爆牙膏的性能提升
在使用Transition 1x訓(xùn)練React-OT之前,先在RGD1-xTB 數(shù)據(jù)集上對 React-OT進(jìn)行了預(yù)訓(xùn)練,預(yù)訓(xùn)練后,React-OT在TS預(yù)測精度上實(shí)現(xiàn)了顯著提升:生成結(jié)構(gòu)的 RMSD 中位數(shù)和勢壘高度誤差降低 25%以上,相比未預(yù)訓(xùn)練模型精度提升顯著。除了精度的提升之外,搜索過渡態(tài)所需運(yùn)行時間也顯著減少。OA-ReactDiff在單張GPU上需6秒完成過渡態(tài)搜索,而React-OT的采樣過程消除了隨機(jī)性,只要0.4秒就可以得到正確的TS結(jié)構(gòu)。對比OA-ReactDiff,React-OT能適應(yīng)更復(fù)雜的化學(xué)反應(yīng)類型,對未見過反應(yīng)的預(yù)測能力也要更好。
圖三 | React-OT和OA-ReactDiff模型在生成過渡態(tài)的精度和速度方面的性能對比 a. React-OT得到滿足特定RMSD要求的TS結(jié)構(gòu)的可能性高于兩種擴(kuò)散模型。b. OA-ReactDiff和React-OT生成過渡態(tài)的質(zhì)量。c. 兩種模型預(yù)測效果的對比。d. 運(yùn)行速度的比較。
在反應(yīng)網(wǎng)絡(luò)中的應(yīng)用
在經(jīng)過 RGD1-xTB 預(yù)訓(xùn)練后,React-OT顯著提升了對未見反應(yīng)類型的適應(yīng)性和預(yù)測能力,即使在12 個非氫原子的復(fù)雜反應(yīng)體系中,仍能準(zhǔn)確生成TS結(jié)構(gòu),具備應(yīng)對多步有機(jī)反應(yīng)的能力。為了探索React-OT在反應(yīng)網(wǎng)絡(luò)探索中的實(shí)際應(yīng)用,這篇文章選擇γ-酮過氧化氫(KHP)作為研究對象。KHP 是一個備受關(guān)注的反應(yīng)體系,近年來被廣泛用于基準(zhǔn)測試。
圖四| KHP的反應(yīng)網(wǎng)絡(luò) 其中紅色/黑色的數(shù)字分別為DFT計算/React-OT生成的過渡態(tài)上計算得到的活化能
可以看到,React-OT生成的反應(yīng)網(wǎng)絡(luò)與文獻(xiàn)記載的KHP反應(yīng)節(jié)點(diǎn)完全一致,表明其能夠準(zhǔn)確捕捉所有關(guān)鍵反應(yīng),且兩者的平均絕對能量差僅為 3.84 kcal/mol。這一案例研究展示了 React-OT 在加速反應(yīng)網(wǎng)絡(luò)探索中的應(yīng)用潛力。
三、應(yīng)用展望
段辰儒表示,“人類眨眼的平均時間是0.4秒。在這個時間內(nèi)React-OT就可以精準(zhǔn)的找到一個化學(xué)反應(yīng)的過渡態(tài),這在之前是不可想象的。極致的加速會產(chǎn)生行為模式的質(zhì)變,React-OT將改變我們對化學(xué)反應(yīng)的理解和探索新材料的方式。”
應(yīng)用場景前瞻
· 催化劑設(shè)計:快速篩選高活性反應(yīng)路徑,加速清潔能源催化劑開發(fā)。
· 藥物合成:精準(zhǔn)預(yù)測有機(jī)反應(yīng)能壘,優(yōu)化合成路線,降低實(shí)驗(yàn)成本。
· 材料探索:構(gòu)建超大型反應(yīng)網(wǎng)絡(luò),發(fā)現(xiàn)新型功能材料(如MOFs、鈣鈦礦)。
未來已來
React-OT標(biāo)志著化學(xué)反應(yīng)TS搜索進(jìn)入高效、精準(zhǔn)的新紀(jì)元,有望成為計算化學(xué)領(lǐng)域的重要工具。歡迎關(guān)注深度原理 Deep Principle團(tuán)隊,探索更多前沿研究!
拓展閱讀:Bohrium Notebook
如果對生成式模型感興趣,想進(jìn)一步了解React-OT,復(fù)制下方鏈接,打開 Notebook:
https://bohrium.dp.tech/notebooks/47742251216
也可以通過Bohrium App或者深度原理 Deep Principle(DeepPrinciple)官方使用鏈接直接試用模型生成你想要的過渡態(tài):
https://bohrium.dp.tech/apps/bohriumweb/job?type=app
深度原理 Deep Principle(DeepPrinciple)官方使用鏈接:
http://reactot-dev.deepprinciple.com
AI+Science 讀書會
AI+Science 是近年興起的將人工智能和科學(xué)相結(jié)合的一種趨勢。 一方面是 AI for Science,機(jī)器學(xué)習(xí)和其他 AI 技術(shù)可以用來解決科學(xué)研究中的問題,從預(yù)測天氣和蛋白質(zhì)結(jié)構(gòu),到模擬星系碰撞、設(shè)計優(yōu)化核聚變反應(yīng)堆,甚至像科學(xué)家一樣進(jìn)行科學(xué)發(fā)現(xiàn),被稱為科學(xué)發(fā)現(xiàn)的“第五范式”。 另一方面是 Science for AI,科學(xué)尤其是物理學(xué)中的規(guī)律和思想啟發(fā)機(jī)器學(xué)習(xí)理論,為人工智能的發(fā)展提供全新的視角和方法。
集智俱樂部聯(lián)合斯坦福大學(xué)計算機(jī)科學(xué)系博士后研究員吳泰霖(Jure Leskovec 教授指導(dǎo))、哈佛量子計劃研究員扈鴻業(yè)、麻省理工學(xué)院物理系博士生劉子鳴(Max Tegmark 教授指導(dǎo)),共同發(fā)起以”為主題的讀書會,探討該領(lǐng)域的重要問題,共學(xué)共研相關(guān)文獻(xiàn)。 讀書會已完結(jié),現(xiàn)在報名可加入社群并解鎖回放視頻權(quán)限。
詳情請見:
1.
2.
3.
4.
5.
6.
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.