Nature Chemistry:利用機器學習模擬化學反應
一、【科學背景】
原子尺度模擬已成為提供實驗觀察現象微觀解釋的寶貴計算工具,但傳統的物理模型勢函數在計算成本、準確性和廣泛適用性之間存在權衡,尤其在模擬反應化學時更為明顯。傳統的力場和量子力學方法在計算成本和適用范圍上存在限制,而反應力場則需要根據預定的反應進行重新參數化,量子力學方法的計算成本對許多反應性分子動力學研究來說是禁止的。
二、【創新成果】
近日,來自美國卡內基梅隆大學的Shuhao Zhang,洛斯阿拉莫斯國家實驗室的Nicholas Lubbers, Richard A. Messerly & Justin S. Smith等人在 Nature Chemistry 期刊發表了題為“Exploring the frontiers of condensed-phaseb chemistry with a general reactive machine learning potential”的論文,本文討論了開發一種用于研究凝聚相系統中反應化學的通用反應機器學習勢能(ANI-1xnr)的方法。該方法涉及自動采樣凝聚相反應,以創建適用于C、H、N和O元素的高度通用的反應MLIP。該方法利用主動學習來生成用于訓練ML模型的多樣且相關的數據集。MLIP直接訓練到凝聚相QM反應數據,以確保對反應MD模擬的可靠性。研究包括碳成核、石墨烯形成、生物燃料添加劑、甲烷燃燒以及甘氨酸的自發形成等應用。
圖1? 納米反應器主動學習工作流程和所考慮的具體應用的總結? ?2024 Springer Nature
AL 循環是一種用于開發 MLIP 的自動化、迭代且高效的方法。AL 生成一個訓練數據集,其中僅包含基于 MLIP 集合識別的高不確定性結構的量子計算。使用 NR 模擬對與凝聚相反應化學相關的結構進行采樣。初始系統由由元素 C、H、N 和 O 組成的小分子的隨機配置構建。使用當前的 MLIP 進行動態模擬,在溫度和體積的極端波動下誘導化學反應。為了測試所得模型的通用性,最終的 MLIP 隨后應用于訓練期間未直接針對的幾個案例研究。
圖2? 使用納米反應器主動學習分析本工作中生成的數據集 (ANI-1xnr)? ?2024 Springer Nature
在評估 ANI-1xnr 模型在不同案例研究中的性能之前,作者評估了 ANI-1xnr 數據集的多樣性和完整性。圖 2 通過將元素 H、C、N和 O的相似局部原子環境聚集在一起,提供了高維數據集的二維可視化。圖 2a-d 比較了 ANI-1xnr 數據集和非反應性、接近平衡的真空分子 AL 數據集 (ANI-1x)。顯然,ANI-1xnr 數據集不僅有效地涵蓋了整個 ANI-1x 數據集,而且還大大超出了 ANI-1x 覆蓋的局部原子環境空間。更重要的是,ANI-1xnr 數據集提供了 ANI-1x 數據集中許多簇之間的路徑。這些途徑可能對應于低維表示中的反應。此外,圖 2e 提供了 ANI-1xnr 訓練數據集中識別的 1000 多個獨特分子的精選示例。由于 NR 采樣模擬僅使用小分子進行初始化,因此 NR-AL 程序自動發現了數百條導致這些不同分子結構的反應途徑。
圖3? ANI-1xnr 的碳固相成核模擬結果? ?2024 Springer Nature
圖 3 總結了每次模擬的結果。對于每個高密度、中密度和低密度碳模擬,ANI-1xnr 生成相應密度的預期碳結構。具體來說,對于密度最高的體系,246 ps后,金剛石、石墨烯和六方金剛石相共存,其中模擬盒中70%的碳原子形成金剛石立方晶體結構。又過了 2.3 ns,高密度體系在金剛石立方晶體結構中含有 86% 的碳原子,石墨烯和六方金剛石位點很少。在中密度體系中,8.2 ps 后,31% 的原子快速形成石墨烯,再過 2.3 ns 后,體系中含有 83% 的石墨烯。石墨烯片傾向于形成堆疊且更有序的類石墨結構。低密度系統在 250 ps 后形成碳原子鏈,其中 11% 的原子形成石墨烯片。再過 3 ns 后,系統包含 88% 的石墨烯片中形成的原子。
圖4? 氧對 ANI-1xnr 石墨烯成環模擬結果的影響? ?2024 Springer Nature
圖 4 顯示了在八種不同的 O2/C2H2 比率下,三元、四元、五元、六元和七元環的形成隨模擬時間的變化情況。它展示了隨著 O2/C2H2 比率的變化,形成的環數量隨時間的變化情況。該圖直觀地展示了系統中氧氣相對于乙炔的濃度如何影響不同大小環的形成。與 Lei 等人的模擬相比,ANI-1xnr 與實驗數據的一致性有所提高,這主要是由于 ANI-1xnr 的模擬時間尺度更長、系統規模更大、計算成本更低。
圖5 ?ANI-1xnr 生物燃料添加劑模擬結果? ?2024 Springer Nature
圖6? ANI-1xnr 的甲烷燃燒模擬結果? ?2024 Springer Nature
圖7? ANI-1xnr 的米勒實驗模擬結果? ?2024 Springer Nature
為了進一步證明了 ANI-1xnr 乙醇模擬結果的正確性,我們重現了 Chen 等人模擬的四個系統,實驗結果表明乙醇可以在相對較高的壓力下加速燃料點燃,這與模擬結果一致。這表明 ANI-1xnr 電位準確地捕捉到了乙醇作為燃料添加劑在高壓條件下的行為。
圖 6a 顯示 ANI-1xnr 潛力產生的主要產品和物種概況與 Zeng 等人的非常相似。然而,與 Zeng 等人的 CH4 和 O2 消耗速率相比,ANI-1xnr 預測總體反應速率大約快 40 倍。他們的系統需要 0.5 ns 的模擬時間來消耗一半的初始 CH4 ,而作者的系統只需要 0.012 ns。
圖 7 顯示了從初始反應物開始形成甘氨酸的 ANI-1xnr 反應機制。在我們的米勒模擬過程中,甘氨酸形成了三次,并持續了大約 225 fs、375 fs 和 913 fs。考慮到該模擬的相對較高的溫度,預計甘氨酸的解離時間小于 1 ps。形成甘氨酸的最后一步是向 C2H4NO2 進行氫加成,類似于 Saitta 和 Saija 的機制。然而,在我們的機制中,氫加成發生在氧原子上,而不是像 Saitta 和 Saija 機制中那樣發生在 α-碳上。
三、【科學啟迪】
總之,ANI-1xnr 潛在的未來改進包括利用低密度或真空反應數據增強凝聚相數據集,將數據集擴展到更多元素,以及研究更高精度量子力學方法的前景,以獲得更好的反應障礙。此外,未來的工作還可以探索更先進的機器學習訓練范式,如遷移學習、元學習和終身學習。關于模型的形式,未來的工作可以研究如何結合最新的發展,如明確的長程項和電荷依賴性神經網絡電位。
至于在訓練領域之外應用 ANI-1xnr 時的注意事項,潛在用戶應了解 ANI-1xnr 只在特定密度范圍的凝聚相模擬中進行過訓練。因此,不建議將其用于空泡計算或密度差異較大的系統。此外,用戶在將 ANI-1xnr 應用于涉及氣相中從單重態到三重態電子狀態變化的系統時應謹慎,因為 ANI-1xnr 并未針對此類情況進行明確的訓練。
原文詳情:
Exploring the frontiers of condensed-phase chemistry with a general reactive machine learning potential. Nat. Chem. (2024).
DOI: 10.1038/s41557-023-01427-3
本文由尼古拉斯供稿
文章評論(0)