深度原理 Nat. Mach. Intell. | 最佳傳輸模型生成化學反應過渡態


?

在化學的微觀世界里,過渡態(TS)就像化學反應中的 "能量高峰"—— 當分子們為了發生奇妙的化學變化而劇烈碰撞時,必須跨越這個轉瞬即逝的能量頂峰。然而,這個關鍵的中間狀態就像閃電一樣難以捕捉:實驗儀器的 "快門速度" 跟不上它的變化節奏,而傳統的量子化學計算方法又如同用慢鏡頭拍攝煙花,即使是最強大的超級計算機,解析一個過渡態的結構也可能需要連續工作數小時甚至數天。這種困境讓科學家們在探索復雜反應網絡指導化工生產、設計性能更優的催化劑時舉步維艱。

 

圖一|二維勢能面上的反應物(R),過渡態(TS),產物(P),以及最小能量路徑(minimal energy pathway)

近日,深度原理?Deep Principle聯合佐治亞理工大學,康奈爾大學等機構聯合提出了一種革新性的過渡態檢索方法--React-OT,采用最優傳輸(Optimal Transport, OT)的方法,從反應物和產物的結構插值開始,推導出高度精確的過渡態結構,相關成果已作為封面文章發表在 Nature Machine Intelligence?上,同時MIT News也對文章的第一兼通訊作者,深度原理?Deep Principle創始人兼CTO段辰儒博士進行了專訪報道。

【等待文章發出后補充一個采訪內容和封面圖片拼圖】

本文將帶你深入了解 React-OT 的核心原理、與傳統方法的對比,以及它如何突破計算化學的瓶頸,大幅提升 TS 搜索的效率與精度,為反應機理研究和催化劑設計提供全新工具。

 

一、方法創新

??從 OA-ReactDiff 到 React-OT

OA-ReactDiff是深度原理?Deep Principle于2023年推出的首個生成3D化學反應的擴散生成模型,這項成果已在Nature大子刊Nature Computational Science上發表,并被選為封面論文。OA-ReactDiff僅依賴反應物和產物的3D幾何形狀即可生成過渡態結構,比傳統量化方法預測過渡態速度提升1000倍。但是由于擴散模型采樣過程中的隨機性,OA-ReactDiff生成的過渡態也是隨機的,往往需要多次采樣才能獲得理想的過渡態結構。

作為OA-ReactDiff的迭代升級版本,React-OT在OA-ReactDiff的基礎上,針對給定的反應物和生成物(雙端搜索)進行了改進,基于最優傳輸理論,通過流匹配方法,從反應物和產物直接推導TS結構,單次采樣即可生成確定性的TS結構。

 

 

??最優傳輸(OT)

最優傳輸是一種數學理論和計算方法,用于描述兩個概率分布之間的距離或者對應關系。它的核心概念是如何以最佳方式將一組資源(如質量、能量等)從一個位置傳輸到另一個位置。類比初中學習的線性規劃問題:三個城市(A, B, C)分別有1、0.5、1.5噸煤,另外有兩個城市(D, E)分別需要2、1噸煤,由于不同城市之間的運輸成本不同,城市需求也不同,需要制定策略給出最優運輸路線,這些“最優路線”在化學反應中就代表了最合理化學反應路徑以其對應的過渡態結構。

 

 

??技術亮點速覽

  1. 初始過渡態結構:OA-ReactDiff從高斯噪音中隨機采樣,所以生成的過渡態也存在隨機性。React-OT則是從反應物和產物的線性插值出發,并且通過平移旋轉等操作確保初始結構的等變性和唯一性,獲得相對合理的初始猜測,將采樣路徑推向更接近最優傳輸的方向。
  1. 采樣過程:OA-ReactDiff采用擴散模型,過渡態生成是一個隨機采樣過程。而React-OT將采樣過程模擬為常微分方程,而不是擴散模型中的隨機微分方程,將反應物、產物和過渡態的聯合分布視為動態傳輸問題,通過流匹配(flow matching)方法,直接從反應物和產物推導TS結構,不再需要多次隨機采樣。
  1. 更大數據集的預訓練:使用RGD1-xTB 數據集對React-OT進行預訓練,然后再在Transition 1x數據集上進行模型的微調,RGD1-xTB包含95萬個基于 GFN2-xTB 計算的化學反應,對比訓練OA-ReactDiff使用的Transition1x 數據集(1 萬個反應),RGD1-xTB的數據量大幅增加,可為 React-OT 提供更廣泛的化學環境和結構信息。圖二 | 擴散模型和最佳傳輸模型生成TS結構的工作概述(左)OA-ReactDiff的隨機推理過程。(右)React-OT的確定性推理過程??擠爆牙膏的性能提升??在經過 RGD1-xTB 預訓練后,React-OT顯著提升了對未見反應類型的適應性和預測能力,即使在12 個非氫原子的復雜反應體系中,仍能準確生成TS結構,具備應對多步有機反應的能力。為了探索React-OT在反應網絡探索中的實際應用,這篇文章選擇γ-酮過氧化氫(KHP)作為研究對象。KHP 是一個備受關注的反應體系,近年來被廣泛用于基準測試。圖四| KHP的反應網絡 ?其中紅色/黑色的數字分別為DFT計算/React-OT生成的過渡態上計算得到的活化能三、應用展望??應用場景前瞻
  2. 段辰儒表示,“人類眨眼的平均時間是0.4秒。在這個時間內React-OT就可以精準的找到一個化學反應的過渡態,這在之前是不可想象的。極致的加速會產生行為模式的質變,React-OT將改變我們對化學反應的理解和探索新材料的方式。”
  3. 可以看到,React-OT生成的反應網絡與文獻記載的KHP反應節點完全一致,表明其能夠準確捕捉所有關鍵反應,且兩者的平均絕對能量差僅為 3.84 kcal/mol。這一案例研究展示了 React-OT 在加速反應網絡探索中的應用潛力。
  4. ?
  5. ??在反應網絡中的應用
  6. 圖三 | React-OT和OA-ReactDiff模型在生成過渡態的精度和速度方面的性能對比 a. React-OT得到滿足特定RMSD要求的TS結構的可能性高于兩種擴散模型。b. OA-ReactDiff和React-OT生成過渡態的質量。c. 兩種模型預測效果的對比。d. 運行速度的比較。
  7. 在使用Transition 1x訓練React-OT之前,先在RGD1-xTB 數據集上對 React-OT進行了預訓練,預訓練后,React-OT在TS預測精度上實現了顯著提升:生成結構的 RMSD 中位數和勢壘高度誤差降低 25%以上,相比未預訓練模型精度提升顯著。除了精度的提升之外,搜索過渡態所需運行時間也顯著減少。OA-ReactDiff在單張GPU上需6秒完成過渡態搜索,而React-OT的采樣過程消除了隨機性,只要0.4秒就可以得到正確的TS結構。對比OA-ReactDiff,React-OT能適應更復雜的化學反應類型,對未見過反應的預測能力也要更好。
  8. 二、結果一覽
  9. ?
  • 催化劑設計:快速篩選高活性反應路徑,加速清潔能源催化劑開發。
  • 藥物合成:精準預測有機反應能壘,優化合成路線,降低實驗成本。
  • 材料探索:構建超大型反應網絡,發現新型功能材料(如MOFs、鈣鈦礦)。未來已來拓展閱讀:Bohrium Notebookhttps://bohrium.dp.tech/notebooks/47742251216https://bohrium.dp.tech/apps/bohriumweb/job?type=apphttp://reactot-dev.deepprinciple.com
  • ?
  • 深度原理?Deep Principle(DeepPrinciple)官方使用鏈接??:
  • 也可以通過Bohrium App或者深度原理?Deep Principle(DeepPrinciple)官方使用鏈接直接試用模型生成你想要的過渡態:
  • 如果對生成式模型感興趣,想進一步了解React-OT,復制下方鏈接,打開 Notebook:
  • React-OT標志著化學反應TS搜索進入高效、精準的新紀元,有望成為計算化學領域的重要工具。歡迎關注深度原理?Deep Principle團隊,探索更多前沿研究!
  • ?
分享到