斯坦福大學PRL:使用代理機器學習模型開發用于NEB計算的低標度算法


【引言】

NEB算法是用于計算化學體系中過渡態最為常用的方法。這種算法一般通過尋找反應物和產物轉化的最小能量路徑,來識別與兩能態之間的勢壘有關的能量。NEB算法及其很多變體都依賴于含有原子結構的內插圖像的彈性帶,這些圖像又被稱為移動圖像。這些圖像可以用彈性常數來固定,其位置則通過勢能曲面的梯度進行優化,同時也受彈簧所施加的力作用。爬坡圖像也可以被完整地包括進來,以確保涵蓋帶中最高能量點。路徑優化是通過一個每一步迭代都對所有圖像進行移動并求值的迭代過程實現的。這種耦合迭代過程成本極高,即使是僅包含單個粒子擴散的10個圖像的體系,都需要幾百個函數調用受力。此外,第一性原理電子結構計算中,力的求值要花費昂貴的計算資源。因此,開發原子體系的機器學習代理模型迫在眉睫。

【成果簡介】

近日,美國斯坦福大學Thomas Bligaard研究員(通訊作者)團隊在Physical Review Letters上發表了題為“Low-Scaling Algorithm for Nudged Elastic Band Calculations Using a Surrogate Machine Learning Model”的文章。文章表明,在傳統的微動彈性帶(NEB)計算中整合入代理高斯過程回歸的原子模型,可以有效增加收斂速度。在文中所用的代理模型方法中,彈性帶收斂的時間不與路徑中移動圖像的數量成比例,可以大大提高過渡態搜索的效率和魯棒性。和傳統的NEB計算相比,該算法不對圖像數量進行任何操控,而是通過構造一個具有高斯過程回歸的概率本質的收斂標準,對所有圖像結合目標模型勢能中鞍點力的不確定性估算來達到收斂。這種方法從函數求值的角度來說,要比傳統的NEB方法快一個數量級,且沒有損失收斂能壘的準確性。

【圖文導讀】

圖1:經典爬坡微彈性帶算法和機器學習微彈性帶法的比較。

(a)經典爬坡微彈性帶(CI-NEB)算法性能的二維Müller-Browns勢能面表示;

(b)機器學習微彈性帶(ML-NEB)法性能的二維Müller-Browns勢能面表示。

預測的最小能量路徑位于每個勢能面的底部,來表示彈性帶有關函數調用數量的能量分布演化。

圖2:用有效介質理論證明ML-NEB算法在三種不同的原子體系中的性能表現。

(a)Au原子在Al(111)表面擴散的最小能量路徑;

(b)Pt吸附原子在臺階式Pt表面跨越兩層臺階擴散的最小能量路徑;

(c)吸附在Pt(111)表面的Pt島狀七聚物發生重排的最小能量路徑。

最小能量路徑的計算分別由FIRE,LBFGS,MDMin和ML-NEB算法獲得。每種算法收斂所需的的函數調用的數量如方括號內的加粗字體所示。

圖3:在此前的體系中改變NEB圖像的數量來測試ML-NEB算法的性能。

不同的傳統算法和機器學習加速算法在圖像數量增加時達到收斂所需要的函數求值的數量比較。下方折線圖表示相對于ML-NEB算法預測結果中相同位置處的函數目標值,三個采集函數得到的沿路徑預測能量的平均誤差。

【小結】

在這篇工作中,作者提出了三種不同的采集函數用于優化決策,以實現調用最少的函數來獲得準確的預測路徑。作者展示了學習速率被采集函數的形式所驅動,好的選擇取決于外推(減少預測路徑的不確定性)和開發(嘗試收斂鞍點)的平衡。該工作將函數求值數量的成本從NEB移動圖像數量中剝離,所得的算法不僅比現有算法都能夠節省函數調用,而且相對于其他算法提高了在準確路徑收斂的魯棒性。

文獻鏈接:Low-Scaling Algorithm for Nudged Elastic Band Calculations Using a Surrogate Machine Learning Model(Phys. Rev. Lett.,2019,DOI: 10.1103/PhysRevLett.122.156001)

本文由Isobel撰寫。

分享到