八篇文章帶你了解材料結構數據可視化方法


引言

在材料科學中,我們對某一材料的表征(如電鏡圖、元素分布、帶隙等)會衍生出大量的數據。在“大數據”的背景下,如何有效利用這類含有豐富內容的數據集,是基于高通量計算探索材料的主要問題和挑戰。目前,創造數據驅動和自動化框架用于數據的可視化和分析是許多研究人員追求的目標。關鍵的問題是如何構建容易理解和操作的數據低維表達方式。

原子結構數據可視化的概念和主要方法

低維嵌入(Embedding)

一般來說,分子或者材料的幾何構象是高于三維的。然而為了對結構數據進行可視化,研究人員需要對數據進行低維化,即將結構轉化成點,使其能夠在紙面或者屏幕上進行直觀體現。用于蛋白質骨架結構表征的Ramachandran圖就是一個經典的例子,利用這種二維圖基于僅僅兩個扭轉角(torsion angles)就可以對具有66個幾何自由度的多肽分子進行可視化。實現低維嵌入的關鍵是如何定義原子結構中距離尺度。機器學習(machine learning)是目前用來描述預測原子結構的主要方法之一。例如研究人員在晶胞里建立了基于分子動力學構象數據集的SOAP(smooth overlap of atomic positions)-GAP(Gaussian approximation potential)模型1。基于這種模型,研究人員能夠準確描述在寬泛的溫度和壓力范圍內,塊體和缺陷材料的性質。如圖1所示,STM圖像表征了在重構硅表面的二聚體具有傾斜角(tilt angle)。而基于SOAP-GAP預測,并結合密度泛函理論(DFT)發現,這一弛豫結構來源于Jahn-Teller變形,且傾斜角的角度經過模型預測為19度左右。

圖1 SOAP-GAP預測硅表面結構1

描述及比較原子環境

實現材料及分子結構的自動比較和繪圖首先需要描述原子環境(atomic environment)。而所謂的原子環境則是指以特定原子為中心,一定半徑范圍內的原子(化學物種及位置)所構成的。在機器學習中,一個優秀的原子環境描述符(descriptor)應該不隨同一物種原子的轉變、旋轉、重排等不會改變物理性質的操作而一同改變。因為非恒量的描述符通常基于原子的共價鏈接,具有低維屬性,會喪失許多幾何信息。而恒量描述符則可以盡可能地保留原子環境和結構的幾何信息,由此再通過維度還原的低維嵌入以達到繪制低維結構圖譜的目的。例如Deringer等2人基于機器學習研究了非晶硅的原子結構量化可行性。研究人員利用局部穩定性量化描述了原子最近鄰和次近鄰結構,并利用一分析方式分析了不同淬滅速率下取向度不同的非晶硅網絡。此外,這一方法還將非晶硅的配位缺陷和穩定區域聯系在一起,并追蹤液態硅在玻璃化過程中的能量過渡狀態(圖2)。

圖2 基于機器學習模擬非晶硅網絡的熔融-淬滅過程2

典型案例

非晶碳結構繪制

憑借其優異的力學性能,四面體非晶碳在涂層領域擁有廣泛的應用;同時四面體非晶碳也能夠作為理想的電極材料用以檢測生物大分子。然而,盡管應用范圍廣泛,四面體非晶碳表面具有復雜的原子尺度結構和化學反應活性,至今還未被深入理解。劍橋大學的Deringer等3人將機器學習、密度泛函緊束縛(tight binding)(DFTB)以及DFT結合起來用以研究這一長期困擾的問題。研究人員基于第一性原理建立了一系列四面體非晶碳表面的原子論模型,以局部結構指紋作為特征,能夠在不同的系統尺度中提供一系列結構。再利用蒙特卡洛算法和由DFTB得到的相互作用,可以研究四面體非晶碳的逐步氫化過程(圖3);而利用DFT-機器學習則可以研究原子級的氧化機制。這一嘗試為理解非晶材料表面提供了新的可能,還能以空前的準確性來研究表面結構的化學功能化。

圖3 基于機器學習模擬的四面體非晶碳表面的典型結構模型3

液態中的晶體成核

在晶體形成過程中,也可以利用自動繪圖技術來理解結構(例如研究成核過程的結構異質性情況)。一般來說,材料的固化都來源于小晶體的成核。而盡管模型研究不少,但是對面心立方晶核表面是否存在體心立方取向一直具有爭議。這一爭議主要是因為體心立方的物理界限不好判斷,同時常用的局部鍵取向參數也無法區別體心立方和界面原子。而Cheng4等人則開發了新型策略可將宏觀理論和仿真計算有機結合在一起,以研究晶體成核。為了實現這一目的,研究人員基于多簇模型建立用以研究的理想原子論體系。緊接著發展了一種與多簇模型一致的熱力學框架,要求更少的假設,并適用于分子動力學或者蒙特卡洛研究。如圖4所示的主元分析(PCA)圖,是基于在冷卻液體中的固體核內的原子環境的SOAP描述符繪制的。利用經典的面心立方取向參數,根據他們與面心立方的相似度可對環境進行著色。由圖3可知,分別代表面心立方和類液體模塊的數據點揭示了核中心和液體之間存在平滑漸變的過渡狀態,并且不存在明顯的代表體心立方局部取向的額外密度峰;相反,作為參比的體心立方環境則與目標數據點之間存在明顯的分隔現象。這一方法為“成核過程中不存在體心立方取向”提供了頗具說服力的證據

圖4 對周邊存在液體的固體核環境進行著色4

液態水結構

計算物理化學領域的一個中心命題是基于量子力學的基本法則利用第一性原理來預測材料的性質。然而,這類方法的計算成本高,阻礙了在有限的溫度里阻礙對諸如熱容、密度以及化學勢等進行準確預測。針對這一問題,Cheng5等人將先進的自由能方法和數據驅動的機器學習原子間勢能結合起來,用以實現更加嚴謹可靠的預測方式。研究人員基于DFT,并考慮了量子核運動、不和諧波動以及質子失序等因素,實現了對液態水的熱力學性質預測。利用經典分子動力學模擬,研究人員收集了1000個液態水結構;而基于這些數據又進一步提取了經過幾何優化的數據——基于氫核的量子力學本質實現對液態水結構的量子力學化。由圖四可知,經典和量子的水形式分隔成了兩簇;其中經典水構象在能量和摩爾體積兩個方向均有寬泛的分布,揭示了核-量子擾動在調節不同水相熱力學穩定性中扮演的角色。

圖5 1000個經典液態水構象和593個量子力學液態水結構的數據繪圖5

晶體結構

對晶體多晶相的相穩定性進行研究和預測一直是計算材料科學的重要課題。然而這類研究一直極具挑戰。最主要的原因是這類研究首先要求勢能最小化,并執行復雜的自由能計算以對有限溫度的熵效應進行解釋。而Reinhardt6等人則發展了一種框架能夠通過獲取晶體結構來實現相穩定性預測和研究。研究將隨機結構研究(RSS)和機器學習有機結合在一起用以研究固相的自由能,并以此實現對未知相的熱力學相行為研究。研究人員選擇多晶相眾多的二氧化鈦作為研究對象,收集上千個截然不同的原子配位、晶胞形態等結構數據制成數據集,如圖6所示形成了包含4690個局部穩定結構的結構相似度圖譜。在這一圖中,材料的性質如焓或者單元晶胞體積都可以一目了然,再通過映射分析已知相和未知相就可以快速識別研究中出現的相數據。

圖6 由隨機結構研究得到的二氧化鈦主元分析圖6

異質界面結構

結構研究也可以擴展到界面系統中,用以揭示其他途徑難以獲取的穩定構型。由于界面的存在打破了晶體對稱性,對界面結構進行數據分析更加具有挑戰。圖7顯示了鈦酸鍶(STO)和釤摻雜二氧化鈰(110)/(110)界面結構7。PCA圖譜能夠自動識別界面能量,每個點均代表了局部能量最小值的構型,而相對能量則被用作顏色標尺,與橫軸具有強關聯關系。釤摻雜二氧化鈰具有螢石結構的離子導體,而STO則是具有鈣鈦礦結構的絕緣體。從PCA圖中可以識別兩種簇:分別是與塊體相簡單連接形成的理想界面結構相似的結構數據,以及包含重構結構的數據群組。

圖7 鈦酸鍶和釤摻雜二氧化鈰(110)/(110)界面結構的PCA圖7

草酸晶體中的多晶形態

主元分析也可以用于鑒別組分固定體系的多晶中的不同之處。以草酸為例,在圖8中8,左圖是展示了氣相中,草酸在勢能表面的七種穩定構象異構體(conformer)結構,并且根據質子取向以及縱軸將這些結構進行排列。而在右圖中,基于主元分析和隨機結構研究揭示了草酸的48個塊狀晶體結構,初始的隨機結構與相應的弛豫構象利用灰線進行連接,并且隨機和優化的晶體結構處在不同的區域。幾乎所有的優化結構都是分隔清楚的,表明晶體具有許多穩定的最小值,這與氣相截然不同。圖8的左右兩圖強調了分子結構的不同層面,其中左圖基于質子取向顯示了分子內層面;而右圖則揭示了分子間相互作用的不同之處。因此,這兩圖的結合可以為更深入理解分子晶體形成中的結構參數提供了新的模式和機會。

圖8 基于主元分析和機器學習揭示了草酸分子晶體結構8

參考文獻

1. ?Machine learning unifies the modeling of materials and molecules. Sci. Adv., 2017, 3, 12, e1701816.

2. Quantifying Chemical Structure and Machine‐Learned Atomic Energies in Amorphous and Liquid Silicon. Angew. Chem. Int. Ed., 2019, 58, 7057-7061.

3. Computational Surface Chemistry of Tetrahedral Amorphous Carbon by Combining Machine Learning and Density Functional Theory. Chem. Mater., 2018, 30, 21, 7438-7445.

4. Bridging the gap between atomistic andmacroscopic models of homogeneous nucleation. J. Chem. Phys. 2017,146, 034106.

5. Abinitio thermodynamics of liquid and solid water. Proc. Natl. Acad. Sci.U. S. A.?2019, 116, 1110?1115.

6. Predicting the phase diagram of titanium dioxide with random search and pattern recognition. Phys. Chem. Chem. Phys., 2020,22, 12697-12705.

7. Determining interface structures in vertically aligned nanocomposite films. APL Materials 2019, 7, 061105.

8. Mapping Materials and Molecules. Acc. Chem. Res. DOI: 10.1021/acs.accounts.0c00403.

本文由nanoCJ供稿。

本內容為作者獨立觀點,不代表材料人網立場。

未經允許不得轉載,授權事宜請聯系kefu@cailiaoren.com。

歡迎大家到材料人宣傳科技成果并對文獻進行深入解讀,投稿郵箱: tougao@cailiaoren.com.

投稿以及內容合作可加編輯微信:cailiaorenVIP。

分享到