東南大學王金蘭教授Nature子刊:機器學習加速設計高效穩定無鉛有機-無機雜化鈣鈦礦


【引言】

功能材料的開發是工業創新的基石,而且開發具有靶向性的材料一直是科學研究的熱點。基于密度泛函理論(DFT)的高通量計算等技術的出現在一定程度上加速了材料的搜尋過程。近年來,各種材料的結構越來越復雜,難以使用傳統的方法從成千上萬種候選材料中高效篩選出具有價值的體系,但是,諸如人工智能等新興技術可以較好地解決這一問題。最近,機器學習(ML)技術已經在材料設計等方面凸顯其強大的功能,其不僅可以快速準確地實現材料設計,也可以從巨大的材料數據庫中挖掘出材料的構效關系。
鈣鈦礦是一種用途廣泛的功能材料,雖然ML技術為設計無機鈣鈦礦材料提供了思路,但其在有機-無機雜化鈣鈦礦(HOIPs)領域的應用還鮮有報道。HOIPs是一種極具前景的光電材料,其最顯著的優點包括高功率轉換效率(PCE)、易合成以及可調的帶隙等。但存在兩個關鍵的不足限制了HOIPs的商業應用,其中之一便是毒性(這也是一個嚴重的問題),主要是材料中含有鉛(Pb)元素,其次是環境穩定性較差。因此,設計具有高PCE且在空氣中持續穩定的無鉛化HOIPs至關重要。

【成果簡介】

東南大學王金蘭教授(通訊作者)等人基于ML技術和DFT計算開發了一種靶向驅動法用于發現穩定的無鉛HOIPs。研究人員從212個已報道的HOIPs帶隙值中訓練ML模型,然后成功地從5158種未開發的潛在HOIPs中篩選出六種具有適當太陽能帶隙和室溫熱穩定性的正交無鉛HOIPs,其中兩種在可見區域具有直接帶隙和優異的環境穩定性。之后,通過ML數據挖掘出了一種HOIPs帶隙的緊密性結構-性質關系,發現影響理想HOIPs太陽能電池性能的因素包括容忍因子、八面體因子、金屬電負性以及有機分子的極化率。最后,該方法能夠快速實現高精度篩選,可廣泛應用于功能材料設計。該成果以題為“Accelerated discovery of stable lead-free hybrid organic-inorganic perovskites via machine learning”發表于著名期刊Nature Communications

【圖文導讀】

圖一 無鉛HOIPs的設計框架


結合ML和DFT的材料設計框架用于高效搜尋具有適當帶隙的穩定無鉛化HOIPs,藍框代表由已報道過的HOIP數據訓練ML模型的材料篩選過程,之后,利用DFT進一步計算這些候選材料的電子性質并評估其穩定性,如綠框所示

圖二 用于訓練和測試HOIPs的輸入數據


(a)212種高通量HOIPs結構,將11種有機小分子(A位點)與32種二價金屬離子(B位點)結合組成ML模型的輸入數據集,X是典型的鹵化物
(b)HOIPs的容忍因子和帶隙關系在訓練(藍點)和測試(紅點)中的數據可視化,整個數據集包括金屬、半導體和絕緣體

圖三 所選特征的重要性和相關性


(a)使用GBR算法對14種選定的特征進行排序
(b)HOIPs所選特征中的皮爾遜相關系數矩陣熱度圖

圖四 ML模型的結構與見解


(a)測試帶隙和預測帶隙的擬合結果,計算決定系數(R2)、皮爾遜系數(r)和均方差(MSE)以評估預測的誤差,子圖是對數據進行5次交叉驗證分割時模型精度的收斂性
(b)對來自訓練ML模型的預測數據集帶隙的容忍因子散點圖(藍色、紅色和深灰色點分別代表訓練、測試和預測集)
所有潛在HOIPs的(c)容忍因子、(d)八面體因素、(e)A-位點離子的離子極化率和(f)B位點離子的電負性與預測帶隙關系的數據可視化,虛線框表示每個特征的適當范圍

圖五 與DFT計算的對比


(a)六種篩選驗證的HOIPs在ML預測和DFT計算結果之間的比較
DFT計算的(b)優化結構、(c)能帶結構、(d)電子投影態密度以及(e)在300 K下,對C2H5OSnBr3和C2H6NSnBr3進行5 ps的AIMD模擬的總能量,(d)中的子圖是靠近費米能級的投影態密度

【小結】

不同于那些需要在DFT水平上搜尋整個化學空間的高通量篩選方法,目前的ML和DFT組合方案只需在DFT水平上計算最具前景的HOIPs,這樣可以極大地節省計算資源。注意,上面提到的篩選非常嚴格,事實上,其篩選條件可以根據目標進行調整以找到適合實驗合成的候選材料。本文提出的靶向驅動法克服了傳統試錯法的主要障礙,同時,由于這種ML技術采用一種基于GBR算法的“末位淘汰”特征選擇程序,因此其不僅可以瞬間達到DFT精度(甚至快于神經網絡算法),而且適用于小數據集。這也就意味著可以使用相對較小的數據集來實現準確的預測。如果計算或實驗的材料數據足以訓練ML模型,該方法也適用于其他功能材料的設計與發現。

文獻連接:Accelerated discovery of stable lead-free hybrid organic-inorganic perovskites via machine learning(Nature Communications, 2018, DOI: 10.1038/s41467-018-05761-w)

【作者簡介】

王金蘭教授現任職于東南大學物理學院,博士生導師,國家杰出青年基金獲得者(2015)、江蘇省“333高層次人才支持計劃”第二層次獲得者(2016)、國務院特殊津貼獲得者(2018)。長期從事低維材料結構與物理化學性質的理論研究工作,主持多項國家自然科學基金與國家重點研發計劃。發表SCI論文180余篇,影響因子10以上論文30余篇,其中Science 1篇,Nat. Commun. 7篇,J. Am. Chem. Soc. 5 篇,Angew. Chem. Int. Ed. 5 篇(封面熱點文章1篇),Nano Lett/ACS Nano/Adv. Mater. 13篇,受邀撰寫英文綜述3篇。引用超過6400次,H-index 42,連續四年入選“Elsevier中國高被引學者名單(2014-2017)”。

課題組主頁:http://hpc.seu.edu.cn/jlwang/index.html.

本文由材料人編輯部計算材料組杜成江編譯供稿,材料牛整理編輯。

歡迎大家到材料人宣傳科技成果并對文獻進行深入解讀,投稿郵箱tougao@cailiaoren.com.

投稿以及內容合作可加編輯微信:cailiaokefu.

分享到