學術干貨丨揭開材料基因組面紗——高通量計算平臺簡介
一、引言
新材料從設計到商用化有18年的平均開發周期,繼美國材料基因組計劃后,我國也于2016年開始了材料基因組重大科研專項,旨在通過高通量材料計算和材料數據共享平臺促進新材料的研發。在國內外有諸多典型案例,如Materials Project、AFLPWlib、OQMD與Citrine等。此文以Materials Project為例簡闡高通量材料計算框架和其在具體材料開發中應用,該工程的基于WEB分享材料數據的主頁是了解Materials Project的第一站。
圖一 The Materials Project的主頁
二、Materials Project高通量計算平臺簡介:
Materials Project項目已收錄約65000種ICSD中存在的材料的第一性原理計算數據,這樣大規模材料數據集對材料的開發有著顯著的作用。而它的建立依賴高性能計算集群和運行其上的用于高通量計算任務的一系列具有特定功能的程序。其中,下圖概括了Materials Project的工作流程。
圖二Materials Project的工作流程
Python Materials Genomics (pymatgen)是進行高通量材料計算的強大程序包之一。它規范了運行高通量計算前所需的初始化設置,并提供針對計算所產生的數據的流程化分析。我們可以通過下圖來對其提供服務有一個直觀了解。需要注意的是,Pymatgen也提供了基于Hypertext Transfer Protocol (HTTP)協議獲取MaterialsProject數據庫中材料數據的接口。
圖三? Pymatgen的工作原理圖
FireWorks(FWS)的功能是對高性能計算集群上運行的高通量計算工作流進行作業管理。該軟件是采用python編寫,同時與MongoDB實現數據交換,他們共同滿足JavaScript Object Notation (JSON)數據交換格式。用戶可以通過定制launchPad和FireWorkers來滿足特定計算任務的作業管理需求。FWS的程序架構的簡易圖示如下。
圖四 FWS的程序架構的簡易圖示
同時我們可以通過定義fws文件來使得作業按照設想在計算集群上批量運行。
圖五 FWS的文件語法
圖六 FireWorks任務架構
同時,FWS借助Appache也實現了對運行在超算上的計算作業的實時監控。
圖七 計算任務監視界面
最后,Custodian對計算任務運行過程中可能出現的錯誤進行合理校正。以上這些功能保證了FWS在高性能計算集群上超長時間穩定運行大量材料的第一性原理計算和數據分析。
三、Materials Project 對功能材料開發的影響
運行在Materials Project上的高通量計算已促進了多種新型材料的設計研發。例如,Prof. Ceder等人通過高通量篩選LiA 0.5 B 0.5 O 2化合物結構空間,成功預測LiCo 0.5 Zr 0.5 O 2這一高能量密度鋰電材料,并已被實驗所證明。
圖八 高通量篩選
圖九? LiCo 0.5 Zr 0.5 O 2 的實驗驗證(參考文獻配圖)
高通量第一性原理計算所產生的材料性質數據,同時也是用于機器學習的很好的學習樣本,通過定義恰當的材料問題,可以通過數據挖掘算法形成描述器,并用于未知材料數據集或材料性質的預測。Stefano Curtarolo, Gerbrand Ceder, Kristin A. Persson 及Mark Asta 等人通過對已知的約1000種無機化合物來自高通量計算的材料數據,通過機器學習的方法產生了描述器,并將其用于材料力學性質預測,與材料實驗數據獲得了很好的匹配。材料數據由Materials Project的高通量第一性原理計算平臺所產生,以下給該工作FireWorks的工作流程圖。
圖十 該任務的FireWorks的工作流程圖
對于機器學習所產生的材料預測數據, Prof. Asta 等人也將對它們進行了可視化處理,使得數據擁有了很好的可讀性。
圖十一 材料數據可視化
與材料實驗數據的對比, 驗證材料預測數據的準確性,如圖所示。
圖十二 預測數據與實驗數據對比
三、小結:
諸如Materials Project, AFLOWlib之類的高通量計算材料開發平臺, 有效的縮短了新材料的開發周期, 顯著降低新材料開發成本。 高性能計算集群的開始發展, 以及數據挖掘在海量材料數據中的成功應用使得材料基因組計劃展現出巨大的潛在經濟價值。
四、主要參考文獻:
?[1]Eagar,T.; King, M. Technology Review (00401692) 1995, 98, 42.
[2]Anubhav Jain, Kristin A. Persson, and Gerbrand Ceder, Research Update: The materials genome initiative: Data sharing and the impact of collaborative ab initio databases, APL MATERIALS 4, 053102 (2016) .
?[3]S.P. Ong, W.D. Richards, A. Jain, G. Hautier, M. Kocher, S. Cholia, et al. ,????? Comput. Mater. Sci. 68 (2013) 314–319.
[4]Jain, S.P. Ong, D. Gunter, W. Chen, B. Medasani, X. Qu, et al., Fireworks: a
dynamic workflow system designed for high-throughput applications,
Concurr. Comput. Pract. Exp. (2014) .
[5]A Urban, I Matts, A Abdellahi, G Ceder, Computational Design and Preparation of Cation‐Disordered Oxides for High‐Energy‐Density Li‐Ion Batteries, Adv. Energy Mater. 2016, 1600488.
[6]Maarten de Jong , Wei Chen,? Thomas Angsten , Anubhav Jain, Randy Notestine, Anthony Gamst, Marcel Sluiter, Chaitanya Krishna Ande, Sybrand van der Zwaag,Jose J. Plata, Cormac Toher, Stefano Curtarolo, Gerbrand Ceder, Kristin A. Persson &Mark Asta,Charting the complete elastic properties of inorganic crystalline compounds,SCIENTIFIC DATA, 2:150009.
本文由材料人編輯部學術干貨組pengyuman供稿,材料牛編輯整理。
材料人網向各大團隊誠心約稿,課題組最新成果、方向總結、團隊訪談、實驗技能等皆可投稿,優秀稿件一經錄用,我們會奉上稿酬,請聯系:郵箱tougao@cailiaoren.com 或 QQ:97482208。
材料人現已邀請材料計算各方向人才入駐網站,對外提供材料計算服務。如有需求,歡迎進入測試谷網聯系服務商,或直接聯系材料計算客服QQ:825116915。
文章評論(0)