JAMIP:面向計算材料信息學的人工智能輔助、數據驅動的材料設計方法與軟件|吉林大學Science?Bulletin


材料信息學(Materials informatics)或材料基因工程作為新興的材料研究與設計范式,通過深度結合材料大數據與人工智能機器學習算法,正在加速材料研究領域中新材料、新功能和新規律的創新發現。如何高效產生、收集、管理、學習和挖掘大規模材料數據是開展材料信息學或材料基因工程研究的關鍵。吉林大學張立軍課題組為滿足材料基因工程與材料信息學的研究需求,開發了人工智能輔助、數據驅動的材料設計方法與軟件(JAMIP,全稱為Jilin Artificial-intelligence aided Materials-design Integrated Package),涵蓋半導體材料、介電材料、金屬材料等材料體系,為基于功能材料大數據與人工智能機器學習算法結合的新材料發現和設計提供方法與軟件支撐。軟件包在基于發展的大規模高通量材料計算框架的材料設計方法基礎上,深度結合了數據管理、分析及存儲技術與機器學習數據挖掘算法,解決了系列材料信息學研究面臨的關鍵技術難題。軟件主體框架包含:

(1)以高通量材料計算為核心的數據產生。JAMIP具有強大的材料制造工坊,包含便于開展高通量材料計算的結構原型數據庫,結構操作方法集(可快速構建缺陷、表面、晶界、異質結等復雜材料結構)。同時集成了高通量第一性原理計算引擎(支持VASP、Quantum?Espresso等計算軟件),可針對批量生成的材料結構進行高度自動化的計算模擬。此外,軟件具有自動化任務遞交、監控、糾錯功能,內置了多種不同類型的材料性質計算流程模塊。

(2)數據收集、管理工具及數據存儲。針對材料信息學的材料大數據特點,JAMIP集成了以Django框架為基礎的數據庫平臺接口,支持MySQL、Sqlite3、postgresql等多種主流關系型數據,實現了對高通量第一性原理計算結果的自動化數據提取、存儲和分析。

(3)機器學習/數據挖掘。JAMIP集成了數據預處理、數據特征工程,以及常用機器學習算法的模型構建和性能評估子模塊,可以為探索材料性質與結構之間的內在關系、不同物理性質之間的關聯、主導材料高性能化的物理規律提供研究工具。

軟件各功能模塊之間實現了高度融合,能夠高效產生、分析、管理和學習計算材料大數據,為開展材料信息學或材料基因工程研究、實現新材料設計,提供專業化方法與軟件。

吉林大學趙信剛、周琨、邢邦昱、趙若廷為共同第一作者,張立軍教授和付鈺豪副教授為共同通訊作者,該文以“JAMIP: an artificial-intelligence aided data-driven infrastructure for computational materials informatics”為題發表于Science?Bulletin2021年第19期。

圖文摘要

Fig. 1??Overview of the JAMIP code framework. The grogram comprises three major parts based on the material data’s lifecycle: Data generation (blue), Data collection (yellow), and Data learning (green).

Fig. 2 The overall perspective of the material database.

Fig. 3??Detailed workflow of the HT calculations.

Fig. 4??Detailed workflow in the machine learning.

Xin-Gang Zhao, Kun Zhou, Bangyu Xing, Ruoting Zhao, Shulin Luo, Tianshu Li, Yuanhui Sun, Guangren Na, Jiahao Xie, Xiaoyu Yang, Xinjiang Wang, Xiaoyu Wang, Xin He, Jian Lv, Yuhao Fu, Lijun Zhang. JAMIP: an artificial-intelligence aided data-driven infrastructure for computational materials informatics. Science Bulletin, 2021, 66(19):1973-1985

https://www.sciencedirect.com/science/article/pii/S2095927321004163

本文由Science?Bulletin期刊投稿。

分享到