北京工業大學:自建數據庫&數據驅動新材料設計研發


引言

在多年來構建、發展稀土單質和Sm-Co基合金體系數據庫的基礎上,近日,北京工業大學宋曉艷教授團隊在數據驅動新材料設計方面取得了新的突破,研究工作以“Selecting Doping Elements by Data Mining for Advanced Magnets”為題發表于Chemistry of Materials上。論文第一作者為博士生劉東。該工作基于構建的Sm-Co基多元合金數據庫及飽和磁化強度數據集,結合數據挖掘與機器學習,篩選飽和磁化強度友好型摻雜元素,顯著促進了高性能新材料的研發進程。這種在大范圍內快速、準確地篩選添加元素的方式,可推廣應用到多種可調制性能的多元材料的成分設計中。

 

數據庫建設背景

該研究團隊在2006-2013年期間構建了稀土單質與Sm-Co化合物數據庫,發展成為我國材料科學數據共享網中的稀土基礎數據資源節點。以此為研究背景,近年來團隊以高溫永磁合金代表體系Sm-Co基多元合金為例,建成了面向數據驅動材料設計的專用數據庫,數據實現了高度結構化,可滿足基于深層次信息的數據檢索、數據結構轉換、材料設計專用數據集抽取等需求。本論文所報道的研究即是基于該專用數據庫開展的材料設計目標之一。

?數據驅動材料設計

本文添加元素篩選的方法是在對數據庫中飽和磁化強度相關數據進行挖掘時提出的。在開發磁性材料時,以往常憑經驗避開那些對飽和磁化強度不利的元素。在這項工作中,從構建的專用數據庫中抽取產生Sm-Co基合金飽和磁化強度數據集,以此開展數據驅動的材料設計開發。

通過成組數據識別,發現了分組線性回歸參數是用于分析飽和磁化強度多種影響因素的重要特征,進而提出了評價摻雜元素對合金飽和磁化強度影響的指標(文中記為SR),將研究目標從對飽和磁化強度的預測聚焦到對摻雜元素的篩選上。通過機器學習在已知摻雜元素的SR與摻雜元素典型特征之間建立了關聯,實現了在元素周期表大范圍內評估摻雜元素對Sm-Co基合金飽和磁化強度的影響。

(圖1. 預測的各摻雜元素對Sm-Co基合金飽和磁化強度的影響,及其與元素已知特征的關系)

根據上述發現的規律可全面、準確地篩選摻雜元素,進而高效指導成分設計和實驗制備。利用優選的元素開展實驗,對Sm-Co基合金進行摻雜,實際結果表明優選的元素均能保持與對應的Sm-Co二元合金同等的高飽和磁化強度,且與預測結果符合很好,表明這些摻雜元素具有非常重要的利用價值和開發潛力。進而,結合工藝設計和微觀組織優化,開發獲得了一批具有優越綜合磁性能的新型Sm-Co基永磁合金。

(圖2. 以優選的摻雜元素進行成分設計和實驗制備,驗證了預測結果,并將綜合磁性能提高至先進水平)

方法適用性

添加元素的選擇是材料成分設計過程中非常重要的環節。然而,被選元素的應用場景復雜多變,常常難以找到有效的理論進行指導。論文建立的這種方法可以推廣到多種摻雜改性中的元素優選問題。在這些問題中,往往已報道的文獻中有大量探索性的實驗或理論計算數據,但受限于實驗周期或實驗條件,很難遍歷所有元素。通過數據變換或可視化技術等對建立的數據集進行探索性分析,找到受元素種類主導的參量,以之作為定量(對應回歸算法)或定性(對應分類算法)的判據對已有的數據進行評價。利用機器學習找到該參量和元素的已知屬性之間的關系,可將該參量合理推廣到所有可利用的元素上,從而達到從更大范圍篩選元素的目標。進一步,利用特征篩選或變量重要性分析等對模型進行深入解讀,可以獲得具有解釋性的知識或規律。

(圖3. 針對摻雜改性的材料設計問題提出的數據驅動策略示意圖)

專用數據庫應用展望

該論文是從面向數據驅動材料設計的專用數據庫出發,構建數據集、處理數據并結合機器學習等技術來加速材料設計的一個示例。隨著數據數量增加和質量提升,專用數據庫中可挖掘的研究主題會越來越多,面向更多主題的數據驅動高性能新材料的設計和開發會不斷推進和擴展。

本研究方向得到了國家重點研發計劃項目“材料基因工程專用數據庫和材料大數據技術”和課題“多尺度高通量材料計算工具集成與統一接口開發”及國家杰出青年科學基金項目的資助。

詳情點擊查看全文:

https://pubs.acs.org/doi/10.1021/acs.chemmater.9b03379

歡迎大家到材料人宣傳科技成果并對文獻進行深入解讀,投稿郵箱:tougao@cailiaoren.com.

投稿以及內容合作可加編輯微信:cailiaorenvip

分享到