小數據設計新材料的“洪荒之力”
材料牛注:《中庸》有言:“至誠之道,可以前知”,數據雖小,心向往之。殊不知小小的數據中,通過機器的學習,能夠在浩大的材料家族里幫我們找到接近目標的理想潛在材料。
一直以來,尋找新型功能材料已是一個難題,然而在已知一個小的材料體系家族中尋找具有特殊性能的材料更是難上加難。
但是,西北大學工程系和Los Alamos國家實驗室聯合團隊找到了解決方案。該團隊發現了一個新穎的設計流程方法,該方法通過將機器學習和密度泛函理論計算相結合,為新材料的設計創造出指南,并指出材料所具有的一些實用電性能,如鐵電性能和壓電性能。使得通過學習小數據找到理想材料成為一個新穎的數據科學方法。
目前,很少有層狀材料在特定的幾何結構中具有這些性質,而這些性質對于找到開發電子、通信和能源問題的解決方案至關重要——這也意味著在傳統研究方法中能夠制定探究指南的數據十分有限。
McCormick工程學院材料科學與工程系副教授James M. Rondinelli解釋道:“其他人在尋找新材料時,通常都是在具有相似性能材料的大量數據中進行查找,這樣的工作一般都舉步維艱,但我們知道如何從眾多的數據庫中提取信息。只是當你缺乏大量信息時,從數據中學習就成為了一個很大的難題。”
2017年2月17日在期刊Nature Communications中,發表了題為“Learning from data to design functional materials without inversion symmetry”的論文介紹了該研究成果。新墨西哥州Los Alamos國家實驗室的Prasanna Balachandran是本文的共同作者。另外,Rondinelli實驗室的前研究生Joshua Young和Los Alamos的高級研究員Turab Lookman均有所貢獻。
在國家科學基金會和Los Alamos國家實驗室開展的研究項目的支持下,Rondinelli的課題組專注于研究一類二維復合氧化物或Ruddlesden-Popper結構氧化物(一種四方鈣鈦礦的共生型結構),這些材料展現出很多性能和工藝技術——例如壓電性能和鐵電性能,同時可以與當今現代電子設備中的傳統半導體材料相連。
Rondinelli說:“在這個材料體系大家族中,數據庫是很渺小的。目前,只有大約10-15種材料由于其期望性能而被我們熟知,我們能夠處理的數據很有限。傳統上,數據科學主要用于解決對領域知識要求較低的大數據問題。”
另外,Rondinelli補充道:“盡管這個問題的本質數據很小,但是我們的方法十分有效,其原因在于我們能夠將自己對于這些材料的理解(領域知識)與相關數據聯系起來,為機器學習提供信息。”
因此,課題組開始建立一個已知材料的數據庫,并使用計算機科學的子領域即機器學習,培養機器從數據中學習,并能夠通過該學習做出更好預測的能力。“隨著機器學習程度的不斷加強,我們能夠識別出人們希望開發材料的化學成分。”他介紹道。
在所調查的3000種以上材料中,數據科學方法發現了超過200種可能的理想材料。接下來,團隊應用了幾種類型的嚴格量子力學計算進行分析,評估了潛在材料的原子結構并檢測其穩定性。
Rondinelli說:“我們想知道,材料是否具有所預測的結構?它有電子極化嗎?它在實驗室中能被合成嗎?”
這項工作將可能的材料縮小到了19種,剩下的這些材料需要直接的實驗分析。但是在200種之中仍然有更多的可能性。
通常,在開發新材料時,可能性的數目太大以至于我們無法一一探索和研究,又因篩選潛在材料的過程需要很大的花銷,所以科學家們必須在他們的研究過程中慎重選擇。
Balachandran說:“我們的工作有幫助研發者節約大量時間和資源的潛力。在研究過程中,我們只需要去嘗試那些最有潛力的材料,而不需要探究所有可能的材料。”
原文鏈接:Designing new materials from 'small' data Unique workflow to design new materials
文獻鏈接:Learning from data to design functional materials without inversion symmetry
本文由編輯部提供月亮素材,李雅倩編譯,丁菲菲審核,點我加入材料人編輯部。
材料測試,數據分析,上測試谷。
文章評論(0)