麻省理工學院(MIT)Joule綜述(Perspective):通過自動化、機器學習和高性能計算加速材料研發


【引言】

成功的材料創新可以改變社會。然而,材料研究通常會涉及很長的時間序列并且成功的概率較低,這樣就使那些希望研發出的材料可以短時間從實驗室應用于商業領域的投資者望而卻步。一系列新興技術的組合可以使材料研發的步伐加快十倍甚至更多,這樣可使相關利益者(投資者和研究人員)、市場和環境在時間序列上保持一致,同時也可提高投資回報。

近日,麻省理工學院(MIT)Tonio Buonassisi教授(通訊作者)等人Joule上發表題為“Accelerating Materials Development via Automation, Machine Learning, and High-Performance Computing”的綜述文章。文中系統的闡述了人工成本-時間成本-計算開發等方面的相互制約以及解決方案,加快材料開發周期所必須進行的關鍵步驟——計算輔助。新興技術的組合可以加快材料體系的相互融合,縮短投資者的回本周期,加快材料在各個領域中的應用。

1、簡介
由于各個領域所消耗時間的不匹配性,使得新材料的發展長期受阻。材料的發展通常需要15-25年,有時甚至需要合成并表征數百萬樣品。然而,企業和政府的資助者都希望能在他們領導的時間內獲得一些實際的結果,通常是2-5年。而博士后和學生在實驗室停留的時間通常也是2-5年,當一個項目長于一個人所停留的時間時,那么一個人的積極性與知識產權之間就不會產生這種無縫連接。考慮到市場競爭和環境等因素,新材料發展的市場驅動力往往需要在更短的時間內獲得問題的解決方案。從歷史角度來看,當投資額度基本相同時,時間的不匹配性導致研究能源材料(清潔技術)所獲得的投資回報率遠低于醫療、軟件等領域。為了彌補時間跨度上的不匹配性,增加材料研發的成功率,無論是公共部門還是私營部門的成員們都在努力開發材料發展的新范式。美國材料基因組計劃重點關注于以下三個“缺失環節”:計算工具將實驗工作集中于最有希望的研究方向、匯總學習與識別研究趨勢的數據庫以及高通量實驗工具。

圖1 材料發現與開發的時間軸

當前,一種可用于實驗性的材料研究的新范式正在興起,這有望使發現新材料變得更快。以機器學習來引導快速、自動化的反饋循環,并強調通過最終產物和產業轉移來創造價值。現在有一個獨特的機會在測試平臺上開發這些功能,而且在研究生產力和先發優勢方面已有相當大的改善。

圖2 加快材料發現的示意圖

2、理論
目前,理論預測的速率已遠遠超過實驗上的合成、表征及驗證的速率。這種現象可由三個趨勢實現:更快的計算、更高效和準確的理論方法與模擬工具以及快速篩選大型數據庫的能力,如MaterialsProject.org。為了更好地集中有限實驗的帶寬,科研人員越來越關注模擬怎樣合成,而不僅僅只是合成什么——在計算機模型中獲取環境因素(如濕度)、反應能壘和動力學限制(即所謂的“非平衡”合成)的復雜性。同時,理論科學家試圖合理地設計出具有多種綜合性能的材料。

3、高通量材料、器件和合成體系
從歷史上看,緩慢的真空沉積法抑制了材料發展。現代真空設備(包括組合方法和大規模、快速連續沉積/反應)極大地提高了材料和器件的合成速率。當前各種各樣的沉積方法(如閉空間升華法)為材料制備提供了更快的生長速率、點缺陷的可控性、更精確的化學計量比以及雜質可控性等。隨著高質量的前驅體和材料的出現,溶液法也變得更普遍了,包括CdS量子點、高聚物太陽能電池、鹵化鉛鈣鈦礦等。前驅體(從分子到納米粒子)、可控合成(包括溶劑工程)和薄膜合成方法(實驗室的旋涂技術到工業上的大規模印刷)等的日益多樣化,使其成為一個強大且靈活的平臺以沉積一系列新材料。3D打印材料的出現提供了另一種普遍的用于制備材料的替代方案。

4、缺陷容限與工程
通常來講,研究人員主要對“理想”材料體系進行理論預測。然而,真實樣品包含缺陷(如雜質、結構缺陷),而缺陷會破壞(偶爾也會有利于)材料主體或界面的性質。為了減輕高通量材料篩選過程中由缺陷導致的漏報風險,希望識別出一系列由缺陷影響較小的材料,以及快速診斷并消除缺陷對材料性能的影響,例如偶然發現鹵化鉛鈣鈦礦可應用于光電領域。除了可用于高通量液相沉積法以外,鹵化鉛鈣鈦礦還需要較少的研究工作才能實現與傳統無機薄膜類似的性能改進。確定缺陷容限性的基本物理學原理并且開發其設計準則可以形成新材料的篩選標準,尤其是新的計算工具,如在異常檢測中最先進的通用對抗網絡。

圖3 基于光伏應用的快速材料開發的研究實例

5、高通量診斷
表征工具也得益于高性能計算、自動化和機器學習,例如,高分辨X射線光電子能譜測試所花費的時間較之前得到極大改善。當前,先進的數據統計和機器學習有望進一步加快學習的速率,現存的一些設備可以獲取一種樣品的多個XPS圖譜,而且可以進行大數據集的自動射頻分析,可以估計一些在成分圖上未知的材料。其他一些科研人員采用貝葉斯推斷結合無損檢測裝置可以同時診斷出多種塊體和界面性質,其可達到的診斷速率快于傳統表征設備的10倍甚至更多。這種參數估計不僅可以快速地進行故障排除,而且還可以準確地估計材料的固有屬性以及最終可能達到的性能。

6、機器學習
機器學習包含很多方法,可能在未來的材料開發周期中扮演不同的角色。第一,機器學習的一個常見應用是選擇材料,其中實驗觀察可以用來預測未知化合物及新發現的材料的新性質;第二,機器學習工具可以從診斷中提取更多更準確的信息;第三,機器學習工具可以通過減少人為干預和依賴于啟發式的程度來關閉診斷與合成之間的自動循環,如圖2所示;而這三個應用均得益于更多數據的可用性,以訓練和提高這些設備的預測能力。

7、構想“硬件云”
現在,材料合成設備正越來越具有遠程操作性——能夠使科研人員不用靠近沉積設備即可進行研究和操作,這樣帶來了兩種影響深遠的機遇。大型昂貴的合成設備可以與大規模并行表征設備組成未來實驗室的合成中心,該中心由遠程用戶和研究人員操作并由現場專業人員管理。類似于軟件云的概念,一個人的計算和數據以無縫形式儲存于世界各地的機器上,硬件云將使用戶以無縫的形式在國內或國際上分布的網絡材料操作系統上進行存儲、測量及開展研究(通過原位表征工具提供實時反饋)。所產生的第二個機遇即能夠在公共或私有云的這些網絡實驗所收集的數據中進行存儲、管理、訪問、處理和診斷。這將產生兩個問題:(1)通過大量實驗和實驗平臺來提高數據的實用性,以用于后期分析;(2)用于分析哪些什么都不起作用的數據,這并不容易獲得但對學習過程是有幫助的,并且在研究過程中提高集體效率方面都有著自己的價值。

8、加快材料開發與制造的基礎設施投資
圖2中所展示的愿景需要數年來持續的開發軟件,硬件和人力資源,并以測試平臺的方式連接這些新功能。這些主要涉及到以下投資:應用型機器學習,數據格式和存儲標準,數據管理工具,基礎設施等領域。

9 、加快材料開發與制造的人力資本投資
人力資本的投資需要準備研究人員利用這些新工具。從 “數據匱乏”到“數據豐富”的過渡會引發我們的思維,激勵方式以及教授方面的轉變。

【結論】

高性能計算,自動化和機器學習等技術有望加快材料發現的速率,更好的調整投資者和利益相關者之間的時間序列。這些新的技術將成為科學進程中不可或缺的一部分。在(半)自動化反饋回路中,合成,裝備制造和診斷比現在要快十倍以上,這種高速率在不遠的將來完全有可能實現。為了實現這一目標,需要進一步投資基礎設施和人力資本,包括更加重視現存方法對解決材料相關問題的適應性應用、采用數據和元數據標準、數據管理工具、實驗室基礎設施(分散式和集中式)等。將這些工具整合到研發生態系統中部分取決于幾個人的因素,即發展激勵結構所需的時間、社區支持、教育和技能提升以及研究人員的心態,這些都源于我們的研究領域正在從思維“數據缺乏”向思維“數據富有”轉變。這樣就產生了一種理想的實驗室,在這種實驗室中,材料開發的持續進行不受其他因素的影響,可以通過計算能力增強人類的思維,以釋放人類思維來進行科研使其更接近人類曾經想象的速度,并且可以解決一些與市場相關的時間框架中的社會挑戰。

文獻連接: Accelerating Materials Development via Automation, Machine Learning, and High-Performance Computing(Joule, 2018, DOI: 10.1016/j.joule.2018.05.009)

本文由材料人編輯部計算材料組杜成江編譯供稿,材料牛整理編輯。

材料牛網專注于跟蹤材料領域科技及行業進展,這里匯集了各大高校碩博生、一線科研人員以及行業從業者,如果您對于跟蹤材料領域科技進展,解讀高水平文章或是評述行業有興趣,點我加入材料人編輯部

歡迎大家到材料人宣傳科技成果并對文獻進行深入解讀,投稿郵箱tougao@cailiaoren.com.

投稿以及內容合作可加編輯微信:cailiaokefu.

材料測試、數據分析,上測試谷

分享到