Science Advances:基于深度學習進化策略的軟材料逆向設計


膠體自組裝(膠體自發地組織成有序結構)策略被認為是生產下一代材料的關鍵。然而,當今種類繁多的膠體積木和無限的熱力學條件使得系統的探索變得困難。這一領域的真正挑戰是扭轉這一邏輯,開發一種健壯的、通用的算法來反向設計自組裝成目標結構的膠體。

來自荷蘭烏得勒支大學的Gabriele M. Coli團隊介紹了一種通用的逆向設計方法,通過瞄準晶體、準晶和液晶的衍射圖案來有效地對它們進行逆向工程。本文的算法依賴于參數優化的進化策略和卷積神經網絡作為序參數的協同使用,并為實驗上可行的膠體相互作用的逆向設計提供了一條前進的道路,特別是優化以穩定所需的結構。相關工作以題為“Inverse design of soft materials via a deep learning–based evolutionary strategy”的研究性文章在《Science Advances》上發表。

【圖文導讀】

CNN算法

受通過散射模式識別相位的成功經驗和機器學習的進步的啟發,本文從一個新的途徑來解決這個問題,直接使用結構因子的編碼作為序參數。為此,本文訓練卷積神經網絡(CNN)來根據不同的衍射圖案對不同的相位進行分類,并使用結果來構造適應度函數,使得被分類為目標相位的可能性較高的配置將以較高的適應度得分。最終算法的流程圖如圖1所示。關于基于CNN的適應度函數選擇的詳細討論可以在補充材料中找到。結果表明,該算法具有極強的魯棒性和通用性,不僅方便了晶相和液晶相的逆設計,而且方便了QC的逆向設計,因為QC的非周期性是出了名的難以逆向設計。該方法以代或迭代的方式進行,基本上由三個步驟組成:(i)采樣、(ii)適應度評估和(iii)更新。

圖1.每一代執行的三個步驟的示意圖。

HCSS模型中QC12的逆向工程

本文從考慮肩寬δ=1.4σ的固定值的HCSS模型開始本文的研究,在這個值下QC12相已經被證明是穩定的。相圖作為溫度和壓力的函數如圖2A所示。逆向工程過程的結果匯總在圖2中。從以流體相穩定區域為中心的高斯開始逆向工程過程,算法到達目標QC12在大約25代內穩定的區域。圖2A顯示了溫度kBT/?和壓力βPσ2平面上的多元高斯分布在連續幾代中的演化。圖2B顯示了在上一代(第100代)中獲得的代表性照片,而相應的以12次旋轉對稱為特征的衍射圖案如圖2C所示。該算法的成功在很大程度上依賴于CNN發現系統中哪怕是微小的結構變化的能力。在逆向工程過程的早期相,當系統處于流體相時,算法已經發現通過增加壓力和密度來增加整體結構有序性是很方便的。這可以在圖2D中清楚地看到,在圖中本文繪制了所有樣本的平均適應度的演變情況。雖然早期世代的適應度變化很小,但它們足以引導進化策略朝著正確的方向發展。

圖2.HCSS模型中QC12的逆向工程

HCSS模型中QC12、QC10和QC18的逆向工程

逆向工程過程的結果總結在圖3中。特別地,圖3(A到C)顯示了當目標為(i)QC12、(ii)QC10和(iii)QC18時多變量高斯分布的演化。根據要找到的QC,分布向不同方向演化,并最終收斂到不同的狀態點。在所有情況下,獲得的壓力和肩寬的最終值與三個QC被證明是穩定的值非常一致。本文還獲得了具有代表性的QCs照片,其衍射花樣如圖3(D至F)所示。每個衍射圖案被確認存在正確的準晶結構。

圖3.HCSS模型中QC12、QC10和QC18的逆向工程

在一種新模型交互中的應用

為了測試本文的方法在新類型的交互上有效的能力,本文使用在HCSS模型上訓練的同一個CNN對SCS模型中的QC12進行逆向工程。類似于HCSS情形,本文保持相互作用參數不變,即δ=1.35σ和kσ=10,并使進化策略找到QC12穩定的密度和溫度區域。圖4A中的相圖被用作評估和監測該方法的性能的參考。逆向工程過程的結果總結在圖4中。圖4A顯示了溫度-密度平面中多元高斯分布的演化。從以流體區域為中心的分布開始,算法立即開始增加密度和降低溫度以增加整體順序。令人印象深刻的是,僅僅五代之后,分布的平均值已經在QC12的穩定區域內,這表明了CNN對相互作用勢的變化的穩健性。在剩下的世代中,分布的協方差縮小,平均溫度向相圖中的較低溫度移動。圖4(B和C)分別顯示了在上一代中獲得的QC12的代表性照片及其衍射圖。

圖4.SCS模型中QC12的逆向工程

相位的發現

逆向工程過程的結果匯總在圖5中。進化策略從流體相開始,降低溫度,增加壓力和肩寬,以最大限度地適應環境(圖5C到F),為該系統找到尚未預測的QC10相。作為算法已進一步找到QC10并進行確認,圖5B示出了在上一代期間獲得的代表性照片以及相應的衍射圖案。因此,本文的算法成功地定位了SCS模型中的一個新相。

圖5.在SCS模型中發現QC10。

【結語】

從實用的角度來看,將本文的方法擴展到3D情況是特別有意義的。2D衍射圖案立即提供了即使用肉眼也很容易讀取的結構信息,而3D衍射圖案則更難解釋。因此,要處理3D系統,通常需要將粒子坐標投影到具有相關對稱性的平面上。當使用CNN時,由于其固有的架構,這一方面變得無關緊要,因為CNN能夠自然地處理完整的3D信息。

鏈接:https://www.science.org/doi/10.1126/sciadv.abj6731

本文由SSC供稿。

分享到