潘鋒:基于圖論、大數據和人工智能的新能源材料基因探索


謝謝材料人的邀請,也感謝大家在周末時間來聽我們北京大學深圳研究生院新材料學院團隊在新能源材料的研究新范式方面的探索思考和進展。

>>>? 材料基因工程

對傳統的材料研究來說,大家都是從試錯開始,一般是合成-檢測-分析-再合成。現在大家都知道人工智能和大數據成為一個新的科學研究的新工具。但怎么更有效的運用大數據和人工智能?這里面我們需要一些新的數學方法有效地描述材料領域的結構與性能的關系。這些方法對我們材料領域來說是新的,但是這些數學方法不一定是新的,可能已經在物理、計算機和其它的很多的領域已經使用過很有效,具有強大的功能。

今天我向大家匯報的題目就是圖論作為一種數學工具,可以用來構建高質量的材料大數據,有效地研究材料的構效關系。有了大數據以后,我們可以在數據里面應用人工智能去挖掘一些相關性,在新材料,特別是新能源材料的研發中,探索出“材料基因”,或者回答有沒有材料基因,用來預測和決定材料的性能。這就是我今天報告的主要內容。具體內容分幾個方面,首先跟大家探討一下“什么是材料基因?” ,然后“如何開展材料基因的研究?”等。

說到材料基因,其名字沿用了是生命科學中“基因”,我們知道生命有基因,其決定了生命的上一代跟下一代之間的遺傳。所以當我們在研究材料時,可以反復問材料有沒有“基因”?材料基因的特點是什么?怎么研究?我們在做鋰電池研究,可以通過探索鋰電池材料的基因,來發現材料基因的共同特點,并運用于鋰電池及其材料的研究。

先講講材料基因,材料基因這個概念由來是源于美國一些智庫于2011年向奧巴馬總統提出,美國未來的國家戰略要引領科技,首先要在材料上引領,新材料研發與應用是基礎。傳統來說一種高性能新材料從發現開始到產業應用需要20多年,因此急需探索縮短這個時間,需要研究的新范式,目前已形成共識并成為各國科技競爭的發展戰略。這里面我特別跟大家分享一下,什么是物質?什么是材料?如何從物質研究到材料開發與應用?物質是由其結構來定義的,物質結構(結構化學)是由相同或不同原子之間以特定的化學鍵連接(原子間分享電子)及其排序構成。物質是材料的基礎,材料要針對不同需求對相應的物質進行調控。一個典型的例子是單晶硅,作為半導體芯片應用和太陽能電池應用的單晶硅雜質含量的要求是有巨大差別的。

美國2011年提出的材料基因組計劃,試圖改變我們剛才講的傳統材料研究的范式。我們國家也意識到通過材料研究范式的變革對加速新材料研發的重要性,科學院和工程院聯合開了好多次研討會,于2016年,我們國家設立了“材料基因工程國家重點研發計劃”,材料基因工程就是說把生命基因工程的思想用到我們材料的研發中來,所以在第一期立了10來個項目,其中有一個項目就是關于材料基因工程來研發下一代全固態電池及其關鍵材料,我們聯合高校和企業相關團隊聯合承擔并完成了該項目。?

什么是材料基因?

在承擔項目過程中,我們不斷問到底什么是“材料基因工程”,它的內涵及其外延是什么?這個命題雖然連在一起,實際上是兩層含義:“材料基因”和“基因組工程”,前者是一個關于科學問題的定義,后者是關于如何開展的工程問題,工程就是方法和技術。可以參照生命基因工程成功的一些方法論。什么是材料基因呢?其關鍵是有沒有“材料基因”,如果有它應該又是如何表達?我們可以先類比一下生命基因,然后再挖掘材料基因的關鍵要素。

>>>?類比:生命基因?vs.?材料基因

很久以來生物現象觀察發現上一代和下一代某種特性相似,叫生命遺傳現象,隨著物理學和化學理論和測量技術的發展,才發現有一個決定生命遺傳的“基因”,它有最基本的分子結構基,包括4種堿基的功能結構基元,堿基之間以共價化學鍵以特定的排序連接在一條鏈上,這兩條鏈之間以氫鍵構成雙螺旋結構,左邊鏈和右邊鏈之間象鑰匙和鎖一樣以氫鍵為相互作用力以及特定空間耦合結構,是一一對應的,一旦知道了左邊結構也就知道了右邊結構,保證很精確的去復制。決定遺傳性狀就是一段這些功能結構基元的排序。因此生命基因里包含了三大要素,(1)基本的結構基元,包括堿基4種,相看起來比較簡單但可以組合成非常復雜的排序,生命為什么選這種4種堿基,說實在我們現在也不得其解;(2)4種堿基的排序;(3)堿基之間的相互作用,包括鏈內是強相互作用的共價鍵(稱之為化學鍵),鏈間是弱相互作用的氫鍵。

我們再看看我們的材料世界,什么叫材料?就是原子們在一起以不同的方式結合與相互作用。原子的特點是基于原子的質子數以及電子數,性質主要與外層電子數相關。門捷列夫從元素之間的性能相似性得到的周期表,可以說是第一張物質/材料基因規律的圖表。量子力學的一大成績能夠發現和解釋其原因,不同元素有不同的外層電子從而有不同的得/失電子的能力,這決定了它在構成材料時在結構基元中的角色與周圍的排序與相互作用力。

所以,材料基因和生命基因有著相似的地方,從原子的尺度來理解生命基因和材料基因,二者關鍵共同要素都是功能結構基元及其它們之間相互作用和排序。一般認為一個材料特征和性能由其組成與結構決定,更深層次“材料基因”探索是由其功能結構基團以及相關的排序。

>>>?生命、材料?vs?基因

我們從宏觀尺度來比較材料和生命,它們都應該遵循熱力學定理,其演化都應該符合熱力學第二定理,G=H-ST,G是吉布斯自由能,由能量項(H,焓,對應內能)與有序度項(S是熵,T是溫度)來決定,系統是自由能是負的方向自發過程,當能量相在發生前后變化不大時,熵增加(無序度增加)會成為自發的過程。信息(需要輸入能量)的本質是消除不確定性的量度,熵和信息對系統描述在本質上是一致的,是對物質世界和生命的信息表達。生命是一個有序的結構系統,在開放的體系里,能量的輸入可以維持其有序運行和保持其有序度,避免不確定性因素的干擾其有有序運行。材料的合成或者材料的使用,實際上是在一個開放的體系里面進行,有一個能量流的輸入可以驅動結構的序排,增加有序度。

>>>?生命與材料基因:三要素(結構基元、相互作用、排序)

基于從微觀和宏觀尺度對比,用熱力學分析材料和生命都有兩大要素,一個是能量部分、一個是信息部分。能量部分,是物質之間的相互作用的強度,相互作用的強度由誰決定?肯定是由組成物質的元素,以及這些元素之間的得失電子能力的差異,叫電負性,形成不同互相作用類型,即不同化學鍵。當原子間的電負性差別很大,失去電子的形成正離子或者得到電子的形成負離子,正負離子之間形成離子鍵。當電負性差別不大,本身又不是那么容易失去和得到電子時一般是采用共享電子形成共價鍵。金屬晶體中的金屬共享游離的電子形成金屬鍵。根據結構基元在材料中發揮的作用可以分類成為不同的功能結構基團。在鋰電池中比較特殊的正極材料有過渡金屬元素變價實現儲能,過渡金屬元素最大的特點是其外圍d-軌道自旋電子,其氧化物的過渡金屬配位多面體之間通過氧作為連接點形成d-自旋電子之間超交換相互作用。因此,材料基因的能量部分就是功能基團及其相互作用,有序度(信息部分)是它們的排序部分和對稱性。

物理世界最有趣是它存在對稱性,它貫穿在物理定理和材料的結構與性能,這可是成為我們研究材料基因的一個切入點。我們再看那個元素周期表,每個元素它在不同狀態下,有其半徑、價態以及與近鄰的相互作用能力,開展材料基因研究,最好的辦法是借鑒中國傳統哲學‘道法自然’。自然界已經有很多自然存在的或已經人工合成晶體材料,可以向已知材料結構學習,因此需要把所有材料的物質結構收集起來形成材料大數據,然后挖掘材料基因的信息,開展基于數據驅動材料科學研究。

如何開展材料基因的研究?

>>>?材料研究新范式(數據驅動)

最近有一本書叫第四個范式,它把科學研究范式進行分類,第一個范式,是我們最早的人類進行了科學活動,開始制備科學儀器對自然現象進行觀察,對觀察的數據進行收集。例如開普勒等用科學儀器觀察天體,積累了觀察數據,得到地球繞太陽運動的數據。第二個范式是從這些數據找出科學規律,比如說地球圍繞著太陽的運動是橢圓還是圓,還是圓很多的圓的疊加等等,最后牛頓總結出萬有引力定律,自然界的運動規律以簡單方程來描述,得到物質相互作用力(引力)都是跟距離平方成反比,天上的規律與地上的相互作用與相關運動的規律的一樣的,由此建立了經典力學。在研究微觀粒子相互作用的時候,發現了微觀世界動量與位置不能同時精確測量的不確定性原理,形成了量子力學體系。愛因斯坦又發現了我們生活的物質與能量、空間與時間不能分割,可以統一來表達一個時空與物質能量的方程表達式,因此整個世界有了基礎的相互作用的物理表達式。值得強調的是我們實際生活在的世界是復雜的,如海上的波浪以及鳥的飛行,都不能用簡單的方程來描述,在做一架飛機等大工程時要用數據仿真和模擬,稱之為第三個范式。現在我們已經有大量的科學和工程數據,復雜系統背后都有存在不同層次的相互作用,有一對一的相互作用,也有多體復雜的相互作用,這些相互作用背后是有底層的物理原因、邏輯關系,基于大數據和人工智能的科學與工程研發稱之為第四個范式。

通過收集結構與性能數據,用數學表達和人工智能算法去挖掘構效關系,在材料科學與工程領域,開展基于材料大數據的結構和性能的相關性新范式研究。材料是個復雜系統,很難準確的計算,所以需要發現有效的數學表達和計算方法節省運算的時間,能夠直插問題的本質,這是這個報告要匯報的一些思路和取得的進展。

>>>?材料大數據 vs 從數據到知識?

國外幾個團隊已經開展了材料的大數據建設,在鋰電池領域伯克利Ceder教授建立了“Material-project”, 通過實驗得到晶體結構數據計算出的能帶和熱力學參數以及鋰電池的性能,很多人都在用。此外還有美國杜克大學和西北大學建設材料數據庫,其包括了許多實驗與計算預測的新材料數據。ICSD是傳統的無機晶體結構數據庫,它的來源是各國實驗室發表文章的晶體結構數據。各國不同的材料協會,像美國陶瓷協會有自己的數據庫,有機化合物有劍橋數據庫等。

>>>?傳統晶體結構化學:識別同構性挑戰

ICSD實驗數據大概已經有18萬個,每年都增加一兩萬個新的無機晶體結構數據,以氯化鈉結構數據為例已經有34條,來自于不同年代和不同的實驗室測量的數據,按照傳統結晶學或結構化學的方法是用x-射線衍射來測得衍射點獲得特定對稱性以及對應的平行六邊形晶胞格子類型(正方、長方、斜方、三角或六角等)、大小(晶格常數,a、b、c,斜方有面夾角α、β、γ等)、各原子在晶胞中有不同的位置,根據對稱性可以得到多少個獨立的原子位置,具有對稱關系的原子可以用對稱性換算出來。對稱關系由點群中的對稱操作(旋轉、晶面、反演)描述,點群加上平移操作構成空間群。

>>>?傳統結構化學挑戰: 晶體結構的“測不準”原理

用傳統的結構化學來看ICSD中的氯化鈉立方晶格的晶胞參數,最小和最大差得非常大,約差0.04nm,比x-射線衍射精度(0.0001nm)大約多出兩個數量級。不同實驗室的制備條件的差異會導致材料存在缺陷不同以及測量本身有誤差都會導致所測量的晶胞的原子坐標與間距存在差異。如果用測量單胞參數與位置來定義二個結構是否相同必然面臨“同構性”判斷的閾值設定的問題,即差異多大范圍內才算同構的?會形成以下2種情況“不確定性”:測量誤差閾值內認為是相同的結構也可能是不相同結構,以及測量誤差閾值外認為是不同結構也可能是相同的結構。傳統結構化學就有這么一個“同構性識別”的挑戰,例如晶體結構中的晶胞參數a和b分別是?0.415納米和0.414,如果誤差的閾值設定在0.002,a和b兩個之間沒有差別,即a和b相同,如果閾值設定在0.0005,a和b是不同的。看氯化鈉的ICSD數據,我們設定多大的閾值認為二個NaCl結構是相等的?SiC有250多種相結構,即使設定閾值很小,它也可能是不同的相結構。因此,對在設定誤差閾值內認為相同的結構,會找到一個“黑天鵝”,是新的不同的結構。

我們在建立自己材料大數據的過程當中,面臨的一個挑戰就是用什么方法來表達或判斷二個結構是相同(同構性)?測量總是有誤差,要避免剛才講的結構測量帶來的“測不準”的問題,我們就想到另外一種思想,不去比較測量原子位置的絕對大小,而是大數據的思想研究事物之間的“關系”,即研究原子和原子之間的相互連接關系,把同構性判斷轉換成比較原子之間的連接關系,用連接關系的網絡圖來表達是否相同。

>>>?數學方法:?圖論 ?

數學圖論是歐拉先創建,以此解決了著名七橋問題,把能否一次走過7個橋(不重復走)的問題抽象為點與邊(兩點之間的連通的表達成邊,兩點之間不連通就沒有邊)構成的圖。點與點之間有連通與斷開,例如兩個點隔著河沒有橋就不能連通。圖論的基本思想就是說把是自然界的物可以抽象成“點”,點之間是連通可以用“線”表達,不連通就是斷開的,這“點”與“線”就構成了一張圖,我們把這個思想就用到晶體和材料中來表達結構。

>>>?結構化學新表達:圖論

我們可以把晶體結構里面原子抽象成圖論的點,如果這兩個點有化學鍵可以認為電子在兩個原子間是連通,表達成圖論的線。什么叫化學鍵?就是兩個原子之間有電子之間的交換,這就是化學鍵。如果一個原子把電子全部出,另一個原子把電子全部拿走,這兩個原子形成離子鍵。如果兩個原子的電子共享,那就是共價鍵,很多原子之間的結合都基于離子鍵和共價鍵,還有一種金屬鍵是在全域范圍徹底共享電子,大多數原子之間化學鍵是含有不同比例離子鍵、共價鍵與金屬鍵的組合。因此原子間有化學鍵,就是聯通的,沒有化學鍵就不連通,從而構建化學和晶體的圖論。

圖論的點可以就研究對象來抽象。比如說我們在研究一個城市的特點的時候,我們可以把一個小區作為一個點,然后看看有多少條路跟這個小區和另外一個小區連接,我們也可以把小區把每棟樓作為一個點,然后再看到這樓和樓之間,樓到另外一個小區的樓之間,因此可以根據對象不同構建不同的圖。同樣在晶體里面不僅可以把原子當作點,也可以把原子組合構成功能結構基元當作點,研究其連接方式,形成不同層次的圖表達。圖的方式來表達最大的好處是可以用計算機里面的矩陣方程來進行運算,原子的實體空間位置轉變成計算機虛擬的矩陣空間的數字進行數學運算的問題。

>>?例如:圖論 vs 同構識別

我們現在舉一些例子給大家看看,這是我們發表的第一篇基于圖論的結構化學的文章,用于解決剛才講的晶體結構的同構性問題。以我們手機在用的鋰電池正極材料鈷酸鋰的基礎原料四氧化三鈷為例,四氧化三鈷在礦物學上叫尖結晶石相,一種氧密堆方式,立方晶系,晶胞長度都相同角度是90°,以一個晶胞為基礎看有獨立的幾個氧幾個鈷,把每個鈷與最近鄰的化學鍵連接,再與次近鄰的連接,再與第三層等不斷地連接構成一張連接圖。用這種方式可以發現實際上有三種獨立的圖,第一種以某1個鈷為中心跟6個氧連接,還有1種是鈷跟4個氧連接,還有1種以氧為中心與4個鈷連接,這樣就可以發現單胞里面有幾個獨立的原子構成獨立的小圖,這些獨立的小圖的組合構成尖晶石相的完整表達的大圖。

>>>?例如:圖論 vs 同構識別 :Li11Ti4Fe9O32 ??是否是尖晶石相?

Li11Ti4Fe9O32像一個鋰電池材料,它與尖晶石相Co3O4?的晶胞特征不同(晶胞長度和角度都不相同),是最低對稱性的單斜相,它是否是尖晶石相?用傳統的結構化學方法很難識別。我們用以上圖論的方法把單胞中的每個原子與最近鄰、次近鄰等4-5層構成連接圖,發現實際上也只有三種獨立,一種是金屬與4個氧連接,另1種是金屬與6個氧連接,還有1個是氧跟4個金屬元素連接等。從圖論的定義來看,這個材料鋰、鈦、鐵、氧就是跟上面的四氧化三鈷是同一種大圖類型,因此可以確認它是尖晶石相。我們現在可以把傳統的礦物學的每種晶體結構變成一種特定圖的定義和表達。

>>>?圖論 vs 結構化學大數據(北大)

基于以上所述基于圖論的結構化學方法,發現剛才講的氯化鈉不同晶胞參數的連接方式是相同,從圖論結構化學來說是相同的結構。用圖論方法我們就可以把已發表所有的晶體結構拿來做數據清洗,也就是說用圖論的辦法來定義和識別晶體結構是否同構,得到了大概獨立的約65萬個獨立的晶體結構,經過量子化學的結構優化計算,作為我們晶體結構大數據。

是否有化學鍵連接怎么判斷呢?徐光憲先生寫的《物質結構》的書后面有一個離子半徑表(鮑林半徑),根據結合原子兩者電負性只差,可以初步判斷是共價鍵還是離子鍵(是選用共價半徑還是離子半徑),如果是離子鍵,根據電價平衡計算是幾價(對于可變價的原子)。它的原子半徑,離子半徑、金屬半徑來估算兩個之間的距離,與實際原子間距離比較確定是否有化學鍵連接。因為如果原子間沒有化學鍵,是范德瓦耳斯力,原子間的距離要大得多。用圖論在識別的同構結構可以容忍有鍵角微小的差別,容許結構的一些畸變,這要連接關系一樣可以作為同一類的圖結構。

>>>?圖論->代數圖論

代數圖論的持續同調是比較定量的圖論方法,它能有效得到原子之間相互連接更細化的圖信息。這個方法它選用了三種貝塔參數描述2點之間什么時候連接、3個點能否/什么時候連接在一起形成一個孔以及4個點能否/什么時候連接在一起形成一個洞。持續同調拿過程是兩個相鄰原子,以每個原子為中心,像波一樣不斷的徑向擴大,到一定程度肯定會碰在一起,碰在一起就記錄下碰在一起的空間距離,是兩個原子之間的距離,用貝塔0表示。按照這個方式對三個原子進行關系進行描述,這3個原子沿著徑向擴大碰在一起形成中間有孔,用貝塔1表示。按照這個方式對4個原子進行關系進行描述,有一種可能就形成一個洞,用貝塔2表示。代數圖論的持續同調方法已經成功應用于生物醫學領域,成功地開展了藥物設計。我們把它用于材料研究。

>>>?用材料大數據研究:原子有效大小 鮑林離子半徑的修正

建立了大數據,我們可以檢驗一下《物質結構》書中鮑林半徑表上的數據與不同實際晶體是否符合,以Fe為例,查到其鮑林半徑與價態(Fe2+,Fe3+)和配位多面體(四面體,八面體)直接相關,通過這兩項可以從離子半徑的表格查到相應的半徑值。如果我們把這些離子半徑代入實際的晶體結構大數據中發現誤差很大,原因是什么?我們發現在鮑林半徑表格里面雖然考慮了價態和配位數,但沒有考慮與誰配位,其使用的是“硬球模型”,但實際的中心離子和配位離子的極化性(讓人家變形能力)和可極化性(自己變形的能力)是不同的,從而導致中心離子和配位離子(例如硫與氟的極化性和可極化性差別很大)會有不同程度的重疊,因為鮑林半徑表沒有考慮,所以就有很大的誤差。如果我們把它考慮進去,用“軟球模型”數學方法,從而加上配位種類對鮑林半徑進行修正,可以更加準確的預測兩個原子之間的距離。這是我們應用材料大數據以后的第一個工作,進一步探索了離子半徑的真實的意義和在實際環境里面的大小的一種修正。

>>>?量子化學計算晶體結構與電子結構的相關性研究(高通量和精確的電子結構計算 :HSE WKM)

有了晶體結構大數據以后,運用人工智能的機器學習,希望把已有的一個晶體結構與電子結構關系學習到,然后有了新的晶體結構就可以預測電子結構。機器學習類似于人的學習,在識別一群動物是雞還是鴨,先要通過了一些樣本的訓練,再放進一個雞還是鴨,它馬上就可以識別出來。類似有了一個晶體結構,用量子化學第一性原理計算,我們用了更精確的HSE方法,計算能帶的帶隙,再用機器學習來學習結構與帶隙的相關性,然后再進行新結構的HSE帶隙的精確計算用來修正機器學習,這樣多次的迭代,得到90%以上的結構與帶隙相關性(即一個結構就可以預測其帶隙)的預測精度。

>>>?量子化學+人工智能:?機器學習建立力場

用量子化學和人工智能來研究原子間相互作用力,任何一個原子/離子放在晶體中,要感受到周圍環境形成的力場。我們在固態物理中學習到簡單的離子晶體相互作用,利用其周期性規律得到馬德隆常數,運用該常數可以計算晶格能,其結果與實驗測量很接近。對復雜系統的原子或離子遷移的動力學計算需要得到原子/分子相互作用的力場,有了精確的力場參數就可以快速的來預測物質的熔點、硬度和原子/離子的運動。

技術細節:用機器學習開發力場是基于勢能面方法,選取Rcut范圍內的原子作為近鄰原子,近似認為中心原子只受近鄰原子的影響。SANNP模型的特點是將DFT計算獲得的total energy拆分到每個原子上,直接獲得了每個原子的能量,傳統的力場模型通常假設Etot等于體系中所有原子的原子能之和,擁有了原子能數據一方面提升了訓練中包含的數據量,另一方面使得模型能更好的捕捉到表面等不同局部特征會帶來的能量變化。力場方法的整個訓練流程如下:1、提取近鄰原子的局部環境特征。本文中使用兩體勢與三體勢來提取原子間的相對位置關系作為局部環境特征。2、將中心原子的局部環境特征輸入神經網絡中,預測中心原子的原子能。右下圖展示了我們的SANNP模型與DFT模型及經驗嵌入原子勢間的比較,可以看到SANNP與EAM相比較DFT的結果更為相似。我們用這方法進行了鋰金屬負極材料枝晶的生長模擬和預測。

>>>?大數據+人工智能:?預測結構與性質

回到剛才將量子化學計算與機器學習相結合來從晶體結構預測電子結構,我們拿了15,000個晶體,進行量子化學計算與機器學習特征提取與訓練相結合,進行反復的迭代改進訓練模型,不斷提高預測的精度。機器學習開展材料研究的工作現在越來越多,大家可能已經知道不少了,大家感興趣的網上有許多資料。

我這里想講的是人工智能和大數據還能干什么?在起初研究生命現象時發現植物的有些性狀幾代之間都有相似性,稱之為遺傳,分子生物學發現了遺傳的本質是基因的復制。可由于遺傳預測其相似的性狀,但也發現有些時候偏離了預測稱之為變異。我們在人工智能機器學習預測性能時總會發現一種現象,不管怎么改進的模型訓練提高預測精度,即使預測已經做到百分之九十幾了,總有那些不能被預測的部分,我們能否問這些是否是特殊變異的結構?我們把這偏離預測的(圖中的“異常點”)材料結構拿出來看看是什么原因也可以看到變異的新物種。

>>>?大數據與人工智能?發現新型結構基元與電子結構

這里舉了一個異常點結構的例子AgO2F,機器學習得到的帶隙是3eV作用,量子化學計算的帶隙只有0.6eV。進一步的結構分析發現銀作為中心離子與兩個氟和兩個超氧離子配位,大家知道氧化性越大把電子拉過來的能力就越強,超氧離子和F都是強氧化性的。我們知道雙氧水是氧化性很強的,最喜歡得到電子自己變成-2價,氟也有最強拉電子能力。銀在這種環境下不是我們平常的+1價,而是+3價,超氧離子的能帶在原來價帶和導帶之間,所以帶隙就是不是平常預測的3eV,而是中間有超氧離子使得帶隙只有0.6eV。

因此,運用大數據和人工智能既可以預測構效關系的規律同時也能發現不能被預測的異常點,從異常點中可以發現變異的新的功能結構基元—-新“物種”。

>>>?基于圖論和材料大數據 發現新的2維、1維、0維材料

有了基于圖論的結構化學和晶體結構大數據,可以重新來描述和定義什么是真正的低維材料,如2維,1維和0維材料:

二維材料就像石墨烯一樣,可以用一個膠帶紙不斷地撕最后得到二維片,其在某一方向上沒有化學鍵,原因是層之間的相互作用力是很弱的分子間范德華爾力。根據剛才圖論結構化學,把在二維方向上有化學鍵連接成一個網絡,但在與它垂直的方向上沒有化學鍵,只有分子間弱的相互作用的材料定義為二維材料。以此類推,如果只有在一維方向上有化學鍵連接,另外兩個維度都是沒有化學鍵連接,只有范德華爾力,定義為一維材料。可以用膠帶紙可以不斷的撕,最后得到一維材料。同樣如果他在所有維度上面都沒有化學鍵連接,那就可以定義為零維材料。

運用圖論低維材料的定義和結構大數據可以重新發現新型的二維、一維、零維材料,我們最近在國家科學評論上面發表了研究文章,技術細節:在材料的化學圖論研究方法中,原子被定義為點,相鄰原子間存在的化學鍵被抽象為邊。我們基于88159種無分數占據情況的晶體材料,根據元素的電負性選擇相應原子的共價、離子或金屬半徑從而確定原子間的近鄰關系。通過該方法可以構造每種材料的結構圖,并表達為鄰接矩陣。通過圖論方法,找到結構圖中的獨立聯通單元,對其進行分析可獲得該連通單元的維度,由此篩選出一系列二維、一維和零維(2D、1D和0D)材料。基于圖同構比對方法,可以進一步將低維結構分成不同種類的拓撲結構類型。采用從第一性原理分子動力學方法評估一維化合物的動力學穩定性,從而排除不穩定的化合物。經過上述步驟后,總共得到了244種穩定的一維材料,這些化合物可被歸類為138個拓撲結構類型。右上角圖:為了進一步分析材料的化學信息,研究團隊從成鍵特性與原子尺寸效應兩個方面進行研究。其中成鍵特性由晶體軌道哈密頓布居(COHP)的積分項來代表,原子尺寸效應由陽離子中心配位多面體中正離子和負離子的半徑比作為量化指標。一維材料在化學空間的分布情況反映出相同結構類型的材料擁有相似的性質,說明了圖論分類方法潛藏著對材料性質的分類。右下角圖:(a) 2D、1D和0D化合物的剝離能分布的類似小提琴形狀圖。灰色線表示由石墨烯的剝離能定義的閾值。接近半數的一維材料擁有較低的理論剝離能(膠帶可以撕開),意味著這些材料均有可能在實驗中被成功制備 (b)一維材料中元素組分的數目統計圖,其中灰色的元素代表其不存在于任何一維化合物中。

由此我們發現了200多種新型的一維材料。一維材料有什么用?國際半導體組織規劃的下一代半導體將把一維材料作為器件基礎材料。目前用的硅基半導體,所有的硅單晶它都是硅的四面體共價連接成的晶體網絡,當器件的溝道變得越來越小,到1nm只有十幾個原子排列,邊界將有10%左右斷鍵,它還是硅嗎?這些斷鍵要界面重構形成鈍化層,本征硅的性質將被調控,會因為硅的斷鍵數不同及重構不均勻使得器件在原子尺度上的不一致而不穩定。所以真正的一維材料在自身方向是一維化學鍵連接,沒有其它維的化學鍵要被切斷和重構,從而在原子尺度保持穩定1維本征的性質。

這篇文章大家感興趣,還可以看到一維和二維是怎么演化的,二維和一維之間相互轉化的規律。還有一個有趣晶體化學問題,按照鮑林規則,兩個金屬配位多面體連接時以兩個金屬中心原子之間距離遠(排斥力小)會比較穩定,兩個多面體以共頂點連接最遠,其次是共邊連接,最近的是共面連接,大家想想如果兩個金屬元素越靠越近這兩個原子的電子就會發生交互作用形成共享(Interaction),電子在多面體網絡會形成滲流效應,這種電子滲流就使得材料具有半導體或導體的性質。

>>>?圖論+機器學習:預測結構與性質

一個毫米大小的晶體有1020多個原子構成,10個納米大小的晶體也有上萬個原子,有趣的是這些晶體只有1種或少數幾種確定周期性排列結構。例如碳原子構成的晶體常見只有石墨和金剛石。如果原子數少到只有幾個或幾十個時,原子堆積與排序的可能性會隨原子數呈現指數級增加。這里面很有趣的問題是這種隨著原子數目增加無限多的排序可能性是如何最后變成有限幾種晶體?是如何過渡或演化的?我們如何去預測和發現?還有催化領域從納米催化到目前很熱的單原子或團簇(幾個到幾十個原子)催化都存在“原子數與其幾何構型/電子結構及其性能的相關性”科學問題。

我們把量子化學計算、代數圖論持續同調方法和機器學習相結合預測多原子堆積能量最低的可能結構,考慮晶胞中每個原子周圍不同環境構成的持續同調,從而在拓撲不變量中引入原子信息。基于該特征所構建的晶體化合物機器學習模型,可以準確預測材料的形成能,誤差僅為61 meV/atom。運用這原子間的短程作用和長程作用等數據信息,基于提取的拓撲特征,構建團簇能量預測機器學習模型。利用少量原子數團簇結構構成的數據集來訓練所得的模型即可對中型和大型團簇形成非常高的預測精度。該模型可用于團簇結構的快速篩選,加快最穩定團簇結構搜索的速度。

>>>?圖論+機器學習:預測結構與性質?自監督學習->關鍵結構表示

中國有一個關于矛和盾的故事,賣矛就是他的矛非常尖利,可以刺穿所有的東西,賣盾的說他的盾可以擋住世界所有的東西,那人們會問把能刺穿所有東西的矛去刺能擋住所有東西的盾的結果如何?自監督學習就是自己把自己的矛變得更尖利來刺穿自己的盾,盾要把自己變得更強硬不被自己矛刺穿,這樣反復的改進和提升,自監督迭代學習。為了對材料的性質預測更加準確,我們運用自監督機器學習方法來預測結構和性質。

技術細節:左圖利用“正確”的小分子字符串,即smiles進行構造,認為構造出“不完整“的字符串與相應的答案;然后在訓練過程中,輸入"不完整”的字符串,讓模型推測出正確的部分。右圖描述了文章的整體邏輯:基于自監督學習的策略,我們基于Chembl,ZINC,和PubChem三個大型數據集,訓練出了三種預訓練模型。并且基于這三個大模型,進行了一系列的下游機器學習任務(包含了回歸任務,分類任務,以及virtual screening的任務)。

>>>?圖論+機器學習:加入預學習用小樣本數據實現準確預測結構與性質

有一次與大數據人工智能團隊討論,如何預測在一個機場里面判別一堆人是在一起討論問題,還是在吵架及要引發打架?通過很多場景既學習“討論場景”還要學習“吵架場景”,但這種感性的場景都是有限的。但人類關于“討論”以及“吵架”有理性的概念定義與情景描述,如電影、小說、繪畫等都有感性情景描述信息,對這些信息進行“預”學習,應該可以增加判斷的準確性。其實我們人的學習也是不斷從感性到理性,又回到實際的感性場景去判斷與作決定。運用這個思想我們拿材料相關的知識作為“預學習”,使得對小樣本材料數據預測的準確性大大提高。

我們在 Nat commun.講了如何在有限的小樣本數據進行機器學習實現高精度的預測有機化合物的性能,包括毒性等,有機物毒性樣本數比較少(1萬左右),但有機物多模態/維度的相關信息是大數據(SMILES 有機數據庫有7億個),基于大數據樣本預學習,有效預測小樣本有機化合物的毒性。

>>>?材料大數據<->反向設計

搞材料的人有一個夢想知道需具有特定性能的材料看如何把它設計和制備出來?這叫做反向設計,比如航天需要一個材料,需要硬度多少,韌性多少,一般就陶瓷很硬,金屬有延展性很韌,容易變形,但它不容易斷裂,能不能有一個材料又硬又韌,如何按照這個需求進行材料的反向設計??我們對基于大數據和人工智能開展材料反向設計的研究進展作了綜述,講了反向設計的一個概念,即已有晶體結構數據庫中的結構數據作為數據基礎,通過材料特征提取方法提取結構特征,并將特征送入神經網絡反向設計模型中反向設計出新的材料,通過DFT計算進行驗證,將驗證后的新材料作為數據庫的補充,形成一個完整的數據迭代生成過程。

細節:左下圖中展現的反向設計模型為VAE(變分自編碼器),該模型由編碼器,隱變量和解碼器構成。變分的核心思想為強迫編碼器從高維材料編碼獲得一個符合高斯分布的低維投影向量Z,即VAE希望將訓練數據X的概率分布映射到高斯分布,使得人為輸入任意一個高斯分布或者從材料空間按固定規則搜索到的隱變量,即可通過解碼器獲得一個接近真實的材料。同時在此過程中,通過將材料性質加入材料編碼或者損失函數,還可以控制生成材料的性能。其大致的工作流程如下:1、通過卷積及多層全連接網絡(漏斗狀網絡的左邊部分)實現高維材料空間到低維空間(隱變量)的映射,該部分被稱為編碼器(encoder)。在VAE中,會對編碼器添加約束,強迫該隱變量服從標準正態分布。2、通過另一個多層全連接網絡及反卷積(漏斗狀網絡的右邊部分)將低維向量投影回高維空間,實現對新結構的生成。該部分被稱為解碼器(decoder)。

>>>?知識圖譜的誕生

講大數據,我們看有些什么數據可以收集。剛才講的晶體結構數據,這還是非常有限的,無機晶體結構已經合成的數據大概18萬,加計算預測總共也就65萬個獨立。文本數據更大,我們已經有大概千萬篇的科學文章發表,每年發表的文章的量不斷在增加,人是讀不過來的。還有非文本的照片(如電鏡、x-射線照片)和視頻信息。我們正在構建結構、文本、圖片、視頻等多模態信息融合,借鑒谷歌在2012年就提出了一個知識圖譜,構建材料知識圖譜來預測下一代材料。

許多人覺得谷歌的搜索比其他的搜索精準。大家知道要準確和快速找到目的地通常需要一種很好的地圖。2012年,Google正式提出了“知識圖譜(Knowledge Graph)”的概念,其初衷是為了優化搜索引擎返回的結果,增強用戶搜索質量及體驗。本質上,知識圖譜是揭示實體之間關系的語義網絡,以符號形式描述物理世界中的概念以及相互關系,實現準確而快速找到目標信息。

>>>?構建材料知識圖譜

從Google “知識圖譜”啟發,我們構建材料知識圖譜,把上面提到的多模態信息進行信息抽取出來。為了信息的融合,我們要對信息進行結構化處理,從而研究這些信息之間的關聯,運用和發展數學方法看如何形成推理,構建一個材料知識圖譜,形成對未來材料的推理和預測。

>>>?材料知識圖譜整體構建思路

總的思路是材料學術文獻信息提取需要對文本形式的材料科學信息進行結構化表示,結合知識關聯、融合、推理等方法構建材料知識圖譜,可使研究人員準確而又高效地獲取信息,對過往研究進行脈絡梳理,對有潛力的材料進行推理預測。要解決的一個關鍵問題是要準確地識別文獻中的“主體(作者)+ 客體(材料)”。?材料是研究對象,是客體。是誰來研究?研究者是主體,一篇文章是包含主體和客體,及其相互關系,到底是“誰(主體)”在開展研究要搞正確,舉個例子,北大有一個潘鋒,清華有一個潘峰,英文都是Feng然后后面是Pan,或者是縮寫F.Pan,這兩個是否是同一個人(清華的F.Pan調到北大來了?)還是二個不同的人?

>>>?材料科學文獻作者消歧—歧義化現象

科學文獻里面要識別文章的作者是誰,幾篇文章作者是不是同一個人,這與上面談的兩個晶體結構是否同構類似,是構建材料知識圖譜大數據要解決的第一個問題,稱之為“作者消歧”。機器學習與人的學習相似,“向好人會學好、向壞人會學壞”。機器學習也類似,學“壞”的數據(錯誤的信息)不會得出正確的判斷,學“好”的數據(正確數據和信息)的就可能得到正確判斷和結論。如果數據的錯誤多,得出錯誤的結論可能性高。避免作者信息搞錯,先要進行作者消歧。

>>>?材料科學文獻作者消歧—MatKG框架

基于作者以及文本信息,我們結合機器學習匹配依賴算法對材料知識圖譜中的主體(作者)進行高精度消歧,并引入剪枝策略以解決在面對龐大且復雜的數據時查找效率較低的問題,實現高效信息匹配和搜索,從而構建了MatKG的框架。

2019年諾貝爾獎發給鋰電池鈷酸鋰和磷酸鐵鋰的發明者Goodenough先生等。作為材料知識圖譜的第一個應用,我們去復原磷酸鐵鋰這個材料發現的整個過程,詮釋“前世”(第一次被發現,并不是作為鋰電池材料用)和“今生”(作為鋰電池正極材料被廣泛應用)。在所有的過程當中,誰做了重要的Mile-stone的貢獻。看到從發現作為鋰電池正極材料到最近的廣泛被應用經歷了15年的時間。這之前不是作為鋰電池材料的基礎研究還要再追溯前10年,總共約25年時間。從中我們理解當一個材料從被發現/發明到被應用有著漫長路徑,材料知識圖譜可以讓我們對于新材料的整個科學發現過程進行復盤,為了探索新材料提供借鑒。

>>>?材料關聯與推理框架DATWEM—模型結構與表現

通過材料知識圖譜能不能讓機器把所有鋰電池正極材料的文章讀一遍,告訴我們下一代正極高性能的材料是什么?這是我們的初衷,相當于開始搞科學研究要去做調研,在做實驗之前,要問自己為什么要這樣做實驗,實驗做下去可能能發現什么新材料,這是“科學研究的注意力”。調研完會形成注意力,形成想法和推理。

>>>?材料關聯與推理框架DATWEM——關聯效果的顯著提升

我們基于材料知識圖譜雙層注意力機制的多源數據融合,融入領域先驗知識,顯著增強可解釋性,正極材料推導任務的效果全面提升。

>>>?材料關聯與推理框架DATWEM——推理功能

DATWEM框架可明顯改善正極材料的關聯效果,糾正違反材料科學知識的關聯案例。通過自然語言處理技術構建數據驅動的材料信息探索的新范式,為新材料的發現與設計提供新見解。

>>>?文獻大數據@構建材料知識圖譜 預測高性能鋰電池正極材料

>>>?基于材料知識圖譜預測Li2TiMn3O8作為潛在的高性能鋰電池正極材料

用材料知識圖譜相似的鋰電池電極材料磷酸鐵鋰,鈷酸鋰,富鋰錳氧,尖晶石錳酸鋰等構建一種向量和它們之間的相似度。數學很奇妙,相似性的比較可以多維度。我們可以不用有線性的相似性比較,而是用非線性的余弦相似度,與統計概率相關,來預測下一代。雙層注意力多元融合,去推理跟鈷酸鋰相似的是什么,然后跟其它正極材料什么相似,把各自的優點看能不能結合起來。這樣預測到了Li2TiMn3O8材料,這個材料可能有潛在的應用,還需要用實驗去驗證。

技術細節:模型使用的機器學習框架為BiLSTM,LSTM即為長短期記憶(Long short-term memory, LSTM)是一種特殊的RNN,主要是為了解決長序列訓練過程中的梯度消失和梯度爆炸問題。簡單來說,就是相比普通的RNN,LSTM能夠在更長的序列中有更好的表現。前向的LSTM與后向的LSTM結合成BiLSTM。傳統LSTM無法編碼從后到前的信息,舉一個例子,“這個餐廳臟得不行,沒有隔壁好”,這里的“不行”是對“臟”的程度的一種修飾,通過BiLSTM可以更好的捕捉雙向的語義依賴。左上角圖:在BiLSTM模型中融入雙重注意力機制,融入領域先驗知識(正極材料關鍵詞),顯著增強可解釋性。左下角圖:DATWEM框架可明顯改善正極材料的關聯效果,糾正違反材料科學知識的關聯案例。右下角圖:基于詞向量降維后的無監督學習聚類正極材料圖譜。輸入嵌入量為62萬個,保留了四種典型正極材料的大簇,以可視化不同材料之間的語義相似度。右上角圖:Li2TiMn3O8與LiCoO2相似特征的自動識別。通過挖掘不同材料對應節點之間的直接或間接路徑,可以從科學文獻語料庫中自動識別出與典型陰極相似度高的潛在正極材料。

>>>?如何系統提升新能源(鋰電池)材料性能?

下面介紹如何把材料基因與新能源/鋰電池材料要解決的科學問題關聯起來研究。鋰電池構架包含兩個電極,實現外電路的電子流動和電池內部的鋰離子穿梭,正極與負極它們之間有電勢差,充電時外電路推動電子做功并把鋰離子從正極推到負極,放電時電池對外電路做功,鋰離子從負極被推到正極。電池性能最重要包括三個方面。第一個方面是儲能密度,對應的是日常的手機能用多久,儲能密度是鋰電池材料存儲鋰離子的容量(能存多少個鋰離子)和對應的電勢差相乘的結果。鋰離子存多了會互相靜電排斥引發結構的穩定性下降和產生相變。第二方面是功率密度,對應的是充放電速度,經常聽到鋰電池充電時間太長太慢了,現在很多新的電池說可以快充,電動車和無人機加速要求快速放電,對應的是鋰離子在電極材料體相中、電極界面處和在電解液中從正極到負極或反向的運動速度有多快。第三方面電極材料與界面的結構穩定性,對應的是使用循環性能與時間壽命。

>>>?研究思路:結構化學與材料基因?從原子尺度揭示新能源材料結構與性能的相關性

關鍵問題;轉化效率、儲能密度 、功率密度、穩定性與安全性

>>>?結構化學方法:1. 創建基于圖論結構化學/材料基因方法?; 2.?鋰電池材料基因 與d電子結構化學;?3. 構建界面結構/材料基因與電化學研究體系

讓我們重新思考一下什么叫材料,材料是為了用的,用它的性能。要讓晶體材料表現出優異的性能的必要和充分條件分別是其體相結構和界面結構。我們生命細胞要表現出功能,一定要經過它的細胞膜來實現。一個材料性能要表現出來,也一定要通過其界面來實現。材料界面與體相是有巨大差別的:第一,從對稱性維度上面就有差別,晶體具有三維對稱性,到了邊界這種對稱性不存在,結構基元的配位多面體對稱性也破缺了,按照環境提供的條件要重新配位和重構界面。第二界面重構還有受到環境和使用條件的影響,電池要形成穩定的界面結構,是很難的一個問題,也可能由界面開始結構不斷地被破壞,從而影響材料體相的結構穩定性。第三方面鋰離子借助電解質當做橋梁讓鋰離子能夠在正極與負極之間傳輸,現在使用的鋰電池電解質都是液體,液體的特點是流動性和“潤濕性”能夠讓鋰離子在固態顆粒界面的空間距離最小(可以達到化學鍵的尺度)和傳輸面積最大化(覆蓋整個顆粒)從而阻抗可以達到最小。固態電池的電解質是固體,會涉及到兩個固體之間的接觸問題,與液體不同硬的固體顆粒接觸的空間距離大(達不到化學鍵的距離尺度)和面積小(只有固態顆粒接觸的擠壓應變承受的面積,屬于點接觸),因此電阻會很大,引發副反應、消耗能量,以及因為阻抗太大使得電極顆粒感受的有效電壓會下降。所以固態電池要解決最大的問題就是接觸阻抗。

現在鋰電池負極是以石墨為主,為什么不用鋰金屬(鋰金屬的容量是石墨的十多倍)?如果要用的話需要解決哪些關鍵科學問題?鋰電池領域獲諾貝爾獎創新本質是開創了基于脫嵌機制鋰電池及電極材料,正極相當于一個“旅館C”,負極是“旅館A”,正極和負極都為鋰離子提供進出的存儲“旅館房間”,充電時鋰離子從正極“旅館C”自己“房間”出來到負極是“旅館A” 自己的“房間”,放電鋰離子又從負極回到正極,是定域的可逆的鋰離子運動,很少會產生額外不可逆和不可控反應,體積變化小。可逆性(近似可逆)是鋰電池長時間循環使用的物理基礎。?鋰金屬作為負極的優點是容量高(4400mAh/g),但充放電的本質是不同的,伴隨的是鋰金屬自由生長(非限域)沉積和溶解,引發鋰枝晶的生長和一系列的“不可逆副反應”。

總結一下,鋰電池的關鍵要素,1.正負極材料能存/放多少個離子,電壓多高,構成儲能密度;2.鋰離子在正極里面傳輸出來,傳輸到界面,從界面又要傳輸到負極,這個速度有多快,稱之為充電的功率密度,反向是放電的功率密度。3.充放電及在不同功率下的充放電的可逆性,這個與1和2點往往是矛盾的。?電池和材料如果設計得不好,容量太高和充放電太快(遠離平衡狀態)會引發相結構的演,結構可能產生不可逆破壞。此外,界面不穩定,會波及到晶體結構的相變,嚴重會引發安全性,充放電時結構的穩定性破壞容易釋放出自由基,自由基會點燃有機電解液和相關的可燃物質,引發安全性問題。鋰電池是類似生命的復雜的并有組織的體系,有一系列互相制約要素,這導致鋰電池十幾年來進步雖然有一點,但還是很慢的原因,所以我們用材料基因,大數據和原位大科學裝置表征等方法來發現鋰電池的相關相互結構制約的本質原因。從底層物質和機理的出發,即從原子尺度來發現結構和性能相關性,所對應的一門學科叫做結構化學(也有叫物質結構),結構化學就是研究物質在原子尺度排序和相互作用及其化學物理上所表現的性能。所以我們發展的圖論方法表達它的結構,會更有效地探索材料的基因及其構效關系。

下面會舉一個例子,在研究材料基因中,探索結構基元的相互作用會深入到 更深層次的過渡金屬電子自旋電子相互作用。

>>>?新方法:基于圖論的結構化學和材料基因

我們在2019年在《國家科學評論》定義鋰電池材料基因:功能基元、作用力-鍵、連接-排序。

磷酸鐵鋰為例,為什么磷酸鐵鋰很安全呢?就是因為它有磷酸根,大家知道所有的阻燃物質你去查一下都是含磷的,為什么含磷?因為磷很容易捕獲自由基。磷氧化合物和磷酸根很容易吸水,這兩個要素是它阻燃原因。磷酸鐵鋰有磷氧共價鍵的磷酸根四面體、鋰氧離子鍵八面體和過渡金屬鐵氧配位鍵(離子與共價鍵混合)八面體等三類結構基元。從結構基元來說有磷氧共價鍵穩定使得氧穩定,因此磷氧四面體起到了穩定結構框架的功能基元作用。鋰氧八面體是傳導鋰離子的功能結構基元,鐵氧八面體的鐵從充電(鋰拖出去時候)2價到3價及放電(鋰嵌進去時候)的3價到2價,是儲能功能基團。因此,鋰電池電極材料一般可以解構成傳輸功能基元,儲能功能基元、及構架功能基團。

現在電動車高能量密度的正極是三元高鎳層狀材料,據說特斯拉電動車大量用高容量的材料,大家已經發現其安全性不如磷酸鐵鋰,因為氧的結構基元是氧與過渡金屬層3個過渡金屬連接并與鋰層的3個鋰結合,以此氧只有配位鍵和離子鍵,沒有穩定的共價鍵。

>>>?鋰電池材料篩選:晶體結構與電子結構

從晶體結構大數據我們可以篩選現有的鋰電池和鈉離子電極材料和固態電解質材料,作為電極材料它要兩個關鍵要素,鋰有可傳輸性,遷移能壘,低鋰離子容易移動。我們發展了一種鍵價-Ewald(BV-Ewald)離子遷移模型,高通量發現結構大數據中哪些含鋰或含鈉晶體的Li或Na是“可遷移”的。此外,用于電池材料要求是電子能帶結構的帶隙不寬的半導體(導體更好,鈷酸鋰脫了一些鋰成導體)。用于固態電解質材料要求對電子是絕緣的,電子能帶結構的帶隙要寬。我們可以用結構大數據按照離子可遷移性與電子能帶結構的帶寬去篩選可能的電極材料和固態電解質材料,發現新的結構基元、排序以及可能低成本的元素。

>>>?層狀材料:結構基元與Li擴散路徑

鋰離子在鎳鈷錳3元層狀(NCM)正極材料是怎么傳輸的?我們高端手機用的是層狀鈷酸鋰而電動車許多用的是3元層狀材料。用材料基因分析方法,層狀材料的鋰層由鋰氧八面體,鋰離子滿的時候鋰離子傳輸從一個八面體傳到鄰近一個八面體(八面體-八面體傳輸),受到兩邊過渡金屬的相互作用。當鋰跑了20%左右,鋰離字傾向于從八面體到四面體再到八面體(八面體-四面體-八面體)的傳輸路徑機制,當層間距大對應八面體也大和鋰氧鍵也長,氧對鋰的束縛弱,鋰離子傳輸的能壘會低從而傳輸會快,這是結構基元與鋰離子傳輸相關性的一個關鍵要素。

>>>?層狀材料:中子測量原位全電池Li擴散動力學

2015年我們理論預測層狀3元鋰離子的傳輸機理。現在我們可以用國家(東莞)散裂中子源的衍射譜儀原位檢測實際鋰電池原位鋰離子在不同的電壓下的傳輸動力學路徑,與理論的預測基本一致,新的中子表征觀察發現是當鋰脫出40%以上時,鋰是八面體-八面體以及八面體-四面體-八面體二種傳輸機制同時存在。

>>>?鋰離子高電導:結構基元與協同傳輸

怎么讓鋰離子在固體里面能夠快速傳輸?甚至傳得比電解液更快?最近實驗發現在Li-P-S固態電解質比液體鋰傳輸要快,用材料結構基元及其它的連接方式來研究其鋰離子傳輸機理,發現其快速傳輸的機理是相鄰的鋰離子結構基元之間有互動,就相當于構成一個協同傳輸的超結構基元,一個低能壘結構基元(稱A)的鋰離子傳輸的過程中會影響相鄰結構基元(稱B)的構型從而降低了其傳輸能壘加速B的鋰離子移動和傳輸,B的鋰離子移動反過來又影起A的構型進一步變化使得其能壘更低傳輸更快,形成了正反饋互加速鋰離子的協同傳輸。

>>>?三元層狀鋰電池正極(NMC)?熱穩定性vs 結構基元

鋰電池怎么做得安全和穩定?從材料基因的角度去挖掘結構的穩定性,剖析一下鋰電池的充放電過程,對層狀的材料來說,最重要安全性和穩定性是氧的穩定性。氧的結構基元是氧與過渡金屬層3個過過渡金屬連接并與鋰層的3個鋰結合,以此氧只有與過渡金屬配位鍵和與鋰的離子鍵,沒有穩定的共價鍵。充電的時候把鋰拖出去,氧上的Li從三個鋰變成兩個、再變成一個直到全部脫完。用熱分析發現其熱穩定性從900℃一直會降到150左右,層狀材料的結構穩定性與鋰有沒有在鋰層密切相關,即鋰層是空的及Ni4+會導致氧的穩定性下降。

>>>?構效關系:鋰電池材料d電子結構化學

怎么能夠使得層狀的氧的結構更穩定? 在NMC三元材料總有鋰跑到過渡金屬層同時鎳跑到鋰層來稱之為Li/Ni反位 ,還有過渡金屬是可變價,不同價有不同的自旋電子,比如說鎳二價在八面體有兩個自旋,三價是一個自旋,不同的自旋電子互相作用會導致什么結果?Goodenough教授早年他還沒有做鋰電池的時候,發現自旋電子相互作用一些規律。什么叫化學鍵?自旋向上電子與自旋向下的電子配對,變成一個單鍵。如果過渡金屬通過中間一個氧連接,d-過渡自旋電子之間會形成超交換相互作用,如果3個過渡金屬通過氧為橋梁形成三角的連接關系,3個過渡金屬只有2個有自旋超交換作用第3個沒有自旋電子,這兩個配對是穩定。如果3個都有自旋,這是“三體問題”是不穩定的,它們之間的自旋相互作用就會干擾,這干擾叫磁阻搓,使得原子間的結合力變弱,如果第3個沒有自旋電子,那就沒有磁阻搓,結合力就強。用3體自旋電子相互作用與磁阻搓分析,Li/Ni反位使得鋰到過渡金屬六邊形中間替換成沒有自旋的鋰可以消除磁阻搓。鈷三價沒有d-自旋電子也能消除磁阻搓。可以預見Li/Ni反位量與過渡金屬層的自旋電子數有關,Co3+沒有自旋,含量越多Li/Ni反位越少,Mn4+有3個自旋,Mn4+越多Li/Ni反位越多,我們用中子衍射測量了自旋電子數量與反位數量相互關系,得到相關的相圖,證實了我們的預見。

總之,我們系統研究過渡金屬自旋電子互相作用導致磁阻搓、超交換作用和Li/Ni反位缺陷vs.三元層狀NiCoMn元素各自的作用,揭示Co的作用及替代可能性。基于團隊9篇系列研究論文成果,應邀以封面文章在Acc Chem Res進行總結和展望,大家感興趣可以再看一下。

>>>?三元NMC ?熱穩定性vs 結構基元

Li/Ni反位使得鋰層Ni2+與過渡金屬層的過渡金屬之間有180度的較強的超交換相互作用,有約60meV(室溫是25meV)遠高于室溫的穩定性,該反位在鋰層的鎳氧八面體成為了穩定結構框架的功能結構基元,同時氧的結構基元也更加穩定了。因此,Li/Ni反位缺陷能增強NMC三元層狀的穩定性。

>>>?發現高電壓高容量鈷酸鋰的機理

現在高端手機用的正極材料是鈷酸鋰。自從Goodenough教授發現后用到鋰電池正極大概十幾年,容量穩定應用只能發揮近理論容量(280mAh/g)的一半,即145 mAh/g電壓在 4.2V,超過這個容量和電壓就會出現不穩定,其原因一直不清楚。近幾年發展成功容量180 mAh/g其電壓可以提高到4.5V,有幾篇文章對其原因講得也不太清楚。大家可以去比較幾篇發表文章中4.2V穩定和高電壓穩定4.5V鈷酸鋰材料的多晶x-射線衍射(XRD)譜,看不出什么差別。讓我們問多晶XRD測量方法的本質是什么?它是把多晶的每個顆粒的晶格周期性的衍射信號疊加得平均值,測得衍射方向(hkl)的間距(d-值)是平均值,并不能反映每個顆粒以及一個顆粒的不同位置的原子排列信息。因此,要發現普通鈷酸鋰和高電壓鈷酸鋰的差別一定是要測量微觀結構差別,這需要研究單個晶體顆粒以及一個單晶顆粒不同位置(從界面到晶體中心)的微觀結構。我們與北大化學院孫俊良老師一起用自主改進的3D電子衍射的技術,將透射電鏡的電子束作為衍射粒子/波的源,透過微米大小的鈷酸鋰單晶(透射厚度要在約1-2微米左右或之下),可以選單晶的不同部位來檢測。這個檢測技術可以看到鈷酸鋰不同電壓充放電前后的微觀結構變化。鋰電池材料結構檢測要包括本征結構以及使用過程的結構變化(包括其結構穩定性和變化的可逆性),電池材料在電化學環境下充放電,電子和離子從界面進/出,因此結構的破壞往往會從界面開始。我們用這技術看到了普通和高電壓穩定鈷酸鋰的差別,普通層狀鈷酸鋰的層有不同程度彎曲,在充電(鋰離子脫出,層間距擴大)過程當彎曲會放大,前面講過層間距大鋰離子遷移容易,彎曲層狀結構的層間距是不一樣大的,層間距大鋰離子先脫出,一旦鋰離子脫出在該處的層間距就會進一步擴大,這樣就會形成一個正反饋導致層的彎曲的不斷擴大,彎曲處形成的應力越來越大,當應力積聚到一定程度就可能導致層的斷裂,過渡金屬會發生遷移同時氧原子就有可能釋放出去。相對比的是用該方法檢測發現高電壓鈷酸鋰的層是比較平整的,按照以上討論類推在充電時平的層的層間距是比較均勻的擴大,產生應力的積聚就小,層能保持較高的穩定性,因此能承受高電壓下高容量鋰離子的脫與嵌。

鋰電池層狀材料可以想象成一塊塊木板平堆起來,堆積木板的中間因緊密接觸是平整的,但堆積木板的邊往往會翹起來不易平整,要把它搞平整,在建筑上是在邊上釘釘子來防止它不平或減少彎曲(翹起來)。層狀鈷酸鋰的高電壓的原理與木板堆積相似,要經得起環境的干擾使得堆積從中心到邊緣始終保持一致,因此,其解決方案是在邊緣“釘釘子”。

這個工作就給大家一個啟發和進一步思考什么是物質,什么是材料的基本問題。材料的目標是使用,是使用其性能,這與材料從中心到界面的結構一致性密切相關,特別是與界面的性能有直接的關系的材料。

>>>?發現高性能鋰電池無Co層狀正極材料

回到材料基因,結構基元的最小的單元是元素特征,即其原子或離子的外層電子數,在鋰電池層狀正極材料的過渡金屬的不同價態有不同的d-自旋電子,鈷氧八面體中Co3+?是沒有自旋的,鈷是戰略物資很貴,3元中能不能不要鈷,材料通過Li/Ni反位又可以更加穩定,過渡利用金屬層鎳與反位到鋰層的鎳之間就可以形成180度超交換相互作用把材料變得更穩定。基于這個思想我們設計多元層狀材料沒有鈷,實驗證明可以實現無鈷正極材料并在高電壓下結構更加穩定,開啟無鈷層狀正極材料新材料研發。特斯拉 CEO也講,對大規模使用電動車動力電池,不僅鈷即使鎳也太貴了,因此連鎳都要減少,這是我們正在研究的一大方向。

>>>?界面材料基因vs.電化學體系推動發現界面有序水結構

剛才講到界面是非常重要,尤其是電化學體系,例如鋰離子在電池界面怎么進去又怎么出來?在電池和電催化的環境下,所有的離子都是帶電的,帶電離子會溶劑化,如金屬陽離子要與有機溶劑和水形成溶劑合多面體,電極靜電的作用下在其界面附近會變成有序排列或脫嵌。我們這篇工作與廈大李劍鋒老師合作,在研究電解水制備氫氣,發現水在界面上有兩種結構的水,一種是溶劑水其本身是由氫鍵構成的網絡結構,另一種是4個溶劑水與陽離子配位的溶劑化水,在負電位下的負極與水合陽離子靜電相互作用,把溶劑化的水有效地拉倒電極界面形成有序的排列,并且使得水上帶正電質子與負極的有效距離縮短,形成電子-質子有效的電荷轉移,實現更有效地水分解產生氫氣。總之,原子尺度原位發現電解質溶劑在電極界面的有序結構,對制氫/燃料電池和高功率鋰電池有重要指導意義。

>>>?新范式@新材料

下面總結一下材料研究的新范式,融合大數據、材料基因、知識圖譜可以加速新材料的研究與開發,通過構建鋰電池基因大數據是加速高性能材料研發的新范式 。

>>>?基于圖論和材料大數據 ?創建晶體結構解析系統

還有一個事情跟大家匯報一下,現在有些國家對我們實行科技軟件的禁運,包括兩三個物質結構分析軟件,這些分析軟件的功能是從材料的x射線衍射數據模擬和判斷出物相、解出基本結構和精修結構存在的缺陷,這些結構分析軟件用的是我們上面講科學范式的第三個范式—基于模擬和計算。

>>>?材料基因大數據@ 結構解析(新范式解決晶體結構軟件卡脖子的挑戰)

我們既然有了材料基因大數據,可以用第四個新范式—基于大數據驅動的解決方案,將其用于的材料結構解析,融合材料大數據、人工智能和材料基因,我們自主發展物質結構的解析的系統,現在放在網上(www.pkusam.com)給大家公開免費試用,你只要把x射線衍射數據及其化學元素組成輸進該解析系統,就可以自動的得到物相信息和結構的原子位置。我們的原理類似于現在經常用的“人臉識別”—運用人工智能算法把被檢測的特征數據提取與大數據進行智能比對,進行快速的識別(而不是模擬)。?我們用新的范式解決了國家科技軟件一個卡脖子問題,同時可以加速大家的材料研究。

>>>?展望:圖論@結構化學 vs 新材料

加速材料研究,可以同時進行正向(自下而上)方法,從底層的物質結構(原子結構與電子結構)、結構大數據結合人工智能算法、由結構基元及其排序與相互作用的材料基因到新材料的設計與計算及其制備與表征。同時可以進行逆向設計,從需求出發來設計材料,尋找適合的功能結構基元與相關的元素及其它們的排序和相互作用。然后進行可控制備和測量結構與性能,看是否與預想的一致,特別是運用同步輻射x射線和中子大科學裝置進行原位與非原位的高精度測量材料制備及其應用過程中的結構演化。總之,這種基于圖論結構化學和材料大數據、大科學裝置等開展正向和逆向的預測與實驗的循環迭代,是加速新材料從基礎研究和產業應用的新范式。

分享到