東北師大Nature Communications:基于憶阻器實現廣義BCM學習規則及時空學習功能


【研究背景】

類腦神經形態計算具有高能效、并行性、容錯性以及自主認知等優勢,被視為最有希望突破“馮·諾依曼瓶頸”的顛覆性技術。實現仿生大腦突觸的自主學習功能是發展神經形態計算的關鍵基礎。憶阻器作為一種新型離子—電子耦合器件,因其結構、功能與生物突觸高度相似,且兼具信息存儲與處理功能,是構建存算一體化神經形態計算系統的理想方案。

脈沖刺激頻率依賴可塑性(Spiking-Rate-Dependent Plasticity, SRDP)是一種重要的生物突觸調節特性,其典型代表是神經科學家Bienenstock,Cooper及Munro提出的BCM學習規則,它具有低頻抑制、高頻增強的閾值滑移效應。特別是,BCM學習規則能夠為視覺皮層中高階時空識別功能提供理論基礎(如:基于頻率的方向選擇性)。但是,目前報道的利用憶阻器實現BCM學習規則多采用單一的突觸前脈沖刺激方式,一方面不能完整地模擬BCM學習曲線,另一方面由于缺乏長時可塑性效應,限制了其在視覺時空圖像識別等領域的應用。因此,利用憶阻器準確實現基于頻率的時空特異性功能是一個具有挑戰性的問題。

【成果簡介】

近期,東北師范大學劉益春教授、徐海陽教授課題組與意大利米蘭理工大學合作,在Nature Communications上發表題為“Toward a generalized Bienenstock-Cooper-Munro rule for spatiotemporal learning via triplet-STDP in memristive devices”的研究論文,首次報道了在憶阻器上利用三脈沖時序可塑性(Spiking-Timing-Dependent Plasticity, STDP)成功模擬了廣義BCM學習規則,進一步通過設計憶阻器雙層神經前饋網絡實現了具有頻率特性的時空學習功能。

研究者制備了基于Pt/WO3-x/W結構的憶阻器,利用內/外電場協同作用誘導亞穩態氧離子的定向移動,改變了WOx界面費米能級,從而實現了肖特基勢壘和界面電阻的連續調制,獲得了多種基本突觸學習功能。更重要的是,研究者通過模擬突觸的三脈沖STDP并將其延伸至BCM學習規則,彌補了傳統憶阻體系中“增強抑制效應”的缺失,再現了完整的BCM學習曲線。通過調控器件在不同電導初始狀態下的離子動力學過程,高度還原了BCM學習曲線的“閾值滑移效應”。數值計算發現,實驗曲線與生物神經系統的三脈沖BCM數學模型高度吻合。進一步,為了獲得視覺皮層中的高階時空模式識別功能,研究者設計了一種基于憶阻器的雙層神經前饋網絡,以81個突觸前神經元和4個突觸后神經元分別作為輸入和輸出層。輸入信號為具有高頻和低頻的四種定向模式(0°, 45°, 90°, 135°),同時將BCM曲線作為該神經網絡的學習準則,在憶阻器陣列前饋網絡中成功驗證了基于頻率的定向選擇性,展現了憶阻器用于時空特異性學習的潛在能力。

【全文總結】

本文基于界面型氧化物憶阻器實現了三脈沖STDP功能,并將其推廣至BCM學習規則,成功彌補了傳統憶阻體系所缺失的“增強抑制效應”。通過構筑憶阻器雙層神經前饋網絡,實現了具有頻率特性的方向選擇性,展現了其時空特異性學習的能力。本研究不僅為完整模擬BCM學習規則提供了新途徑,而且為憶阻器未來應用于高階時空學習提供了新思路。

【圖文導讀】

圖一 基于Pt/WO3-x/W二階憶阻器的人工神經突觸。

a) 生物神經突觸的脈沖序列示意圖。

b) Pt/WO3-x/W憶阻器陣列的掃描電鏡圖以及器件截面透射電鏡圖。

c) 器件連續I-V掃描圖。

d) 器件連續正負脈沖測試圖。

e) 器件電導馳豫過程圖。

圖二 基于Pt/WO3-x/W憶阻器模擬突觸頻率依賴的自適應功能。

a) 器件模擬突觸EPSC現象。

b) 器件模擬突觸PPF現象。

c) 器件模擬突觸的頻率依賴性。

d) 器件電導隨突觸后脈沖序列的變化。

e) 器件在不同初始態下的“頻率閾值滑移效應”。

f) 生物系統中的BCM曲線。

圖三 基于Pt/WO3-x/W憶阻器實現三脈沖STDP功能及廣義BCM學習規則。

a) 兩種三脈沖STDP信號設計示意圖。

b) 器件在不同初始狀態下模擬時間對稱的三脈沖STDP現象。

c) 器件模擬時間不對稱三脈沖STDP現象。

d) 器件在“1Pre-2Post”三脈沖STDP框架下的統計結果圖。

e) 器件再“2Pre-1Post”三脈沖STDP框架下的統計結果圖。

f) 器件電導對突觸前/后頻率的依賴性。

g) 器件在不同初始態下實現含有“增強抑制效應”的完整BCM曲線及其 “頻率閾值滑移”特性。

圖四 基于廣義BCM學習規則數學模擬基于頻率的方向選擇性功能。

a) 器件實驗數據點與BCM模型數值計算曲線的擬合。

b) 基于憶阻器陣列的雙層前饋網絡示意圖。

c) 電導隨學習迭代次數在四個特定方向下的變化。

d) 與四種特定方向對應的突觸后頻率隨學習迭代次數的變化。

e) 憶阻器陣列在四種特定方向下的電導色彩圖。

文獻鏈接:Toward a generalized Bienenstock-Cooper-Munro rule for spatiotemporal learning via triplet-STDP in memristive devices. (Nat. Commun. 2020, 11:1510. DOI: 10.1038/s41467-020-15158-3)

【課題組介紹】

劉益春,東北師范大學教授,博士生導師。現任國際發光會議(ICL)程委會委員(2020大會主席)、國際II-VI族化合物材料會議顧委會委員、WILEY國際學術期刊《InfoMat》副主編。國家杰出青年科學基金獲得者,中國科學院百人計劃,教育部跨世紀優秀人才。長期從事氧化物半導體材料與信息器件領域的科研與教學工作,相關成果作為第一完成人榮獲國家自然科學二等獎2項、國家教學成果一等獎1項。

分享到