兩院院士,再發Science!


一、【科學背景】

合成復雜有機分子的能力對于發現和制造功能性化合物(包括小分子藥物)至關重要。這一過程通常是通過緩慢、費力、反復的設計-制造-測試-分析(Design-make-test-analyze, DMTA)循環進行的。新興的機器學習(ML)工具可以生成新的候選分子,預測其性質,并通過計算機輔助合成規劃(Computer-aided synthesis planning, CASP)提出反應路徑。化學自動化方面的進步可以在人工設置之后,以最少的人工干預實現化學合成和表征。將以上流程以及化合物純化、表征整合到DMTA工作流程中,可以開發出自主化學發現平臺,無需人工重新配置即可在不同的化學空間中運行。盡管這些演示強調了集成預測工具和化學自動化的潛力,但它們的專業實施限制了執行的化學類型、可實現的結構類型,特別是這些平臺可以探索的化學空間。在2019年,麻省理工學院Klavs F. Jensen教授(美國國家科學院、國家工程院兩院院士)團隊在Science上發表了一種結合AI設計合成路線和機器人執行的自動化合成平臺,能夠為給定分子提出最佳合成路線并執行所有合成操作流程,實現自動化合成。在此基礎上,該團隊近期再次在Science上發表開發了一個由集成機器學習工具驅動的閉環自主分子發現平臺,以加速具有所需性質的分子的設計。

二、【科學貢獻】

本研究展示了針對吸收波長、親油性和光氧化穩定性的兩個染料類分子案例研究。在第一項研究中,該平臺通過分子DMTA循環的三次自動迭代,實驗性地實現了294種未報道的分子,同時探索了四種鮮有報道的支架的結構-功能空間。在每次迭代中,指導探索的性質預測模型學習了不同支架衍生物的結構-性質空間,這些衍生物是通過多步合成和各種反應實現的。第二項研究利用在探索過的化學空間和以前報告過的分子上訓練過的性質模型,在探索較少的結構-性質空間內發現了9種性能最好的分子。

1? 綜合平臺以及平臺預測并成功執行的反應概述 ? 2023 AAAS

?

為了證明模型的開發,研究人員選擇優化二苯并噻唑酮(BPT),這是一種有前景的支架,具有足夠的環化產率和測試實驗中良好的模型一致性,適量的現有數據點提供了發現新分子的機會,并且與其他常見染料家族具有結構相似性。研究人員用三個例子更新了代表有希望命中的支架的性質模型,并促使該平臺發現同時最大化吸收波長、最小化分配系數和最小化光降解率的先導分子。

2? 模型開發案例研究 ? 2023 AAAS

?

三、【創新點

本研究開發了一個由集成機器學習工具驅動的閉環自主分子發現平臺,以加速設計具有所需特性的分子。在實際應用中,展示了針對吸收波長、親油性和光氧化穩定性的兩個染料類分子案例研究,在探索較少的結構-性質空間內發現了9個性能最好的分子。

 

四、【科學啟迪】

綜述,本研究展示了一個DMTA循環,它可以探索化學空間并利用已知化學結構,而無需人工實驗。該平臺提出、合成并表征了303個未報道的染料類分子,它們分布在四個探索支架和一個利用支架上。該集成平臺可通過搜索具有所需性質的結構(命中)來探索未知的結構-性質空間,并可通過優化有希望的候選結構(先導)來利用已表征的結構-性質空間。閉環集成平臺的進一步發展有望加速分子發現。

 

原文詳情:https://www.science.org/doi/10.1126/science.adi1407

本文由大兵哥供稿。

分享到