Nature Chemistry:通過深度學習和高通量實驗進行藥物分子后期衍生化
一、【導讀】
在藥物發現中,后期功能化是一種經濟高效的方法,用于優化藥物候選化合物的性質。然而,藥物分子的化學復雜性常常使得后期多樣化變得具有挑戰性。來自蘇黎世聯邦理工學院Gisbert Schneider、羅氏創新中心(Roche Innovation Center) Rainer E. Martin、Uwe Grether、慕尼黑大學David B. Konrad等報道基于深度學習和高通量實驗篩選,搭建了藥物分子后期衍生化的平臺,在考察后期官能團化的關鍵硼基化反應時,理論計算模型預測反應產物的誤差達到4-5 %,而且對已知或未知反應物的反應分類準確率分別達到92 %和67 %,對主要產物的區域選擇性準確性的F值達到67%。
二、【成果掠影】
作者通該研究采用兩步方法生成機器學習數據。第一步,基于已批準藥物的聚類分析選擇了23種結構多樣的藥物分子作為底物。第二步,使用高通量實驗(HTE)在不同條件下生成了所選藥物分子的反應結果數據。不同的圖神經網絡(GNNs)針對二維、三維和原子部分電荷增強的分子圖進行訓練,以預測二元反應結果、反應產率和區域選擇性。GNNs在預測反應產率和二元反應結果方面比基準模型取得了更高的準確性。對GNNs性能的影響進行了評估,并展示了預測結果的圖表和性能指標。相關研究成果以“Enabling late-stage drug diversification by high-throughput experimentation with geometric deep learning”為題發表在國際知名期刊Nature Chemistry上。
三、【核心創新點】
1、通過HTE設置和液相色譜-質譜分析獲得了23種藥物化合物的反應結果數據。實驗數據分析管道確定了二元反應結果和反應產率。
2、量化了立體和電子信息對模型性能的影響,并引入了一種簡單易用的反應格式,為深度學習和高通量實驗的無縫集成提供了關鍵支持。
四、【數據概覽】
圖 1 硼化多樣化機會和研究概述 ? 2023 Nature
(a) 藥物分子的后期硼化
(b) 研究概述
圖2 篩選板概述和GNN架構 ? 2023 Nature
(a)實驗中使用的 24 孔硼化篩選板的示意圖
(b)基線模型由前饋神經網絡組成
(c)深度學習平臺的路線
圖3 二元反應結果、反應產率和區域選擇性預測的結果 ? 2023 Nature
(a)實驗數據集上反應產率預測的性能
(b)閾值≥1%的二元反應結果預測的混淆矩陣
(c)用于 aGNN3DQM 測試集中非季碳預測的混淆矩陣
(d)研究的神經網絡在四種不同任務中的性能
(e)由神經網絡預測的三種藥物和三個片段的未見底物的二元反應結果所預測的經過驗證的硼化機會的選定示例
圖4 . 硼化區域選擇性預測的選定示例 ? 2023 Nature
(a)前 20% 和后 20% 的兩個反應的結果
(b)從羅氏遺留項目的分布外反應中獲得的回顧性結果
(c)在文獻數據集上訓練的區域選擇性預測模型的前瞻性實驗驗證
(d)空間位阻和定向官能團對來自文獻數據集測試集的六個選定示例的區域選擇性預測的影響
五、【總結】
總之,作者通過幾何深度學習和高通量實驗,實現了后期藥物多樣化的功能化平臺,成功識別了23種不同藥物分子的結構多樣化機會,并對反應產物的反應性、選擇性和產率進行了準確預測。本研究的結果證實了幾何深度學習平臺在生物有機和藥物化學中的實際適用性及其對實驗室自動化的潛在益處。該方法通常成功地應用于評估 F. Hoffmann-La Roche Ltd 藥物發現項目中硼化機會的二元反應結果、反應產率和區域選擇性。標準化 HTE 不斷生成額外的數據點,以進一步增強提出了計算模型。
原文詳情:
Enabling late-stage drug diversification by high-throughput experimentation with geometric deep learning. Nature Chemistry. ?DOI: 10.1038/s41557-023-01360-5.
本文由尼古拉斯供稿
文章評論(0)