MIT团队化学发现落地经验总结 01自动化和机器学习结合自动化和机器学习的结合可能是实现快速、多样化分子化学发现的基础针对设定特定属性的分子,可以先在非生物系统上进行验证,因为底层工作流是相同的,但更容易启动机器学习可以用在ReactionDiscovery、ProcessOptimization、MolecularDiscovery 4。分子图表征能够系统地捕捉更多信息 02分子生成为了生成新的分子,可以使用graphtograph模型,以迭代方式将性能较差的分子推向性能较好的分子使用迭代graphtographtranslation方法可以提高目标结构的溶解度对于分子图生成,通过使用带有基序的编码器解码器可以避免逐个原子生成的限制基于基序的层次图完成模型可以在不需要逐个原子构建分子的情况下完成包含环分子生成模型是生成大量待考虑候选分子的通用工具 03分子属性预测器使用基于消息传递神经网络的Chemprop来设计一般化学性质的空间并建立筛选模型,可以从集成的Chemprop训练模型中获得明显预测确定性的估计graphcompletion生成可合成的分子,可以覆盖目标属性空间的广泛区域 04反应路径 一旦选择了分子,需要确定在自动化管道中合成分子的路径TheJensenlabandothersatMIT已经为有机合成预测开发了ASCKOS工具,包括了许多软件包,可以对反应和过程化学进行深入分析和预测,使用ASKCOS,借助计算机辅助合成规划软件可以自动生成反应路径 05分子选择 1。通过有策略地选择产物,可以找到具有共同节点和多样化功能路径的反应树 06机器人执行 构建了基于wellplates的批量合成平台 1。平台中间纯化和高效液相色谱分离的组合用于研究在平台上执行化学反应 2。基础光谱测量在平台上完成自动化,可以用于表征其他与染料相关的特性 07实验数据 1。利用基本光谱测量,导出了其他相关性质,如分配系数和光稳定性 2。直接光解活化能的测量可以作为用chemprop选择耐光染料的指导分子特性 08DatafromExperimentsPropertyPredictors 1。通过实验实现选定的分子,可以将表征数据反馈到模型中,用于指导额外的迭代 油管视频请关注该微信公众号 利用属性预测模型和计算机辅助合成规划来驱动自动多属性分子发现平台 01自动化和机器学习结合 1。自动化和机器学习的结合可能是实现快速、多样分子化学发现的基础 将传统的高通量实验和机器学习化学发现结合起来,吸收各自优点,弥补不足 传统的高通量实验 优点:快速、自动化、一致、范围窄 缺点:试验设计慢 文献:Santanilla,A。B。,etal。Science2015 机器学习化学发现 优点:快速的试验设计,多样性的 缺点:慢的试验验证 文献:Tkatchenko,A。,etal。NatureComm。,2020 2。MIT在机器学习和机器人技术的界面上自主设计具有多个属性目标的新分子 多属性包括: (1)OrganicElectronics SingletTripletSplitting、OscillatorStrength、ExcitedStateLifetime、Spectra 文献:GomezBombarelli,etal。Science,2016 (2)ReactionDiscovery Structurecharacterization,Mechanismdiscovery,substratescopestudies,Processchemistry 文献:Bort,etal。,ScientificReports,2021 (3)Pharmaceuticals Bioactivity,Biotoxicity,Solubility,Stability (4)EnergeticMaterials Heatofformation,Detonationpressure,Detonationvelocity,Density 文献:Elton,D。C。,etal。arXiv,2018 3。MIT:有多种工具正在积极构建和改进,可用于驱动自主化学发现平台 机器学习模型正在开发应用不同的化学模块 (1)ReactionDiscovery(newandormoreefficientpathways) (2)ProcessOptimization(describetheyieldconditionresponsesurface) (3)MolecularDiscovery(newmoleculesusingknowchemicaltransformation) 4。化学发现周期从确定目标开始,以评估分子和模型的性能 (1)如何设计针对特定属性的分子 (2)MIT证明所有的部分都可以在非生物系统上工作 (3)对于非生物系统,底层工作流是相同的,但更容易启动 初始的发现任务: Target增加数据集的最大吸收 Constraints约束吸收最大值(FA3),SAScore MoleculeSelection基于新颖性的分子选择手动过滤器 5。分子图表征能够系统地捕捉更多信息 02分子设计 6。为了生成新的分子,我们可以使用GraphtographTranslation,以迭代方式将性能较差的分子推向性能较好的分子 GraphtographTranslation 对于多属性目标,分子的各个部分通常会贡献自己的功能 通过提取好的分子片段并以有趣的新方式排列它们来产生新的目标 文献:Jin,W。,etal。,arXivpreprintarXiv:1812。01070(2018) 代码:https:github。comwengongjiniclr19graph2graph 7。使用迭代使用GraphtographTranslation方法提高目标结构的溶解度 文献:Bilodeau,C。,etal。,React。Chem。Eng。,2022,7,297309 8。对于分子图生成,通过使用带有基序的编码器解码器来避免逐个原子生成的限制 文献:Wengong,J。,Barzilay,R。,Jaakkola,T。,Int。ConfonMachineLearning。PMLR,2020 9。基于基序的层次图完成模型可以在不需要逐个原子构建分子的情况下完成包含分子的环 文献:Wengong,J。,Barzilay,R。,Jaakkola,T。,Int。ConfonMachineLearning。PMLR,2020 10。生成模型是生成大量待考虑候选分子的通用工具 GraphtoGraphtranslationmodel 文献:Jin,W。,etal。,arXivpreprintarXiv:1812。01070(2018) 代码:https:github。comwengongjiniclr19graph2graph Graphcompletionmodel 文献:Wengong,J。,Barzilay,R。,Jaakkola,T。,Int。ConfonMachineLearning。PMLR,2020 文献:Bilodeau,C。,etal。,React。Chem。Eng。,2022,7,297309 03分子属性预测器 11。MIT使用基于消息传递神经网络的Chemprop来设计一般化学性质的空间并建立筛选模型 文献:J。Chem。Inf。Model。2019,59,33703388 代码:http:chemprop。csail。mit。edu 12。可以从集成的Chemprop训练模型中获得明显预测确定性的估计 文献:J。Chem。Inf。Model。2020,60,26972717 13。对于MIT的测试设计空间,使用了一组Chemprop模型,这些模型是从测量属性的实验数据集训练而来 文献:UVVis:Greenman,K。P。,Green,W。H,GomezBombarelli,R。,Chem。Sci。,2022,13,11521162 文献:Chung,Y。,Vermeire,F。H。,Green,W。H。,etal。,J。Chem。Inf。Model,2022,62,433446 14。graphcompletion生成可合成的分子,可以覆盖目标属性空间的广泛区域 03反应路径 一旦选择了分子,需要确定在自动化管道中合成分子的路径 15。TheJensenlabandothersatMIT已经为有机合成预测开发了ASCKOS工具 文献:https:mlpds。mit。edupapers Coley,C。W。,etal。,ACSCent。Sci。2017 askcos。mit。edu 16。使用ASKCOS,借助计算机辅助合成规划软件可以自动生成反应路径 ASKCOS开发团队已经包括了许多软件包,可以对反应和过程化学进行深入分析预测 05分子选择 通过有策略地选择产物,可以找到具有共同节点和多样化功能路径的反应树 06机器人执行 构建了基于wellplates的批量合成平台 (1)得到了吞吐量和灵活性的良好平衡 (2)非常支持基于属性的化学发现 (3)允许我们同时进行化学反应 平台中间纯化和高效液相色谱分离的组合用于研究在平台上执行化学反应 基础光谱测量在平台上完成自动化,可以用于表征其他与染料相关的特性 07实验数据 利用基本光谱测量,导出了其他相关性质,如分配系数和光稳定性 直接光解活化能的测量可以作为用chemprop选择耐光染料的指导分子特性 08DatafromExperimentsPropertyPredictors 通过实验实现选定的分子,可以将表征数据反馈到模型中,用于指导额外的迭代 有多种工具正在积极构建和改进,可用于驱动自主化学发现平台