imgboxbg

解决方案

1/1
浏览量:
1000

化学反应的贝叶斯优化

BIOVIA Pipeline Pilot作为一个包容性的工具脱颖而出,使可能缺乏编码专业知识的科学家能够利用先进的机器学习方法。
浏览量:
1000
所属分类
数据挖掘
数量
-
+
方案详情

摘要:

随着机器学习技术对化学研究的影响越来越大,可访问性问题仍然存在,特别是以编码为中心的解决方案的流行。BIOVIA Pipeline Pilot作为一个包容性的工具脱颖而出,使可能缺乏编码专业知识的科学家能够利用先进的机器学习方法。

 

引言:

在发现和过程化学中,一个共同的挑战是通过最少的实验找到最佳的反应条件,包括催化剂和配体的选择。当反应空间很大,并且由于成本或时间限制,可以进行的实验数量有限时,这个问题尤其严重。

 

如果系统的知识和初始实验离全局最优值很远,传统的优化方法可能是耗时和昂贵的。贝叶斯优化(BO)形式的机器学习被证明特别适合化学反应优化的挑战,因为它适用于小数据集,可以探索非常大的反应空间。

 

在化学应用中已经报道了一些用于贝叶斯优化的开源python包,然而,许多只有具有编码专业知识的科学家才能使用。‡假设我是一名实验室科学家,希望使用存储在电子实验室笔记本(ELN)中的实验数据进行贝叶斯优化。我该怎么做呢?

 

一种解决方案是使用BIOVIA Pipeline Pilot8从BIOVIA Notebook9 ELN中提取和处理数据,运行贝叶斯优化代码,然后使用下一轮建议实验更新ELN条目。通过利用Pipeline Pilot的功能,我们可以构建一个利用现有组件来执行大部分数据提取和操作的协议。

初始贝叶斯优化:

对于本例,我们将使用Doyle及其同事报告的EDBO+ Python包4和从Syngenta最近发表的一篇文章中获得的数据集,该数据集探索了Ullmann型C-N耦合的贝叶斯优化,旨在最大化反应产量Python包是通过Pipeline Pilot中的Jupyter Notebook组件访问的。

 

将初始8个实验的实验数据输入到Notebook ELN的实验中,并对EDBO+包中实现的分类特征使用one-hot编码。

该协议包括以下几个步骤:

1.根据反应组分的每种组合生成一个实验范围。在这个例子中有138240个实验。

2.在与实验范围合并之前,从相应的Notebook实验中提取并清洗实验数据。

3.运行贝叶斯优化建议下一组优化反应产率的实验。

4.用下一个要运行的实验更新Notebook条目。

通过将新的实验数据输入ELN并重新运行协议,可以重复多次贝叶斯优化循环,直到发现产生最高收率的反应。

 

增加了DFT特征的复杂性:

通过用DFT衍生的分子描述符编码一些分类特征,可以将额外的复杂性层构建到Pipeline Pilot中的贝叶斯优化协议中。使用SMILES字符串作为输入,我们可以使用Pipeline Pilot生成3D坐标,执行一致性搜索,并使用BIOVIA Pipeline Pilot Solvation Chemistry collection或BIOVIA Pipeline Pilot Materials Studio collection中的现有组件运行DFT计算。构建和运行这些协议不需要编码专业知识。

 

然后,DFT特征可以用于更新的贝叶斯优化协议(图3)。此外,该协议可以配置为通过Pipeline Pilot Web Port运行,这样实验科学家只需要选择文件位置、模型输入和目标列。在每个Bayesian优化循环之后会生成一个简单的报告仪表板,以便科学家可以查看每次迭代的进度,以达到最佳的反应条件(图4)。

 

结论:

一系列机器学习技术正被应用于化学反应,目的是增加实验发现和过程开发。大多数开源代码是用Python开发的,需要精通编码。BIOVIA Pipeline Pilot可用于普及这些先进的机器学习方法,为没有编码专业知识的科学家提供在工作中部署最新技术的能力。

 

References:

(1)Ishii, A.; Kamijyo, R.; Yamanaka, A.; Yamamoto, A. BOXVIA: Bayesian Optimization Executable and Visualizable Application. SoftwareX 2022, 18, 101019.

 

(2)Nambiar, A. M. K.; Breen, C. P.; Hart, T.; Kulesza, T.; Jamison, T. F.; Jensen, K. F. Bayesian Optimization of Computer-Proposed Multistep Synthetic Routes on an Automated Robotic Flow Platform. ACS Cent. Sci. 2022, 8 (6), 825–836.

 

(3)Hickman, R. J.; Aldeghi, M.; Häse, F.; Aspuru-Guzik, A. Bayesian Optimization with Known Experimental and Design Constraints for Chemistry Applications. Digit. Discov. 2022, 1 (5), 732–744.

 

(4)Torres, J. A. G.; Lau, S. H.; Anchuri, P.; Stevens, J. M.; Tabora, J. E.; Li, J.; Borovika, A.; Adams, R. P.; Doyle, A. G. A Multi-Objective Active Learning Platform and Web App for Reaction Optimization. J. Am. Chem. Soc. 2022, 144 (43), 19999–20007.

 

(5)Shields, B. J.; Stevens, J.; Li, J.; Parasram, M.; Damani, F.; Alvarado, J. I. M.; Janey, J. M.; Adams, R. P.; Doyle, A. G. Bayesian Reaction Optimization as a Tool for Chemical Synthesis. Nature 2021, 590 (7844), 89–96.

 

(6)Wang, Y.; Chen, T.-Y.; Vlachos, D. G. NEXTorch: A Design and Bayesian Optimization Toolkit for Chemical Sciences and Engineering. J. Chem. Inf. Model. 2021, 61 (11), 5312–5319.

 

(7)Häse, F.; Roch, L. M.; Kreisbeck, C.; Aspuru-Guzik, A. Phoenics: A Bayesian Optimizer for Chemistry. ACS Cent. Sci. 2018, 4 (9), 1134–1145.

 

(8)Pipeline Pilot. https://www.3ds.com/products-services/biovia/products/data-science/pipeline-pilot/.

 

(9)BIOVIA Notebook. https://www.3ds.com/products-services/biovia/products/laboratory-informatics/electronic-lab-notebooks/biovia-notebook/.

 

(10)Braconi, E.; Godineau, E. Bayesian Optimization as a Sustainable Strategy for Early-Stage Process Development? A Case Study of Cu-Catalyzed C-N Coupling of Sterically Hindered Pyrazines. ACS Sustain. Chem. Eng. 2023, 11, 10545–10554.

 

(11)BIOVIA Pipeline Pilot Solvation Chemistry Collection.

 

(12)Materials Studio Collection. https://www.3ds.com/products-services/biovia/products/molecular-modeling-simulation/biovia-materials-studio/materials-studio-collection/.

 

*Doyle and co-workers have released a user-friendly web version of EDBO+ which is free for academic users.

 

文章详情:https://blog.3ds.com/brands/biovia/bayesian-optimization-of-chemical-reactions/

 

公司简介:

北京泰科博思科技有限公司(Beijing Tech-Box S&T Co. Ltd.)成立于2007年,是国内领先的分子模拟及虚拟仿真综合解决方案提供商。

 

北京泰科博思科技有限公司与国际领先的模拟软件厂商、开发团队深入合作,为高校、科研院所和企业在材料、化工、药物、生命科学、环境、人工智能及数据挖掘、虚拟仿真教学等领域提供专业的整体解决方案。用户根据需要在我们的平台上高效的进行各种模拟实验,指导实际的生产设计。

 

北京泰科博思科技有限公司拥有一支一流的技术服务团队和资深的专家咨询团队,以客户真正需求出发,服务客户,为客户创造价值。我们秉承“职业、敬业、担当、拼搏、合作”的企业精神,致力于用国际领先的软件产品和专业全面的技术支持服务,成为客户可信赖的合作伙伴。 

关键词:
BIOVIA Pipeline Pilot
未找到相应参数组,请于后台属性模板中添加

©北京泰科博思科技有限公司   /   京ICP备09107432号-1   

网站建设:中企动力 北京