解决方案
【COSMOlogic 应用实例】用于CO2捕集的阴离子功能化离子液体的热物理性质预测
摘要:
作者开发了一个机器学习框架,用于预测用于CO2捕获的阴离子功能化离子液体的密度、粘度和热容量,特别是那些具有四烷基膦离子和非质子n-杂环阴离子(AHAs)的离子液体。作者使用基于组贡献(GC)的描述符和从COSMO-RSsigma profile(SP)中提取的描述符筛选多个特征集,以构建支持向量回归(SVR)和梯度增强回归(GBR)机器学习模型。粘度和密度分别基于包含近60个ILs的数据集进行建模。粘度的最佳拟合使用基于gc的描述符和SVR模型,测试集%AARD为12.5%,R2为0.989。密度使用相同的描述符与SVR模型框架进行建模,并使用测试集%AARD为1.0%进行拟合。热容作为摩尔体积和温度的函数拟合,这是一个家族中所有il的一般趋势。然后可以使用密度SVR模型进行热容预测,测试集精度为3.0% AARD。有了这些结果,作者开发了预测模型,可以潜在地用于设计用于碳捕获的新型先进离子液体。
引言:
随着世界各国制定缓解大气二氧化碳浓度上升的战略,同时应对不断增长的能源需求,可能需要有效的碳捕获技术,以减少现有化石燃料发电的排放。
基于群贡献(GC)的描述符是构成描述符,也被用于预测本研究感兴趣的几种IL性质。例如,Gharagheizi等人使用GC描述符和多元线性回归模型来估计大型一般il集的粘度。这类描述符也被用于预测熔点和二氧化碳溶解度。GC描述符很有吸引力,因为它们直观地对应于结构;然而,出于设计优化的目的,它们可能不太理想,因为它们是离散的(而不是连续的)变量。
方法:
在本节中,将讨论如何组装和处理热物性数据,如何生成群贡献和cosmos-rs特征,回归和评估过程,以及如何处理热容,因为它取决于密度。
该组527个粘度观测值的分布如图1所示,数据见表S1。
以三乙基(辛基)磷1,2,4-三唑烷为例,如图2所示。
使用GC描述符集构建的SVR模型对于测试集具有最佳的%AARD和R2,并且对于5重交叉验证具有最佳的平均%AARD。图3和表4显示了使用GC、所有四个基于sigma-profile(SP51、SP9、SP15和SP19)的描述符集和使用SP9和其他非aha数据(SP9+NA)的增强数据集预测SVR和GBR模型测试集ILs粘度的性能,上述模型预测5倍集ILs粘度的性能也在表4中给出。
COSMOTHERM软件生成的sigma剖面在筛选电荷轴上以0.001e/Å2(e表示基本电荷)分隔的等大小的箱中进行分类。此外,作者对COSMOtherm输出的所有51个箱子进行了回归,每个箱子的宽度为0.001e/Å2(SP51)。
最终,由于GC支持向量回归模型在测试和交叉验证方面的优异性能,作者选择了GC支持向量回归模型,这些模型的测试集和5倍CV集的奇偶图如图4所示。
以三乙基(辛基)磷1,2,4-三唑烷为例,如图5所示。
图6和表5将使用这些协方差修复方法构建的粘度模型与未使用协方差修复的模型的性能进行了比较。
最后,为了使SP-Cov模型的结果合理化,作者通过分析SP-Cov特征与GC特征之间的相关性,将SP-Cov特征与GC特征进行了比较,这种分析的热图如图7所示。
为了与黏度模型保持一致,最终选择GC/SVR模型,拟合结果如图8所示。
为了拟合和预测热容数据,首先作者将13个训练il的体积热容数据拟合到式(4)中,这导致了一个相当好的拟合,其%AARD为2.9%。得到的模型如下图9所示:
在图9中,虚线两侧的灰色阴影区域拟合代表预测体积热容的±5%。图中还以红色虚线表示Paulechka等人的拟合结果,该曲线两侧分别用红色阴影表示±5%的值。
利用这些密度,根据式(5)估计的体积热容,以及每个IL的分子量,预测了摩尔热容,相对于实验数据有3.0%的误差。这一预测的结果显示在图10中的奇偶图中。
总结:
作者在nornd等人开发的框架上进行了扩展,以预测磷酸AHA离子液体的粘度、密度和热容量。这是一种重要的ILs,可以与二氧化碳可逆反应,具有二氧化碳捕获应用的潜力。从COSMO-RSsigma剖面中提取特征的几种bin大小被考虑为提取的特征及其对回归的影响之间的协方差。作者筛选了多个SVR和GBR模型,分析了群体贡献(GC)和几个基于COSMORS sigma-profile的描述符集,并确定了基于GC的描述符的SVR模型对该数据集的预测效果最好。最终目标是将这些模型整合到化学过程和材料设计框架中,以帮助发现更好的用于二氧化碳捕获的AHA il。
文章详情:https://doi.org/10.1016/j.molliq.2023.123634
北京泰科博思科技有限公司是COSMOLOGIC官方指定代理商,有关软件详情或者技术支持请咨询北京泰科。
电话:010-64951848
邮箱:sales@tech-box.com.cn
北京泰科为广大学习分子模拟科研人员提供了交流讨论平台,泰科建立了Turbomole交流群,群里有专业老师解答问题,如有兴趣一起交流,欢迎来电/邮申请入群,作者期待您的参与!
北京泰科涉及行业
材料研发
基于BIOVIA Materials Studio材料设计平台,提供涉及电池、航空航天、国防军工、建筑、涂料涂层等多领域材料研发软件及综合解决方案。
药物研发
针对药物设计、药物研发等提供基于Discovery Studio、COSMOLOGIC等软件的ADME、构象比对、溶剂筛选、结晶、成盐、共晶筛选、稳定性、溶解度pKa、分配系数等性质的模拟预测软件及方案。
化工设计
面向精细化工、新能源、石油化工等领域提供精馏萃取催化剂设计、热力学性质(溶解度、粘度等)、提纯表面处理吸附等性质模拟软件平台及解决方案。
数据挖掘
基于Pipeline Pilot提供数据搜集、数据清洗、特征工程、机器学习、流程设计等多种数据挖掘综合解决方案。
一体化实验室
• 实验室信息管理
• 电子实验记录本/SOP执行
• 试剂耗材管理
• 仪器管理
• 数据管理
部分产品
量化材料类
• Crystal:固体化学和物理性质计算软件
• Diamond:晶体结构数据可视化分析
• Endeavour:强大的求解晶体结构的软件
• Molpro:高精度量化软件
• Molcas:多参考态量软件
• Turbomole:快速稳定量化软件
• TeraChem:GPU上运行的量化计算软件
• Spartan:分子计算建模软件
数据分析类
• GelComparll:凝胶电泳图谱分析软件
• SimaPro:生命周期评估软件
• Unscrambler:完整多变量数据分析和实验设计软件
• CSDS:剑桥晶体结构数据库
• lCDD:国际衍射数据中心数据库
• ICSD:无机晶体结构数据库
• Pearson’s CD:晶体数据库
公司简介
北京泰科博思科技有限公司(Beijing Tech-Box S&T Co. Ltd.)成立于2007年,是国内领先的分子模拟及虚拟仿真综合解决方案提供商。
北京泰科博思科技有限公司与国际领先的模拟软件厂商、开发团队深入合作,为高校、科研院所和企业在材料、化工、药物、生命科学、环境、人工智能及数据挖掘、虚拟仿真教学等领域提供专业的整体解决方案。用户根据需要在我们的平台上高效的进行各种模拟实验,指导实际的生产设计。
北京泰科博思科技有限公司拥有一支一流的技术服务团队和资深的专家咨询团队,以客户真正需求出发,服务客户,为客户创造价值。我们秉承“职业、敬业、担当、拼搏、合作”的企业精神,致力于用国际领先的软件产品和专业全面的技术支持服务,成为客户可信赖的合作伙伴。
©北京泰科博思科技有限公司 / 京ICP备09107432号-1