本次在线讲座主要通过对COMPASS III力场参数生成过程的剖析,与大家分享如何将机器学习应用于实际的力场研究中去。通过对其研究思路,使用工具以及算法选择的阅读,帮助大家更好地理解机器学习在材料研究中的实际价值。
1. 材料研发与机器学习
a) 机器学习什么?
b) 机器学习的一般流程
c) 机器学习在材料领域中的应用
2. 力场开发与机器学习
a) 力场的一般获取途径
b) 力场的发展与局限
c) 机器学习在力场开发中的应用实例
3. COMPASS III — 数据库与机器学习有机结合的产物
a) COMPASS力场的前世今生
b) COMPASS III 结合数据库与机器学习拟合力场参数过程详解
4. 机器学习在分子模拟中应用的展望
讲座背景
在分子模拟中经常要模拟成千上万个原子的分子体系。显然,与量子力学和半经验方法相比,分子力学有能力处理大分子体系并且可以大大节省计算时间。分子力学是从经典力学的观点来描述分子中原子的拓扑结构,并通过分子力场(molecular force field)——这个分子模拟的基石来实现的。
分子力场是原子尺度上的一种势能场,是由一套势函数与一套力常数构成的。由此描述特定分子结构的体系能量。该能量是关于分子体系中成键原子的内坐标的函数,也是关于非键原子对距离的函数。
分子力学方法系统地发展还是在50年代以后。通过选择一套势函数和从实验中得到的一套力常数,从给定的分子体系原子的空间坐标的初值,用分子力场描述的体系总能量对原子坐标的梯度,通过多次迭代的数值算方法来得到合理的分子体系的结构。
90年代开始,研究人员开始从高质量的实验数据和量子力学从头计算的数据出发获取合适的分子力场的参数。但由于这些参数是在0 K的静态模拟中得到的,因此在一定温度下进行分子动力学模拟会发生一些误差,经常导致计算的密度比实验值低得多。
1998年由孙淮等人新开发的COMPASS分子力场改进了这个问题。 COMPASS是通过从头计算的方法,计算分子内的键参数,同时又采用以液态分子动力学为基础的经验方法测度范德华非键合的参数,开发出的适合凝聚态应用的一个全新的分子力场。也就是说,除了通常制作分子力场考虑的两个实验参照之外,它还采用液态密度作为参数化的实验标准。从而得到优于其它分子力场的计算结果。
经过20多年的发展,在最新的BIOVIA Materials Studio 2020中新发布的COMPASS III基于已有的COMPASS力场进行了扩展。BIOVIA的科学家们结合了三个著名的大型材料数据库Maybridge、PoLyInfo和ILThermo,利用机器学习算法结合第一性原理 (BIOVIA Materials Studio DMol3)计算结果优化了力场参数。与COMPASS II相比,更好地提供了对离子液体的支持。新增27种新力场类型,并针对训练集分子的产生制定了相应的标准和自动化计算工作流,可以通过主动学习的方式实现力场参数的自动迭代优化。