本发明涉及吸附能预测领域,尤其涉及一种预测吸附能的方法。
背景技术:
1、吸附能是表面科学中的一个重要物理量,它经常决定材料在催化、传感器和储能材料中的应用。如果吸附能过高,会产生负面影响,如果吸附能过低,会导致反应障碍。而现有技术中对吸附能的预测方式有两种,第一种是通过实验测量,具体是进行热重分析、差热分析、原子力显微镜等技术手段。另一种是通过理论计算,具体是通过计算分子与固体表面的相互作用能、电子结构、晶体结构等来预测吸附能的数值。然而现有技术存在很多弊端,其中,第一种方式实验成本高,需要昂贵的化学材料成本、实验仪器及复杂的实验操作,不仅效率低,而且需要一系列复杂的实验操作且试验周期长。第二种方式对于wi ndows系统存在计算时间长、速度慢的弊端;对于l inux系统存在计算成本高、不易获得的弊端。
2、因此,本发明提供了一种既不通过实验也不通过计算,只通过该机器学习模型预测得到吸附能的方法。
技术实现思路
1、有鉴于此,本发明提供了一种预测吸附能的方法。
2、为解决上述技术问题,本发明采取了如下技术方案:
3、一种预测吸附能的方法,包括以下步骤:
4、(1)数据获取:
5、在数据库中,选取“一维过渡金属卤化物上气体原子的化学吸附”的吸附能数据作为训练机器学习模型的输出数据,在数据库中选取功函数、覆盖率、最大应力、总磁矩、单元格长度这5组数据再加上自行查询过渡金属、卤原子、吸附质原子的电负性这3组数据共8组数据作为训练机器学习模型的输入数据;
6、(2)归一化处理:
7、对所获取的数据进行归一化处理,将数据代公式处理到[0,1]范围内;
8、(3)机器学习模型:
9、基于python-jupyternotebook构建模型;然后,不断调整参数,直至找到误差最小时对应的参数作为最终的参数设置,将吸附能数据作为输出;
10、(4)预测吸附能:
11、通过该机器学习模型预测得到吸附能。
12、优选的,所述步骤(1)中,所述数据库为cmr(computational materialsrepository)数据库。
13、优选的,所述步骤(2)中,利用python-jupyter notebook的脚本对所获取的数据进行归一化处理。
14、优选的,所述步骤(2)中,归一化公式为:
15、
16、其中,xi是输入数据,xmin是输入数据的最小值,xmax是输入数据的最大值。
17、优选的,所述步骤(3)中,参数设置为n_estimators=100,random_state=42,随机划分数据80%为训练集,20%为测试集,
18、优选的,所述步骤(3)中,作为输入特征/描述符的数据指的是:功函数、覆盖率、最大应力、总磁矩、单元格长度这5组数据再加上自行查询过渡金属、卤原子、吸附质原子的电负性这3组数据共8组数据。
19、优选的,所述步骤(3)中,所述模型为随机森林模型。
20、优选的,所述步骤(4)中,进行模型指标衡量的公式为:
21、
22、其中,r2为决定系数,反应模型的拟合程度,范围是[0,1],值越接近1说明拟合越好;yi是真实值,是预测值,是真实值的平均值,y是吸附能;
23、
24、其中,mse为均方误差,值越小越好;yi是真实值,是预测值。
25、优选的,所述步骤(4),利用80%的数据构成训练集训练的rf机器学习模型,再用于测试20%的数据构成的测试集进行测试,其r2分数达到了0.85,mse达到了0.30,说明该模型对于预测吸附能具有一定的可行性,未来可以既不通过实验也不通过计算,在已知这8组输入特征描述符数据的情况下,只通过该机器学习模型即可输出预测得到吸附能。
26、本发明相对于现有技术取得了以下技术效果:
27、本发明不需要昂贵的实验设备和复杂的实验操作,也不需要软件计算,避免了计算时间长计算成本高的问题,只需要运行代码即可实现,不仅耗时短,而且成本低。
1.一种预测吸附能的方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种预测吸附能的方法,其特征在于,所述步骤(1)中,所述数据库为cmr(computational materials repository)数据库。
3.根据权利要求1所述的一种预测吸附能的方法,其特征在于,所述步骤(2)中,利用python-jupyter notebook的脚本对所获取的数据进行归一化处理。
4.根据权利要求1所述的一种预测吸附能的方法,其特征在于,所述步骤(2)中,归一化公式为:
5.根据权利要求1所述的一种预测吸附能的方法,其特征在于,所述步骤(3)中,参数设置为n_estimators=100,random_state=42,随机划分数据80%为训练集,20%为测试集。
6.根据权利要求1所述的一种预测吸附能的方法,其特征在于,所述步骤(3)中,作为输入特征/描述符的数据指的是:功函数、覆盖率、最大应力、总磁矩、单元格长度这5组数据再加上自行查询过渡金属、卤原子、吸附质原子的电负性这3组数据共8组数据。
7.根据权利要求1所述的一种预测吸附能的方法,其特征在于,所述步骤(3)中,所述模型为随机森林模型。
8.根据权利要求1所述的一种预测吸附能的方法,其特征在于,所述步骤(4)中,进行模型指标衡量的公式为:
9.根据权利要求1所述的一种预测吸附能的方法,其特征在于,所述步骤(4),利用80%的数据构成训练集训练的rf机器学习模型,再用20%的数据构成的测试集进行测试,其r2分数达到了0.85,mse达到了0.30,说明该模型对于预测吸附能具有一定的可行性,未来可以既不通过实验也不通过计算,在已知这8组输入特征描述符数据的情况下,只通过该机器学习模型即可输出预测得到吸附能。