模型训练方法、装置、计算机设备及存储介质与流程

allin2025-03-06  58


本公开涉及计算机,具体涉及一种模型训练方法、装置、计算机设备及存储介质。


背景技术:

1、通过用于生成分子结构的模型生成分子结构是ai制药的核心技术之一。如何提升预训练之后用于生成分子结构的模型的精度成为一个需要解决的问题。


技术实现思路

1、有鉴于此,本公开实施例提供了一种模型训练方法、装置、计算机设备及存储介质。

2、第一方面,本公开实施例提供了一种模型训练方法,该方法包括:

3、在对目标分子生成模型的预训练期间,对用于训练的分子结构进行片段切分,得到所述用于训练的分子结构的多个片段;

4、从所述多个片段中选择所述用于训练的分子结构的目标片段集合,其中,所述目标片段集合为所述多个片段的一部分;

5、获取所述目标片段集合的特征,所述目标片段集合的特征包括:所述目标片段集合中每个目标片段的特征,所述目标片段的特征包括:所述目标片段中每个原子的原子类型、所述目标片段中每个被进行坐标扰乱的原子的经过扰乱的坐标、所述目标片段中每个未被进行坐标扰乱的原子的坐标;

6、生成所述用于训练的分子结构的整体特征,所述用于训练的分子结构的整体特征包括:所述用于训练的分子结构中每个原子的局部电荷;

7、利用目标分子生成模型,根据所述目标片段集合的特征、所述用于训练的分子结构的整体特征,生成所述目标片段集合对应的预测分子结构,以及生成所述目标片段集合对应的预测分子结构与所述用于训练的分子结构之间的损失,所述损失用于更新目标分子生成模型的参数的参数值。

8、第二方面,本公开实施例提供了一种模型训练装置,所述装置包括:

9、片段切分单元,用于在对目标分子生成模型的预训练期间,对用于训练的分子结构进行片段切分,得到所述用于训练的分子结构的多个片段;

10、选择单元,用于在对目标分子生成模型的预训练期间,从所述多个片段中选择所述用于训练的分子结构的目标片段集合,其中,所述目标片段集合为所述多个片段的一部分;

11、获取单元,用于在对目标分子生成模型的预训练期间,获取所述目标片段集合的特征,所述目标片段集合的特征包括:所述目标片段集合中每个目标片段的特征,所述目标片段的特征包括:所述目标片段中每个原子的原子类型、所述目标片段中每个被进行坐标扰乱的原子的经过扰乱的坐标、所述目标片段中每个未被进行坐标扰乱的原子的坐标;

12、生成单元,用于在对目标分子生成模型的预训练期间,生成所述用于训练的分子结构的整体特征,所述用于训练的分子结构的整体特征包括:所述用于训练的分子结构中每个原子的局部电荷;

13、预测和更新单元,用于在对目标分子生成模型的预训练期间,利用目标分子生成模型,根据所述目标片段集合的特征、所述用于训练的分子结构的整体特征,生成所述目标片段集合对应的预测分子结构,以及生成所述目标片段集合对应的预测分子结构与所述用于训练的分子结构之间的损失,所述损失用于更新目标分子生成模型的参数的参数值。

14、第三方面,本公开实施例提供了一种计算机设备,包括:存储器和处理器,存储器和处理器之间互相通信连接,存储器中存储有计算机指令,处理器通过执行计算机指令,从而执行上述第一方面或其对应的任一实施方式的方法。

15、第四方面,本公开实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机指令,计算机指令用于使计算机执行上述第一方面或其对应的任一实施方式的方法。

16、第五方面,本发明提供了一种计算机程序产品,包括计算机指令,计算机指令用于使计算机执行上述第一方面或其对应的任一实施方式的方法。

17、本公开实施例提供的模型训练方法,在对目标分子生成模型的预训练期间,对用于训练的分子结构进行片段切分,得到用于训练的分子结构的多个片段;从该多个片段中选择用于训练的分子结构的目标片段集合,该目标片段集合为该多个片段的一部分;获取目标片段集合的特征;生成用于训练的分子结构的整体特征,用于训练的分子结构的整体特征包括:用于训练的分子结构中每个原子的局部电荷;利用目标分子生成模型,根据目标片段集合的特征、用于训练的分子结构的整体特征,生成目标片段集合对应的预测分子结构,以及生成目标片段集合对应的预测分子结构与用于训练的分子结构之间的损失。在对目标分子生成模型进行预训练时,对用于训练的分子结构进行片段切分的得到的多个片段的一部分片段即目标片段集合参与训练,从而,进行片段级掩蔽(mask),增加目标分子生成模型的预训练的难度,让目标分子生成模型更好的学习到片段信息。从而,加强预训练之后目标分子生成模型中解码器自回归生成分子结构的能力。利用用于训练的分子结构中每个原子的局部电荷参与训练,加强对分子深层物理信息的捕捉和建模,使得训练之后可以利用用于推理的分子结构中原子的局部电荷进行推理。利用用于训练的分子结构中每个原子的局部电荷表示分子的整体特征,可以确保模型的泛化性和令牌(token)分布的多样性,同时,可以避免预训练之后执行下游任务时,对下游任务提示过大导致的生成的分子结构多样性不足问题。



技术特征:

1.一种模型训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,分别对所述目标数量个原子中每个原子的坐标进行扰乱,得到所述目标数量个原子中每个原子的经过扰乱的坐标包括:

4.根据权利要求1所述的方法,其特征在于,利用目标分子生成模型,根据所述目标片段集合的特征、所述用于训练的分子结构的整体特征,生成所述目标片段集合对应的预测分子结构包括:

5.根据权利要求4所述的方法,其特征在于,所述整体特征编码网络为pointnet网络。

6.根据权利要求1-5中任一项所述的方法,其特征在于,所述方法还包括:

7.一种模型训练装置,其特征在于,所述装置包括:

8.一种计算机设备,其特征在于,包括:

9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机指令,所述计算机指令用于使计算机执行权利要求1至6中任一项所述的方法。

10.一种计算机程序产品,其特征在于,包括计算机指令,所述计算机指令用于使计算机执行权利要求1至6中任一项所述的方法。


技术总结
本公开涉及计算机技术领域,公开了模型训练方法、装置、计算机设备及存储介质,该方法包括:在对目标分子生成模型的预训练期间,对用于训练的分子结构进行片段切分,得到用于训练的分子结构的多个片段;从该多个片段中选择用于训练的分子结构的目标片段集合,该目标片段集合为多个片段的一部分;获取目标片段集合的特征;生成用于训练的分子结构的整体特征,用于训练的分子结构的整体特征包括:用于训练的分子结构中每个原子的局部电荷;利用目标分子生成模型,根据目标片段集合的特征、用于训练的分子结构的整体特征,生成目标片段集合对应的预测分子结构,以及生成目标片段集合对应的预测分子结构与用于训练的分子结构之间的损失。

技术研发人员:肖洋,冯伟,周文彪,黄博
受保护的技术使用者:北京望石智慧科技有限公司
技术研发日:
技术公布日:2024/10/31
转载请注明原文地址: https://www.8miu.com/read-19097.html

最新回复(0)