分子对接方法及系统与流程

allin2026-02-06  3


本技术涉及人工智能领域,尤其涉及一种分子对接方法及系统。


背景技术:

1、基于结构的药物设计中通常采用模拟计算的方法确定配体分子与蛋白质的最佳对接位置、以及对接时配体分子的取向和构象,从而实现配体分子与蛋白质的对接。

2、目前,可以使用基于搜索算法的分子对接方法实现上述过程。即,利用系统性或随机搜索方法在搜索空间进行搜索采样,再通过引入合适的打分函数对上述搜索结果(例如,配体分子与蛋白质的多种对接位置、以及对接时配体分子的多种取向和构象)进行排序筛选,之后根据筛选出的最优解实现配体分子与蛋白质的对接。但是,上述方法难以对搜索空间进行充分地搜索采样,因此存在计算时间长、成本高且对接效果较差的缺点。


技术实现思路

1、本技术提供了一种分子对接方法及系统,能够实现高效、准确且低成本的分子对接。

2、第一方面,本技术提供了一种分子对接方法。该方法可以应用于分子对接系统。分子对接系统获取第一分子和第二分子,然后将第一分子的各自由度变量进行离散化,并使用二值变量对离散后的各自由度变量进行编码,得到对应的编码向量。之后,分子对接系统基于第一分子和第二分子间的相互作用势能构造一个关于多个二值变量的目标函数,通过对该目标函数进行最小化处理,得到第一分子的各自由度变量的解。最后,分子对接系统基于上述得到的第一分子的各自由度变量的解将第一分子和第二分子进行对接。

3、本技术提供的技术方案中,分子对接系统通过将第一分子的各自由度变量进行离散化以及编码,从而构造出关于多个二值变量的目标函数,使得目标函数的最小化问题对应的搜索空间是一个离散空间。进一步地,当分子对接系统在该搜索空间中确定满足要求(即实现第一分子和第二分子的稳定对接)的第一分子的各自由度变量的解时,能够提高搜索效率,降低搜索成本,而且更容易找到上述满足要求的解,从而实现高效、准确且低成本的分子对接。

4、在第一方面的一种可能实现方式中,第一分子为配体,第二分子为蛋白质。

5、在第一方面的一种可能实现方式中,上述分子对接系统对目标函数进行最小化处理,得到第一分子的各自由度变量的解,包括:分子对接系统基于预设算法对目标函数进行最小化处理,得到第一分子的各自由度变量的离散最优解。其中,预设算法指示最小化过程中的迭代梯度为当前离散格点附近的n个离散格点对应的目标函数值分别与当前离散格点对应的目标函数值的差值,当前离散格点附近的n个离散格点是通过分别将当前离散格点对应的编码向量中的第1个元素、第2个元素、…、第n个元素进行翻转确定的,n为正整数,当前离散格点对应的编码向量包括第一分子的各自由度变量对应的编码向量。

6、上述实现方式中,由于基于预设算法得到的迭代梯度可以指示找到下一个离散格点,因此在目标函数的最小化过程中可以避免连续变量的干扰,便于找到第一分子的各自由度变量的离散最优解。

7、在第一方面的一种可能实现方式中,分子对接系统还基于第一分子的各自由度变量的离散最优解对目标函数进行局部最小化,得到第一分子的各自由度变量的连续解。其中,第一分子的各自由度变量的连续解对应的目标函数值小于或等于第一分子的各自由度变量的离散最优解对应的目标函数值。

8、上述实现方式中,分子对接系统通过将全局搜索(即在全局离散空间中找到第一分子的各自由度变量的离散最优解)和局部搜索(即在第一分子的各自由度变量的离散最优解的附近找到连续解)进行结合,可以搜索到更小目标函数值所对应的第一分子的各自由度变量的解,从而实现第一分子和第二分子之间的更稳定对接。

9、在第一方面的一种可能实现方式中,上述第一分子的自由度变量包括以下任一类或多类:沿坐标轴方向平移的自由度变量;或者,绕坐标轴旋转的自由度变量;或者,绕第一分子上的可旋转键旋转的自由度变量。也即是说,第一分子可以是刚性分子,也可以是柔性分子。相应地,分子对接系统既支持刚性对接,也支持柔性对接。

10、在第一方面的一种可能实现方式中,上述分子对接系统使用二值变量对离散后的各自由度变量进行编码,得到对应的编码向量,包括:分子对接系统将离散后的绕坐标轴旋转的自由度变量对应的三角函数编码为由二值变量组成的高阶多项式;或者,将离散后的绕第一分子上的可旋转键旋转的自由度变量对应的三角函数编码为由二值变量组成的高阶多项式。

11、应理解,由于分子对接系统构造的目标函数中包括离散后的绕坐标轴或可旋转键旋转的自由度变量对应的三角函数值的计算,通过上述实现方式,可以直接将离散后的绕坐标轴或可旋转键旋转的自由度变量对应的三角函数编码为由二值变量组成的高阶多项式,从而简化目标函数的表达式,方便进行计算。

12、在第一方面的一种可能实现方式中,当离散后的自由度变量包括2n个离散值时,上述高阶多项式包括n个二值变量,且该高阶多项式的项数为2n-1,n为正整数。也就是说,可以使用较少的二值变量对较多的离散值对应的三角函数进行编码,从而提高编码效果。

13、在第一方面的一种可能实现方式中,在分子对接系统对目标函数进行最小化处理之前,分子对接系统还对目标函数进行滤波平滑处理,处理后的目标函数为目标函数的单调映射,从而更容易找到第一分子的各自由度变量的离散最优解。

14、在第一方面的一种可能实现方式中,第一分子和第二分子间的相互作用势能包括第一分子和第二分子间的lennard-jones势能和静电能。

15、在第一方面的一种可能实现方式中,上述分子对接系统获取第一分子和第二分子,包括:分子对接系统对第一分子进行分子展开处理,得到第一分子的至少一种三维构象,从而实现第一分子和第二分子间的更稳定对接。

16、第二方面,本技术提供了一种分子对接系统。该系统包括获取模块、编码模块、目标函数构造模块、优化模块和解码模块。获取模块用于获取第一分子和第二分子。编码模块用于将第一分子的各自由度变量进行离散化,并使用二值变量对离散后的各自由度变量进行编码,得到对应的编码向量。目标函数构造模块用于基于第一分子和第二分子间的相互作用势能构造一个关于多个二值变量的目标函数。优化模块用于对该目标函数进行最小化处理,得到第一分子的各自由度变量的解。解码模块用于基于上述得到的第一分子的各自由度变量的解将第一分子和第二分子进行对接。

17、在第二方面的一种可能实现方式中,第一分子为配体,第二分子为蛋白质。

18、在第二方面的一种可能实现方式中,上述优化模块用于基于预设算法对目标函数进行最小化处理,得到第一分子的各自由度变量的离散最优解。其中,预设算法指示最小化过程中的迭代梯度为当前离散格点附近的n个离散格点对应的目标函数值分别与当前离散格点对应的目标函数值的差值,当前离散格点附近的n个离散格点是通过分别将当前离散格点对应的编码向量中的第1个元素、第2个元素、…、第n个元素进行翻转确定的,n为正整数,当前离散格点对应的编码向量包括第一分子的各自由度变量对应的编码向量。

19、在第二方面的一种可能实现方式中,上述优化模块还用于基于第一分子的各自由度变量的离散最优解对目标函数进行局部最小化,得到第一分子的各自由度变量的连续解。其中,第一分子的各自由度变量的连续解对应的目标函数值小于或等于第一分子的各自由度变量的离散最优解对应的目标函数值。

20、在第二方面的一种可能实现方式中,上述第一分子的自由度变量包括以下任一类或多类:沿坐标轴方向平移的自由度变量;或者,绕坐标轴旋转的自由度变量;或者,绕第一分子上的可旋转键旋转的自由度变量。

21、在第二方面的一种可能实现方式中,上述编码模块用于将离散后的绕坐标轴旋转的自由度变量对应的三角函数编码为由二值变量组成的高阶多项式;或者,将离散后的绕第一分子上的可旋转键旋转的自由度变量对应的三角函数编码为由二值变量组成的高阶多项式。

22、在第二方面的一种可能实现方式中,当离散后的自由度变量包括2n个离散值时,上述高阶多项式包括n个二值变量,且该高阶多项式的项数为2n-1,n为正整数。

23、在第二方面的一种可能实现方式中,上述目标函数构造模块还用于对目标函数进行滤波平滑处理,处理后的目标函数为目标函数的单调映射。

24、在第二方面的一种可能实现方式中,第一分子和第二分子间的相互作用势能包括第一分子和第二分子间的lennard-jones势能和静电能。

25、在第二方面的一种可能实现方式中,上述获取模块用于对第一分子进行分子展开处理,得到第一分子的至少一种三维构象。

26、第三方面,本技术提供了一种计算设备。该计算设备包括处理器和存储器,处理器执行存储器中的计算机程序代码以实现前述第一方面及第一方面的任一种实现方式所描述部分或全部方法。

27、第四方面,本技术提供了一种计算设备集群。该计算设备集群包括至少一个计算设备,每个计算设备包括处理器和存储器。至少一个计算设备的处理器用于执行至少一个计算设备的存储器中存储的指令,以使得该计算设备集群执行前述第一方面及第一方面的任一种实现方式所描述部分或全部方法。

28、第五方面,本技术提供了一种计算机程序产品。该计算机程序产品可以是包含指令的、能够运行在计算设备上或被储存在任何可用介质中的软件或程序产品。当该计算机程序产品在计算设备或计算设备集群上运行时,使得该计算设备或该计算设备集群执行前述第一方面及第一方面的任一种实现方式所描述部分或全部方法。

29、第六方面,本技术提供了一种计算机可读存储介质。该计算机存储介质包括计算机程序指令,当所述计算机程序指令被计算设备或计算设备集群执行时,使得该计算设备或该计算设备集群执行前述第一方面及第一方面的任一种实现方式所描述部分或全部方法。


技术特征:

1.一种分子对接方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述第一分子为配体,所述第二分子为蛋白质。

3.根据权利要求1或2所述的方法,其特征在于,所述对所述目标函数进行最小化处理,得到所述第一分子的各自由度变量的解,包括:

4.根据权利要求3所述的方法,其特征在于,还包括:

5.根据权利要求1至4任一项所述的方法,其特征在于,所述第一分子的自由度变量包括以下任一类或多类:

6.根据权利要求5所述的方法,其特征在于,所述使用二值变量对离散后的各自由度变量进行编码,得到对应的编码向量,包括:

7.根据权利要求6所述的方法,其特征在于,当所述离散后的自由度变量包括2n个离散值时,所述高阶多项式包括n个所述二值变量,且所述高阶多项式的项数为2n-1,n为正整数。

8.根据权利要求1至7任一项所述的方法,其特征在于,在所述对所述目标函数进行最小化处理之前,所述方法还包括:

9.根据权利要求1至8任一项所述的方法,其特征在于,所述第一分子和所述第二分子间的相互作用势能包括所述第一分子和所述第二分子间的lennard-jones势能和静电能。

10.根据权利要求1至9任一项所述的方法,其特征在于,所述获取第一分子和第二分子,包括:

11.一种分子对接系统,其特征在于,包括:

12.根据权利要求11所述的系统,其特征在于,所述第一分子为配体,所述第二分子为蛋白质。

13.根据权利要求11或12所述的系统,其特征在于,

14.根据权利要求13所述的系统,其特征在于,

15.根据权利要求11至14任一项所述的系统,其特征在于,所述第一分子的自由度变量包括以下任一类或多类:

16.根据权利要求15所述的系统,其特征在于,

17.根据权利要求16所述的系统,其特征在于,当所述离散后的自由度变量包括2n个离散值时,所述高阶多项式包括n个所述二值变量,且所述高阶多项式的项数为2n-1,n为正整数。

18.根据权利要求11至17任一项所述的系统,其特征在于,

19.根据权利要求11至18任一项所述的系统,其特征在于,所述第一分子和所述第二分子间的相互作用势能包括所述第一分子和所述第二分子间的lennard-jones势能和静电能。

20.根据权利要求11至19任一项所述的系统,其特征在于,

21.一种计算设备,其特征在于,包括处理器和存储器,所述处理器用于执行所述存储器中存储的指令以实现如权利要求1至10任一项所述的方法。

22.一种包含指令的计算机程序产品,其特征在于,当所述指令被计算设备运行时,使得所述计算设备执行如权利要求1至10任一项所述的方法。

23.一种计算机可读存储介质,其特征在于,包括计算机程序指令,当所述计算机程序指令被计算设备执行时,使得所述计算设备执行如权利要求1至10任一项所述的方法。


技术总结
本申请提供了一种分子对接方法及系统,能够实现高效、准确且低成本的分子对接。其中,本申请提供的分子对接方法可以应用于分子对接系统。分子对接系统获取第一分子和第二分子,然后将第一分子的各自由度变量进行离散化,并使用二值变量对离散后的各自由度变量进行编码,得到对应的编码向量。之后,分子对接系统基于第一分子和第二分子间的相互作用势能构造一个关于多个二值变量的目标函数,通过对该目标函数进行最小化处理,得到第一分子的各自由度变量的解。最后,分子对接系统基于上述得到的第一分子的各自由度变量的解将第一分子和第二分子进行对接。

技术研发人员:崔晓鹏,李蕴婷,熊招平,刘博文,王碧莹,韩欣科,乔楠,翁文康
受保护的技术使用者:华为云计算技术有限公司
技术研发日:
技术公布日:2024/10/31
转载请注明原文地址: https://www.8miu.com/read-26281.html

最新回复(0)