基于流式数据的人体细胞DNA倍体分析的方法、装置及存储介质与流程

allin2025-11-28  8


本发明属于人体细胞dna倍体检测,尤其涉及一种基于流式数据的人体细胞dna倍体分析的方法、装置及存储介质。


背景技术:

1、流式细胞术(flow cytometry,fcm)是一种对处在液流中的细胞逐个进行多参数的快速分析的技术,fcm具有快速、灵活、大量、灵敏和定量的特色。fcm可应用于肿瘤细胞dna倍体及s期指数分析,通过测定dna的含量,了解肿瘤细胞中染色体异常及细胞增殖活性情况,并将dna异倍体作为恶性肿瘤的标志之一。用流式细胞仪分析大量细胞的细胞周期和dna倍体已经成为一种日益重要的肿瘤研究方法并广泛应用于肿瘤基础和临床研究中,为肿瘤的诊断、疗效、评价和预后预测提供了重要的参考指标。

2、目前常用的dna倍体分析方法采用选用一个样本手动设定倍体峰位置再进行倍体分析,然后将其作为模板应用到所有分析样本分析得到结果。在实际检测发现,每个样本倍体峰存在差异性,导致分析结果可靠性降低,后期手动对分析结果进行校准,工作量大。


技术实现思路

1、本发明提供一种基于流式数据的人体细胞dna倍体分析的方法、装置及存储介质,通过自动寻找以及筛选倍体峰,提高分析效率,解决上述现有技术中存在的不足。

2、本发明所采用的技术方案为:

3、一种基于流式数据的人体细胞dna倍体分析的方法,包括步骤如下:

4、步骤1,对原始流式数据进行设门获得纯净的dna倍体分析数据;

5、所述原始流式数据是根据流式细胞术通过流式细胞仪获得的遵循fcs数据格式的流式数据文件;

6、所述纯净的dna倍体分析数据是原始流式数据进行去粘连和去碎片处理后的数据。

7、步骤2,对纯净的dna倍体分析数据进行再处理,并使用移动窗口最大值法进行寻峰获得最终倍体峰;所述的再处理包括归一化和平滑去噪。

8、步骤3,根据最终倍体峰及纯净的dna倍体分析数据进行dna倍体模型拟合,得到模拟分析结果即倍体数据;

9、步骤4:根据dna倍体分型标准,对倍体数据进行倍体分型,得到倍体分型结果。

10、作为本发明的优选方案,步骤1使用流式细胞分析仪进行操作并且去粘连和去碎片的具体步骤为:

11、步骤11,根据前向散射强度值-h及面积值-a对原始流式数据进行去粘连;

12、步骤12,根据侧向散射强度值-h及面积值-a对步骤11得到得数据进行去粘连;

13、步骤13,根据荧光通道强度值-h及面积值-a对步骤12得到得数据进行去粘连和去碎片处理得到纯净的dna倍体分析数据。

14、作为本发明的优选方案,步骤2的具体步骤为:

15、步骤21,对纯净的dna倍体分析数据进行归一化处理;所述的归一化使用min-max归一化方法,并且将数据归一化到[0,1024]范围内;

16、步骤22,对归一化后的数据进行平滑去噪处理;所述的平滑去噪采用移动窗口平均平滑算法。

17、步骤23,采用移动窗口最大值法对平滑后的数据进行寻峰,寻找到所有可能的倍体峰;并且寻峰的步长根据数据量和最高峰进行调节;所述的数据量为经过去粘连和去碎片后的数据个数;所述的步长为移动窗口最大值法最小窗口长度。

18、所述步长的调节策略是数据量大或最高峰峰高,则对应的步长大;当数据量小或最高峰峰高低,则对应的步长小。

19、步骤24,对得到的可能倍体峰进行筛选得到最终倍体峰。

20、具体步骤为:

21、步骤241,筛除二倍体峰前所有杂峰;

22、所述的二倍体峰指dna直方图中第一个倍体峰;

23、步骤242:筛除二倍体与四倍体峰位间低于最高峰峰高/8的所有峰;

24、所述的四倍体峰值在dna直方图中峰位在二倍体峰位2倍位置附近的峰位;

25、步骤243:筛除二倍体与四倍体峰位间间距小于二倍体峰位/10的所有峰;

26、步骤244:筛除四倍体峰位后杂峰,保留最高峰;

27、步骤245:筛除之后剩余的倍体峰就构成最终倍体峰。

28、本发明还提供了一种基于流式数据的人体细胞dna倍体分析的装置,包括数据预处理单元、提取倍体峰单元、模型拟合单元、倍体分型单元;

29、所述的数据预处理单元,用于去除粘连细胞数据和细胞碎片数据得到纯净的dna倍体分析数据;

30、所述的提取倍体峰单元,包括寻峰模块和筛选峰模块;所述的寻峰模块用于对数据预处理单元处理后的纯净的dna倍体分析数据进行归一化处理后再进行数据平滑处理,最后寻峰;所述的筛选峰模块用于筛除杂峰,得到最终倍体峰;

31、所述的模型拟合单元,用于根据最终倍体峰和纯净的dna倍体分析数据进行倍体模型拟合,得到拟合后的倍体数据;

32、所述的倍体分型单元,用于使用dna倍体分型标准对倍体数据进行分型,得到倍体分型结果。

33、作为本发明的优选方案,所述寻峰模块在寻峰时采用移动窗口最大值法对平滑后的数据进行寻峰,寻找到所有可能的倍体峰;并且寻峰的步长根据数据量和最高峰进行调节;

34、筛选峰模块进行倍体峰筛选时的筛除方法是先筛除二倍体峰前所有杂峰;然后筛除二倍体与四倍体峰位间低于最高峰峰高/8的所有峰;接着筛除二倍体与四倍体峰位间间距小于二倍体峰位/10的所有峰,最后筛除四倍体峰位后杂峰,保留最高峰;并且所述的二倍体峰指dna直方图中第一个倍体峰;所述的四倍体峰值在dna直方图中峰位在二倍体峰位2倍位置附近的峰位。

35、本发明还提供了一种计算机存储介质,其上存储有计算机程序,其中,所述的计算机程序被处理器执行时需要实现上述任一所述的方法。

36、本发明可自动去除细胞粘连和碎片数据并自动寻找倍体峰并对倍体峰进行筛选,提高了分析效率,根据数据特点进行寻峰,即为保证不漏峰,针对不同数据量设置不同步长进行寻峰;数据量较大或者最高峰高较高,步长设置大些,可减少寻到更多杂峰;数据量少些或者最高峰高较小,则设置步长较小些,保证不漏峰,该寻峰特点避免了结果假阴性;并且再加上对可能倍体峰进行筛除,避免了结果假阳性。



技术特征:

1.一种基于流式数据的人体细胞dna倍体分析的方法,其特征在于,包括步骤如下:

2.根据权利要求1所述的基于流式数据的人体细胞dna倍体分析的方法,其特征在于,步骤1的具体处理步骤为:

3.根据权利要求1所述的基于流式数据的人体细胞dna倍体分析的方法,其特征在于,步骤2的具体步骤为:

4.根据权利要求3所述的基于流式数据的人体细胞dna倍体分析的方法,其特征在于,所述的归一化使用min-max归一化方法;所述的平滑去噪采用移动窗口平均平滑算法。

5.根据权利要求3所述的基于流式数据的人体细胞dna倍体分析的方法,其特征在于,步骤23中所述步长的调节策略是:数据量大或最高峰峰高,则对应的步长大;当数据量小或最高峰峰高低,则对应的步长小。

6.根据权利要求5所述的基于流式数据的人体细胞dna倍体分析的方法,其特征在于,步骤24的具体步骤为:

7.根据权利要求6所述的基于流式数据的人体细胞dna倍体分析的方法,其特征在于,拟合所使用的拟合模型为watson流式数据分析模型。

8.一种基于流式数据的人体细胞dna倍体分析的装置,其特征在于:包括数据预处理单元、提取倍体峰单元、模型拟合单元、倍体分型单元;

9.根据权利要求8所述的基于流式数据的人体细胞dna倍体分析的装置,其特征在于:所述寻峰模块在寻峰时采用移动窗口最大值法对平滑后的数据进行寻峰,寻找到所有可能的倍体峰;并且寻峰的步长根据数据量和最高峰进行调节;

10.一种计算机存储介质,其上存储有计算机程序,其中,所述的计算机程序被处理器执行时需要实现权利要求1-7中任一所述的方法。


技术总结
本发明公开了一种基于流式数据的人体细胞DNA倍体分析的方法、装置及存储介质,可自动去除细胞粘连和碎片数据并自动寻找倍体峰并对倍体峰进行筛选,提高了分析效率,根据数据特点进行寻峰,即为保证不漏峰,针对不同数据量设置不同步长进行寻峰;数据量较大或者最高峰高较高,步长设置大些,可减少寻到更多杂峰;数据量少些或者最高峰高较小,则设置步长较小些,保证不漏峰,该寻峰特点避免了结果假阴性;并且再加上对可能倍体峰进行筛除,避免了结果假阳性。

技术研发人员:刘妍
受保护的技术使用者:高京(上海)生物科技有限公司
技术研发日:
技术公布日:2024/10/31
转载请注明原文地址: https://www.8miu.com/read-24988.html

最新回复(0)