一种用于构建慢性乙肝肝硬化预测模型的CT图像的影像组学特征提取与筛选方法与流程

allin2023-04-01  77


一种用于构建慢性乙肝肝硬化预测模型的ct图像的影像组学特征提取与筛选方法
技术领域
1.本发明涉及一种用于构建慢性乙肝肝硬化预测模型的ct图像的影像组学特征提取与筛选方法。


背景技术:

2.目前用于预测肝纤维化程度的无创方法,包括血清指数和弹性成像。已知te和mre对肝纤维化分期具有优秀的诊断性能。但是,由于价格高昂,这些性能良好的设备方法并未得到广泛应用。在中国,通常建议对hbv携带者进行增强ct检查来明确其有没有肿瘤发生,但由于成本效益有限,许多患者仅接收平扫ct检查。尽管增强ct或mri可以提供比平扫ct更多的信息,但是我们希望在容易获得的数据基础上以相对较低的成本研究无创模型来预测肝硬化。另外,其构建预测模型所用特征的选取方法不够健全。


技术实现要素:

3.本发明的目的是为了解决现有的肝纤维化、肝硬化预测方法由于成本问题而无法被广泛应用、且预测所用特征的选取方法不够健全的问题,而提出一种用于构建慢性乙肝肝硬化预测模型的ct图像的影像组学特征提取与筛选方法。
4.一种用于构建慢性乙肝肝硬化预测模型的ct图像的影像组学特征提取与筛选方法,所述方法为:
5.步骤一、针对平扫ct检查的hbv感染的具有肝纤维化病理结果的患者设置排除标准,不在排除标准内的患者则进行下一步的ct图像采集,并统计能够纳入ct图像采集的患者总数量,所述的排除标准为:
6.(1)缺乏详细的肝纤维化病理记录;
7.(2)缺乏1.5mm层厚的腹部平扫ct图像;
8.(3)平扫ct检查和活检之间的间隔时间超过3个月;
9.(4)图像质量差;其中,图像质量差是指通过psnr、结构相似度ssim或多尺度结构相似度方法评估出低分的图像;
10.(5)合并感染了其他病毒,包括丙型肝炎病毒、丁型肝炎病毒或人免疫缺陷病毒中的一种或几种;
11.(6)带有局灶性肝病灶,包括hcc、肝结核中的一种或几种;
12.(7)摄入大量酒精;所述的大量是指大于20克/天;
13.(8)临床资料不完整(n=39);
14.步骤二、被采集者采用上仰卧位接受ct检查;ct扫描的参数为:管电压120kvp,管电流250

350ma,准直切片厚度5mm,重建切片厚度1.25mm,切片间隔5mm,旋转时间0.6s,螺旋螺距1.375,视野在35至40cm之间,矩阵为512
×
512;
15.步骤三、将获得的平扫ct图像按照统计的总数量分为两部分,一部分作为训练组,
用于构建慢性乙肝肝硬化预测模型,另一部分作为验证组,用于验证慢性乙肝肝硬化预测模型的效果;
16.步骤四、进行图像分割和影像组学特征提取。
17.优选地,所述的影像组学特征提取步骤包括:
18.采用开源pyradiomics软件包进行图像预处理和特征提取;
19.第二,体素间距以1
×1×
1mm的大小进行标准化,体素强度值以25hu的箱宽离散化;
20.第三,从每个roi中提取828个影像组学特征,包括18个一阶统计量、74个纹理特征和736个基于小波的变换特征;
21.第四,在训练队列中使用z分数对特征值进行标准化;使用训练队列中确定的平均值和标准差验证队列中应用的标准分数;
22.第五,用观察者之间和观察者之间的可重复性以及套索回归选择影像组学特征的步骤,具体是:
23.(1)随机选择肝脏的右门静脉水平ct平扫图像,使用组内和组间相关系数对每个放射学特征的可重复性进行定量;一种定量方法是每周重复roi分割两次,另一种定量方法是独立执行roi分割,然后分别计算观察者之间和观察者之间的可重复性,其中,icc的最低可接受阈值为0.8;
24.其中,组内和组间相关系数,简称为icc,英文全称intraclass correlation coefficient;
25.(2)选择影像组学特征;
26.首先,保留具有高再现性的特征以进行后续分析;所述的高再现性的特征是指观察者内部和观察者之间的icc的值大于0.8;
27.其次,使用最小绝对收缩和选择算子逻辑回归算法,并通过10倍交叉验证对惩罚参数进行调整,将非零系数的特征作为肝硬化相关的特征。
28.本发明的有益效果为:
29.本发明是用于构建慢性乙肝肝硬化预测模型,具体是为慢性乙肝肝硬化预测模型构建提供数据基础,弥补构建模型所用的特征选择的技术缺陷,通过具体的ct图像的影像组学特征提取与筛选实现慢性乙肝肝硬化预测模型的构建。
30.本发明方法是用观察者之间和观察者之间的可重复性以及套索回归选择影像组学特征的,建立了可重复性测试,包括观察者内部和观察者之间的icc计算,最低阈值为0.80。通过选择可重复性更高的影像组学特征的较小子集,可以显著改善影像学特征的功能聚类可再现性,能筛选出与肝硬化预测相关的重要的特征,具有特征选择准确的优点,从而为构建慢性乙肝肝硬化预测模型提供基础。
附图说明
31.图1为本发明方法流程图;
32.图2为本发明涉及的影像组学特征提取与筛选原理图示;
33.图3a为本发明涉及的lasso模型通过最小标准使用10倍交叉验证确定最佳λ值的示意图;
34.图3b为本发明涉及的列出的85个选定特征的lasso系数曲线。
具体实施方式
35.具体实施方式一:
36.本实施方式的一种用于构建慢性乙肝肝硬化预测模型的ct图像的影像组学特征提取与筛选方法,如图1所示流程图,所述方法为:
37.步骤一、针对平扫ct检查的hbv感染的具有肝纤维化病理结果的患者设置排除标准,不在排除标准内的患者则进行下一步的ct图像采集,并统计能够纳入ct图像采集的患者总数量,所述的排除标准为:
38.(1)缺乏详细的肝纤维化病理记录(n=27);
39.(2)缺乏1.5mm层厚的腹部平扫ct图像(n=128);
40.(3)平扫ct检查和活检之间的间隔时间超过3个月(n=16);
41.(4)图像质量差(n=42);其中,图像质量差是指通过psnr、结构相似度ssim或多尺度结构相似度方法评估出低分的图像;
42.(5)合并感染了其他病毒,包括丙型肝炎病毒、丁型肝炎病毒或人免疫缺陷病毒中的一种或几种(n=17);
43.(6)带有局灶性肝病灶,包括hcc、肝结核中的一种或几种(n=45);
44.(7)摄入大量酒精;所述的大量是指大于20克/天(n=24);
45.(8)临床资料不完整(n=39);
46.最终,研究纳入了294名患者。根据活检日期,将2018年1月至2018年12月之间的144名患者分配到训练队列中,并将2019年1月至2019年12月之间的150名患者分配到验证队列中。
47.步骤二、对于排除后剩余的作为被采集者,被采集者采用上仰卧位接受ct检查;ct扫描的参数为:管电压120kvp,管电流250

350ma,准直切片厚度5mm,重建切片厚度1.25mm,切片间隔5mm,旋转时间0.6s,螺旋螺距1.375,视野在35至40cm之间,矩阵为512
×
512;
48.步骤三、将获得的平扫ct图像按照统计的总数量分为两部分,一部分作为训练组,用于构建慢性乙肝肝硬化预测模型,另一部分作为验证组,用于验证慢性乙肝肝硬化预测模型的效果;
49.步骤四、进行图像分割和影像组学特征提取。
50.具体实施方式二:
51.与具体实施方式一不同的是,本实施方式的一种用于构建慢性乙肝肝硬化预测模型的ct图像的影像组学特征提取与筛选方法,
52.所述的影像组学特征提取步骤包括:
53.采用开源pyradiomics软件包(http://www.radiomics.io/pyradiomics.html)进行图像预处理和特征提取;
54.第二,体素间距以1
×1×
1mm的大小进行标准化,体素强度值以25hu的箱宽离散化,用来减少图像噪声的干扰并使强度归一化;
55.第三,从每个roi中提取828个影像组学特征,包括18个一阶统计量、74个纹理特征和736个基于小波的变换特征;
56.第四,在训练队列中使用z分数对特征值进行标准化;使用训练队列中确定的平均值和标准差验证队列中应用的标准分数(z-score)。
57.如图2所示,在828个提取的特征中,选择了具有高可重复性的85个特征(8个一阶统计量,21个纹理特征和56个基于小波的变换)进行后续分析。根据训练队列选择了在套索回归模型中具有非零系数的25个肝硬化相关特征。
58.第五,用观察者之间和观察者之间的可重复性以及套索回归选择影像组学特征的步骤,具体是:
59.(1)随机选择肝脏的右门静脉水平ct平扫图像,基于50名随机选择的患者,使用组内和组间相关系数对每个放射学特征的可重复性进行定量;一种定量方法是每周重复roi分割两次,另一种定量方法是独立执行roi分割,然后分别计算观察者之间和观察者之间的可重复性,其中,icc的最低可接受阈值为0.8;
60.其中,组内和组间相关系数,简称为icc,英文全称intraclass correlation coefficient;
61.(2),选择重要的影像组学特征;
62.首先,保留具有高再现性的特征以进行后续分析;所述的高再现性的特征是指观察者内部和观察者之间的icc的值大于0.8;
63.其次,使用最小绝对收缩和选择算子(least absolute shrinkage and selection operator,lasso)逻辑回归算法,并通过10倍交叉验证对惩罚参数进行调整,以将非零系数的特征作为肝硬化相关的特征,如图3a和3b所示。
64.图3a和3b是展示使用lasso回归选择影像组学特征的图示;图3a所示为lasso模型通过最小标准使用10倍交叉验证确定最佳λ值,针对log(λ)绘制二项式偏差曲线,通过使用最小标准和最小标准的1个标准误差(1

标准误差条件),以最佳值绘制虚线垂直线,此处的最佳λ值为0.0383。图3b所示为列出85个选定特征的lasso系数曲线。

技术特征:
1.一种用于构建慢性乙肝肝硬化预测模型的ct图像的影像组学特征提取与筛选方法,其特征在于:所述方法为:步骤一、针对平扫ct检查的hbv感染的具有肝纤维化病理结果的患者设置排除标准,不在排除标准内的患者则进行下一步的ct图像采集,并统计能够纳入ct图像采集的患者总数量,所述的排除标准为:(1)缺乏详细的肝纤维化病理记录;(2)缺乏1.5mm层厚的腹部平扫ct图像;(3)平扫ct检查和活检之间的间隔时间超过3个月;(4)图像质量差;其中,图像质量差是指通过psnr、结构相似度ssim或多尺度结构相似度方法评估出低分的图像;(5)合并感染了其他病毒,包括丙型肝炎病毒、丁型肝炎病毒或人免疫缺陷病毒中的一种或几种;(6)带有局灶性肝病灶,包括hcc、肝结核中的一种或几种;(7)摄入大量酒精;所述的大量是指大于20克/天;(8)临床资料不完整(n=39);步骤二、被采集者采用上仰卧位接受ct检查;ct扫描的参数为:管电压120 kvp,管电流250

350 ma,准直切片厚度5 mm,重建切片厚度1.25 mm,切片间隔5 mm,旋转时间0.6 s,螺旋螺距1.375,视野在35至40 cm之间,矩阵为512
×
512;步骤三、将获得的平扫ct图像按照统计的总数量分为两部分,一部分作为训练组,用于构建慢性乙肝肝硬化预测模型,另一部分作为验证组,用于验证慢性乙肝肝硬化预测模型的效果;步骤四、进行图像分割和影像组学特征提取。2.根据权利要求1所述的一种用于构建慢性乙肝肝硬化预测模型的ct图像的影像组学特征提取与筛选方法,其特征在于:所述的影像组学特征提取步骤包括:采用开源pyradiomics软件包进行图像预处理和特征提取;第二,体素间距以1
×1×
1 mm的大小进行标准化,体素强度值以25 hu的箱宽离散化;第三,从每个roi中提取828个影像组学特征,包括18个一阶统计量、74个纹理特征和736个基于小波的变换特征;第四,在训练队列中使用z分数对特征值进行标准化;使用训练队列中确定的平均值和标准差验证队列中应用的标准分数;第五,用观察者之间和观察者之间的可重复性以及套索回归选择影像组学特征的步骤,具体是:(1)随机选择肝脏的右门静脉水平ct平扫图像,使用组内和组间相关系数对每个放射学特征的可重复性进行定量;一种定量方法是每周重复roi分割两次,另一种定量方法是独立执行roi分割,然后分别计算观察者之间和观察者之间的可重复性,其中,icc的最低可接受阈值为0.8;其中,组内和组间相关系数,简称为icc,英文全称intraclass correlation coefficient;
(2)选择影像组学特征;首先,保留具有高再现性的特征以进行后续分析;所述的高再现性的特征是指观察者内部和观察者之间的icc的值大于0.8;其次,使用最小绝对收缩和选择算子逻辑回归算法,并通过10倍交叉验证对惩罚参数进行调整,将非零系数的特征作为肝硬化相关的特征。

技术总结
一种用于构建慢性乙肝肝硬化预测模型的CT图像的影像组学特征提取与筛选方法。现有的肝纤维化、肝硬化预测方法由于成本问题而无法被广泛应用、且预测所用特征的选取方法不够健全的问题。本发明针对平扫CT检查的HBV感染的具有肝纤维化病理结果的患者设置排除标准,并统计能够纳入CT图像采集的患者总数量,被采集者采用上仰卧位接受CT检查;将获得的平扫CT图像按照统计的总数量分为两部分,一部分作为训练组,用于构建慢性乙肝肝硬化预测模型,另一部分作为验证组,用于验证慢性乙肝肝硬化预测模型的效果;进行图像分割和影像组学特征提取。本发明方法能够准确提取并筛选用于构建预测肝硬化模型的特征。测肝硬化模型的特征。测肝硬化模型的特征。


技术研发人员:何健 王锦程 毛应凡 徐珊珊 汤盛楠 吴锦
受保护的技术使用者:何健
技术研发日:2022.03.18
技术公布日:2022/7/5
转载请注明原文地址: https://www.8miu.com/read-8459.html

最新回复(0)