作者会实时更新码内资源,将该二维码作为与读者交互的长期入口,为读者和作者提供增值服务,同时有效提高自身论文学术影响力。
开放科学(资源服务)标识码(OSID)
基于增强CT影像组学与机器学习算法预测肿块型肝内胆管癌微血管侵犯
引证本文:
吕昊阳,洪重,黄侠鸣, 等. 基于增强CT影像组学与机器学习算法预测肿块型肝内胆管癌微血管侵犯[J]. 肝胆胰外科杂志, 2024, 36(1): 13-19.
”
吕昊阳1,洪重2,黄侠鸣1,俞富祥1
1.温州医科大学附属第一医院 肝胆胰外科,浙江 温州 325000;2.温州医科大学附属第二医院 肝胆胰外科,浙江 温州 325027
[基金项目] 浙江省医药卫生科技计划项目(2019KY104)。
[第一作者] 吕昊阳(1997—),男,浙江嘉兴人,在读硕士。
[通信作者] 俞富祥,主任医师,博士,Email:wy826374419@163.com。
[摘 要] 目的 研究肿块型肝内胆管癌发生微血管侵犯的影像组学及临床特征,并建立基于机器学习算法的预测模型。方法 回顾性收集2015年1月至2023年2月期间就诊于温州医科大学附属第一医院(75例)和温州医科大学附属第二医院(29例)的肝内胆管癌(ICC)患者资料,提取增强CT的影像组学特征,使用多种机器学习方法进行分析并比较,结合最佳影像组学机器学习方法与临床资料,建立预测模型并进行检验。结果 多种影像组学机器学习方法中,门脉期影像组学特征的朴素贝叶斯分类表现相对较好,曲线下面积(AUC)为0.818,结合筛选出的2个临床特征(瘤内动脉穿行,CEA>5 ng/mL)建立预测模型,训练组和测试组的AUC分别为0.883和0.891,训练组的敏感度为0.978,特异度为0.656,测试组的敏感度为0.909,特异度为0.700。结论 基于增强CT影像组学机器学习结合临床资料的模型可用于预测肝内胆管癌的微血管侵犯状态,具有较好的诊断价值。
1 资料和方法
1.1 一般资料
回顾性收集2015年1月至2023年2月期间就诊于温州医科大学附属第一医院(75例)和温州医科大学附属第二医院(29例)的ICC患者的临床资料。根据《赫尔辛基宣言》的原则获得温州医科大学附属第一医院伦理委员会的批准,免于患者知情同意(批号:KY2023-R127),并在进行研究之前匿名处理数据。最终筛选出104例肿块型ICC患者作为研究对象,其中微血管侵犯阳性35例(MVI阳性组),微血管侵犯阴性69例(MVI阴性组)。
1.2 病例纳入与排除标准
纳入标准:(1)行肝切除术,术后病理学诊断为肿块型ICC,并且有描述微血管侵犯情况;(2)术前1个月内做过上腹部增强CT检查,CT图像清晰,无伪影。排除标准:(1)术前行针对ICC治疗,包括肝切除术,经动脉化疗栓塞(transarterial chemoembolization,TACE),免疫治疗,放射治疗;(2)诊断ICC为肝内多发,或者伴发有其他恶性肿瘤;(3)临床资料不完整。
1.3 临床指标
临床指标包括:患者年龄,高血压史,糖尿病史,乙肝病史,肿瘤位置,肿瘤最大径,远端胆管是否扩张,增强CT有无瘤周强化,增强CT有无瘤内动脉,白细胞计数,中性粒细胞数绝对值,红细胞计数,部分活化凝血酶原时间,纤维蛋白原,直接胆红素,间接胆红素,总蛋白,白蛋白,丙氨酸氨基转移酶,天冬氨酸氨基转移酶,碱性磷酸酶,γ-谷氨酰基转移酶,甲胎蛋白(AFP),癌胚抗原(CEA),糖类抗原CA199。其中实验室检查选择术前10 d内的最后一次结果。所有临床资料根据正常值范围或临床分析重编码为二分类变量。
1.4 影像组学特征收集
本研究采用CT扫描仪包括GE BrightSpeed 16;东芝Aquilion ONE和飞利浦Brilliance 16,管电压100~120 kV,管电流200~500 mA,旋转时间0.5 s,图像矩阵为512×512,采用非离子型碘比剂经肘静脉留置针注入,剂量1.5 mL/kg,注射流率3 mL/h,注射后30 s与60 s分别进行动脉期与门脉期扫描。所有CT影像以DICOM格式导出并使用RIAS 0.2.1软件进行预处理,包括重采样为0.7 mm×0.7 mm×5.0 mm,固定窗宽200,窗位50,以及图像Z值标准化。
由1名具有相关资质的研究员在病理结果和临床资料均不知情的前提下,使用3D slicer5.2.2软件独立勾画每一层图像的ICC病灶区域,并自动生成三维容积感兴趣区,以nrrd格式导出。感兴趣区域勾画时尽可能沿肿瘤边缘进行,避开肿瘤坏死或钙化区域及周围大血管。然后使用Python的Pyradiomics3.0.1包进行特征提取,动脉期与门脉期各提取到原始与变换处理后图像的1 409个特征。为了评估感兴趣区域的一致性,在完成第1次勾画3周后,从数据中随机抽取15例,再次进行勾画,使用组内相关系数(intra-class correlation coefficients)来评估特征提取的一致性,去除了其中相关系数低于0.8的特征。
1.5 影像组学特征筛选与模型比较
将提取到的影像组学特征使用MinMaxScaler法进行归一化,并用U检验去除差异不显著的特征。然后将动脉期,门脉期以及动脉-门脉期联合的3组特征分别用最大相关最小冗余算法(max-relevance and min-redundancy,mRMR)进行筛选,选择前10项特征用于建立模型。将3组影像组学特征分别使用极度梯度提升(XGBoost)、轻量级梯度提升(LightGBM)、随机森林(randomforest)、自适应增强(AdaBoost)、高斯朴素贝叶斯(GNB)、朴素贝叶斯(CNB)、神经网络(MLP)、支持向量机分类(SVM)及近邻分类(KNN)9种机器学习分类算法,建立共27种机器学习预测模型。为了更好地比较这27种预测模型,增加可信性,本研究并未将患者分为训练组和验证组,而是选择采用五折交叉法进行验证。绘制了受试者操作特征(receive operating characteristic,ROC)曲线并计算工作曲线下面积(area under the curve,AUC)以进行比较,选择出其中预测能力最强的模型(图1)。
1.6 影像组学-临床预测模型的建立及检验
将所有104例患者按7∶3分为训练组(n=73)与验证组(n=31)。对训练组患者的影像组学特征,使用最佳机器学习算法建立预测模型,计算出所有患者的影像组学预测值。从临床特征中筛选出具有显著差异的特征,并使用最小绝对收缩和选择算法(least absolute shrinkage and selec-tion operator,LASSO)回归进一步筛选,用得到的临床特征与影像组学机器学习预测值使用逻辑回归建立预测模型,并绘制成列线图以直观展示。用验证组对预测模型进行验证,绘制ROC曲线并计算AUC。作为对比,使用临床特征建立临床预测模型,使用影像组学机器学习预测值建立影像组学预测模型(图2)。
1.7 统计学分析
单因素分析使用Python的statsmodels0.11.1包,其中影像组学特征按P<0.05标准行U检验,临床特征按P<0.1行χ2检验。mRMR算法及机器学习预测模型使用了Python的xgboost1.2.1包,lightgbm3.2.1包和sklearn0.22.1包。LASSO回归特征筛选和逻辑回归预测模型使用了R语言的glmnet4.1.2包和logreg6.2.0包。P<0.05为差异具有统计学意义。
2 结果
2.1 影像组学预测模型比较
构建并交叉验证的27个影像组学-机器学习预测模型中(图3),经DeLong检验,预测模型间的差异没有统计学意义,其中门脉期的CNB算法五折交叉验证的平均AUC为0.818(表1),表现相对最佳。筛选出的门脉期特征包括了1个一阶统计特征“logsigma30mm3D_firstorder_Maximum”和9个灰度纹理特征“waveletHHH_ngtdm_Contrast”“waveletHHL_glszm_SmallAreaLowGrayLevelEmphasis”“waveletHHL_glszm_SmallAreaEmphasis”“waveletHLL_glszm_SizeZoneNonUniformity”“waveletHLL_glszm_LowGrayLevelZoneEmphasis”“waveletLHH_glszm_ZonePercentage”“waveletLHH_glszm_LowGrayLevelZoneEmphasis”“waveletLHL_glszm_GrayLevelNonUniformity”“logsigma30mm3D_glszm_LowGrayLevelZoneEmphasis”。见图4。
2.2 影像组学-临床联合模型的建立及验证
MVI阳性组与阴性组间有8项临床特征差异有统计学意义(表2),包括年龄>60岁,乙肝,瘤内动脉穿行,CEA>5 ng/mL,白蛋白<40 g/L,中性粒细胞>6.3×109/L,白细胞>9.5×109/L,经LASSO回归进一步筛选出CEA(OR=4.613)、瘤内动脉穿行(OR=3.553)2个特征(图4)。最终得到的影像组学-临床联合模型的训练组AUC为0.881,灵敏度为0.978,特异度为0.656,F1分数为0.716;验证组AUC为0.891,灵敏度为0.909,特异度为0.700,F1分数为0.707,显示该模型具有良好的预测效果(表3)。临床模型的训练组AUC为0.783,验证组AUC为0.841,影像组学模型的训练组AUC为0.842,验证组AUC为0.823。影像组学-临床联合模型的预测能力优于临床模型和影像组学模型,而影像组学模型的预测能力与临床模型相近,联合模型与临床模型的训练组AUC稍低于验证组,我们考虑为研究样本量较少而产生的偏差。DCA决策曲线显示,预测模型在较大的阈值范围内可以获得净收益(0~0.6)(图5)。
3 讨论
目前外科手术仍是唯一可能治愈ICC的方法,但手术后的5年生存率也仅有20%~30%。而MVI状态在是否扩大手术切缘,肝移植指征,术后辅助化疗及预后方面有重要的临床意义,如果能在术前预测出MVI状态,将对ICC患者的诊疗提供重要指导。影像组学作为传统影像学的拓展,其重点关注于影像的微观特征,展现出了较高的临床价值。Xiang等采用支持向量机算法构建CT影像组学特征,并结合临床数据开发了ICC的MVI预测模型,训练组和验证组AUC分别为0.886和0.800。Zhou等基于动态增强MRI图像开发了ICC的MVI影像组学预测模型,在训练组和验证组中AUC分别为0.873和0.850。本研究中,我们将增强CT影像组学机器学习的预测值与临床结合得到的预测模型训练组AUC为0.881,验证组AUC为0.891,显示出了较为优良的预测能力,临床医师在进行决策时可以参考该预测模型的预测结果,从而制定出更适合患者的治疗方案。
影像组学与机器学习算法的结合可以更好地发掘出影像中包含的信息,而且分类算法的选择是预测模型的重要影响因素之一,因此本研究采用了9种常用的机器学习算法来处理影像组学特征,并且在比较后选择了CNB算法来计算影像组学机器学习的预测值。预测值和临床资料的联合模型则是采用了逻辑回归算法,从而保证了模型的临床解释性,并绘制出一个列线图来直观展示,让该模型可以在临床中便于使用。
在不同的影像组学研究中,对增强影像的时相选择也不尽相同,而在本研究中,门脉期模型的预测能力优于动脉期模型以及动脉期-静脉期联合模型。在筛选出的10个门脉期影像组学特征中,1个一阶统计特征(first order)表示最大灰度级强度,剩下9个灰度纹理特征中,1个灰度色调差异矩阵特征(ngtdm)表示体素及其邻域之间灰度变化的大小,8个灰度大小区域矩阵特征(glszm)量化了图像中的灰度级区域,即具有相同灰度级强度的连接体素数量。这10个特征有9个来自于小波变换(Wavelet,binwindth=10),小波变换是空间(时间)频率的局部化分析,能充分突出某方面细节特征,可能与低水平放射组学特征临床检查无法发现的病理生理学、蛋白质组学和肿瘤形态学特点存在潜在关联。既往有多项研究表明纹理特征和小波特征可以反映更多关于肿瘤异质性的信息,影像组学特征筛选的结果,也以纹理特征或小波纹理特征为主,这与本研究结果相一致。
本研究中,瘤内动脉穿行被定义为肉眼可见的动脉期瘤内血管增强,104例患者中有38例被评估为瘤内动脉穿行。经检验,瘤内动脉穿行是ICC患者发生MVI的独立危险因素(OR=3.553),被用于预测模型的建立,这也与既往的一些研究相吻合。我们进一步分析发现,瘤内动脉穿行和肿瘤大小具有相关性(P<0.001),而肿瘤大小在大量研究中被证实与MVI有关,本研究中MVI阳性与阴性组间的肿瘤大小特征差异也具有统计学意义(P=0.012)。因此我们认为,瘤内动脉穿行与肿瘤大小是两个具有相关性的MVI危险因素,而瘤内动脉穿行或许具有更好的预测价值。CEA是一种具有人类胚胎抗原特性的酸性糖蛋白,和CA199一起被推荐为ICC早期检测和诊断的标志物,并且与ICC的严重程度和疾病预后相关。本研究中,我们发现CEA>5 ng/mL是MVI的独立危险因素(P<0.001),将其作为预测模型的一个特征。但在不同的研究中CEA升高的阈值并不一致,因此需要更大样本量的研究来确定适合用于MVI预测的阈值。
综上所述,增强CT的影像组学特征和临床特征结合可以在术前较好地预测ICC患者的MVI状态,我们建立的基于机器学习的预测模型也表现出良好的预测能力,可为ICC的临床诊治提供帮助。同时,受限于样本量不足,仍有些问题难以明确,期待能有进一步研究。
肝胆胰外科杂志
扫码关注我们
电话
0577-86699363
电子邮箱
gdywkzz@vip.126.com
官方网站+投稿系统
(官网已开放下载所有已发表论文全文哦~)
https://gdy.qk.wmu.edu.cn
排版 | 吴 珊
校对 | 王郦莹
责编 | 张海燕










