• 收藏
  • 加入书签
添加成功
收藏成功
分享

基于CT靶扫描技术的影像组学在肺结节良恶性诊断中的应用研究

叶钉利 黄志成 杨磊
  
大海媒体号
2024年199期
吉林省肿瘤医院放射线科 吉林 长春 130021

打开文本图片集

[摘  要]  目的  探讨基于CT靶扫描影像的特征提取和机器学习模型在预测肺结节良恶性中的应用价值。方法  回顾性分析524例术前行CT靶扫描检查且术后病理明确的肺结节患者资料,根据肺结节性质将良性结节分为第1组,恶性结节分为第2组。比较2组间性别和年龄差异。采用特征提取软件提取病灶区域三维纹理特征参数并保留2组间差异明显的影像组学特征,后筛选最佳影像组学特征构建预测模型。将所有数据按7:3比例分为训练集和验证集,采用8种机器学习算法对训练集和验证集进行分析,获得预测模型预测肺腺癌分化程度的ROC曲线及相应的AUC、特异度、敏感度及准确率。结果  第1组233例,第2组291例,2组间的性别(χ2=0.52,p=0.47)和年龄(t=1.24,p=0.22)均无统计学差异。共提取病灶三维纹理特征参数960个,其中2组间差异明显的影像组学特征共176个,最终保留25个最佳影像组学特征以构建预测模型。以随机森林模型为最佳分类器。预测模型预测验证集病理分型的AUC为0.823,其准确率、特异度、敏感度分别为0.761、0.686、0.840。结论  基于CT靶扫描的影像组学模型能有效预测肺结节的良恶性。

[关键词]  肺结节;良恶性;CT成像;特征提取;机器学习

[基金项目] 国家癌症中心攀登基金(NCC201907B04)。

[第一作者] 叶钉利,男,吉林长春人,硕士,主管技师。研究方向:医学影像技术和影像组学应用。

[通信作者] 杨磊,吉林省肿瘤医院放射线科,130021。

亚厘米肺结节是指肺部影像上各种大小、边缘清晰或模糊、直径小于等于1cm的局灶性圆形或类圆形致密影。根据性质,肺结节可以分为良性和恶性。良性结节常见于炎性刺激、真菌感染、肺结核、错构瘤、血管瘤等,恶性结节又称肺癌,是临床常见的呼吸系统恶性肿瘤[1],一般起源于肺上皮,按照组织病理学分型可分为肺腺癌、肺鳞状细胞癌、小细胞肺癌、大细胞肺癌、支气管肺泡癌等[2]。目前,对恶性肺结节的治疗方式首选手术治疗,并辅以放疗或化疗以提高疗效,对良性结节一般以随访观察和药物治疗为主。肺结节性质的鉴别诊断主要依赖于影像学检查、病理学检查和实验室检查,其中CT是肺结节检查、诊断与随访中最重要的检查方式,用于发现肺部病变、评估病情和指导治疗[3]。然而,CT检查虽然能够显示肺结节的大小、位置和形态,但无法直接判断其性质,且良恶性肺结节在CT图像上可能具有相似的表现,这为肺结节良恶性的鉴别诊断带来挑战。

CT靶扫描是一种高效、准确的CT检查技术,可以获得病灶区域更清晰准确的图像,显示更多的细节信息,有助于病灶的鉴别诊断。影像组学是一种利用算法对医学影像数据进行分析的方法,其借助计算机软件于医学影像数据中高通量的提取肉眼无法识别的影像学特征,并采用机器学习的方式构建预测模型,用于医疗决策[4]。本研究探讨基于CT靶扫描图像的影像组学模型在预测肺结节良恶性中的应用价值,为临床诊治提供参考依据。

1  资料与方法

1.1  一般资料  回顾性分析2019年1月—2023年12月于吉林省肿瘤医院接受手术治疗的肺结节患者的病理及影像资料,经过筛选,最终入组524例,其中男288例,女236例,年龄21~83岁,平均(57.5±9.8)岁。纳入标准:①手术治疗前于同1台成像设备接受胸部CT靶扫描检查;②术后病理有明确的诊断结果;③病灶长径≤1.0 cm。排除标准:①CT图像有明显的伪影。

1.2  仪器与方法  采用GE公司Optima 520型号的16排CT成像设备采集患者的常规胸部CT影像和靶扫描CT影像,患者平躺于检查床,采用头先进,双臂上举的检查体位,于吸气末屏气下采集胸部CT平扫影像。常规CT扫描参数:以人体中线为中心,扫描范围包括全肺、FOV为35cm、层厚层间距均为5 mm、管电压120 kV、管电流为smart model可根据患者体重自适应调节、重建矩阵512×512、转速75 rpm、扫描模式为螺旋扫描、螺距为0.98:1。靶扫描CT扫描参数:以病灶为中心,扫描范围包全病灶、FOV为5cm、层厚层间距均为1.25 mm,其余参数均与常规CT相同。

1.3  提取影像组学特征与机器学习  根据术后病理的分级结果将患者分为2组,第1组为肺结节良性组,第2组为肺结节恶性组。在感兴趣区域(region of interest, ROI)分割方面,由2名具有10年以上胸部CT诊断经验的主治医师采用ITK-snap(version 3)软件在CT靶扫描影像上沿肿瘤边界逐层勾画病灶的ROI,分割肿瘤区域(图1),当两名主治医师对病灶边界的划分存在争议时,由具有20年以上胸部CT诊断经验的副主任医师做最后决定,肿瘤区域分割后采用Python(version 3.8.5)中pyradiomics库函数提取病灶区域的影像组学特征参数,随后采用StandardScaler算法进行数据标准化,方程如下:

在数据标准化的过程中,X*代表标准化后的数值,X代表原始数据,µ代表原始数据的均值,σ代表原始数据的标准差。而后采用最小冗余最大相关性(minimum redundancy maximum relevance, mRMR)特征降维算法对2组间影像组学特征差异进行分析和筛选。以相关性和相似性分数作为衡量标准,最大化影像组学特征与分类变量之间的相关性,最小化特征与特征之间的相关性,筛选并保留组间差异明显的特征用以构建预测模型,采用试错法从保留15个特征到保留30个特征逐个尝试,并以验证组准确率作为评价指标寻找最佳特征数量。

按7:3的比例将数据集分为训练集和验证集。采用训练集数据对8种机器学习模型进行训练,采用验证集数据对8种机器学习模型(k-nearest neighbors、support vector machine、logistic regression、decision tree、gradient boosting decision tree、random forest、extreme gradient boosting、convolutional neural network)的诊断效能进行评价,以“准确率”为标准选择最佳机器学习模型,并获得最佳机器学习模型预测肺结节良恶性的ROC曲线及相应的AUC、准确率、特异度及敏感度。

1.4  临床信息获取  对入组病例的临床信息进行提取,获得包括性别、年龄、BMI、吸烟史、CEA水平、炎症指标、家族史、肺部疾病史、症状表现、职业暴露和既往癌症史在内的11个临床信息。

1.5  统计学分析  采用SPSS 25.0统计分析软件。计量资料以±s表示,计数资料以频数表示。采用χ2检验比较2组间性别差异,以独立样本t检验比较2组间年龄差异。P<0.05为差异有统计学意义。

2  结果

第1组包含233个良性肺结节病例,其中女109例,男124例,年龄21~79岁,平均(56.5±10.0)岁;第2组包含291个肺腺癌病例,其中女127例,男164例,年龄22~83岁,平均(58.4±9.7)岁,2组间的性别(χ2=0.52,p=0.47)和年龄(t=1.24,p=0.22)差异均无统计学意义,其他临床信息在2组间的差异均无统计学意义(p>0.05)

每个病灶提取得到1960个影像组学特征参数,其中有176个特征在2组间的差异具有统计学意义,最终保留25个具有最小冗余和最大相关性的特征用于构建预测模型,见表1。最小冗余最大相关性特征分析在总数据集中的热图见图2A,特征筛选得到的影像组学特征之间的相关性矩阵图见图2B。预测模型在验证集的预测结果显示,RF机器学习模型在验证集的准确率最高(表2),该机器学习模型在训练集和验证集预测肺结节良恶性的ROC曲线和决策曲线见图3,相应的准确率分别为0.816和0.761,特异度分别为0.895和0.686,敏感度分别为0.731和0.840,AUC分别为0.880和0.823,关于7种机器学习模型在训练集和验证集的预测结果见表2。

3  讨论

随着高分辨CT的普及和人们对健康体检认识的加深,越来越多的肺结节在检查中被发现,准确诊断结节性质对临床治疗决策至关重要。既往研究报道,虽然肺结节的大小和密度对其性质的判断有重要意义,但仅凭这两个因素难以做出准确诊断[5]。良恶性结节在CT图像上可能具有相似的表现,这为肺结节的准确诊断带来挑战。对肺结节影像学诊断的深入研究受到影像清晰度的制约[6],常规体层CT影像在观察微小病变时存在一定的局限性,使结节内部的结构显示模糊,缺乏细节信息,导致诊断困难。为了对微小病灶进行高清成像,靶扫描技术应运而生。

CT靶扫描是一种特殊的CT成像技术,核心在于在成像矩阵不变的情况下通过缩小扫描视野以获得更小的像素,从而提高组织结构的空间分辨率。这种技术的优势在于它可以针对特定区域或病变进行更精确的检查。通过调节定位中心和扫描参数,可以直接对病灶区域进行薄层高分辨扫描,从而获取更详细、更准确的图像信息。这种技术对于肺结节病变的诊断尤为重要,因为它不仅可以提高空间分辨率,还可以使图像中的病变组织的边缘更锐利、更清晰,有助于更准确地判断病变的性质和范围。

影像组学可以通过数据挖掘获得更多肉眼无法观察到的信息用于鉴别诊断并提高诊断效能。影像组学借助计算机软件可以对CT影像数据信息进行深度挖掘,从而获得与组织学、病理学相关的特征信息[7]。相关研究表明,影像组学的研究方法在疾病诊断、性质鉴别、风险评估、患者预后等方面均有较好的表现,目前已在肺癌分期、肺癌病理学分型、评估肺癌基因表达及肺癌预后[8]等方面表现出潜在的应用价值。王辉[9]等人将CT图像与影像组学技术结合用于肺结节的检出,表现出较高的检出准确率。林文俊[10]等人对CT图像进行纹理分析和特征提取,构建了机器学习模型用于预测非小细胞肺癌患者中T淋巴细胞浸润程度,获得了令人满意的结果。薛丽敏[11]等人采用CT图像获得的影像组学特征用于预测磨玻璃肺结节的2年增长,具有较好的预测效果。本研究采用影像组学的研究方法,结合特征筛选与机器学习,探讨基于CT靶扫描影像的特征提取和机器学习模型在预测肺结节良恶性中的应用价值。

本研究采用了大样本研究,通过对524例肺结节CT靶扫描图像分析,以探讨影像组学方法在鉴别肺结节良恶性中的应用价值。本研究从每个病灶中提取得到1960个影像组学特征,经过最小冗余最大相关性特征筛选后获得25个影像组学特征,并将获得的影像组学特征同时应用于8种机器学习模型的训练和验证,以寻找出最适合的预测模型。结果显示,8种机器学习模型中RF模型的准确率最高,其在验证组的AUC和准确率分别为0.823和0.761。

本研究存在一些不足之处,回顾性研究方式在病例选择上可能存在选择偏倚,缺少外部数据验证,可能使研究结果缺乏拓展性。

综上所述,基于CT靶扫描影像的特征提取和机器学习模型能有效预测肺结节的良恶性,其中以RF模型的诊断效能最优。

[参考文献]

[1]  杨亚冰,田丰.小细胞肺癌的靶向治疗与免疫治疗的研究进展[J].癌症进展,2020,18(14):1424-1426.

[2]  WHO Classification of Tumours Editorial Board. WHO classification of tumours. Thoracic Tumours[M]. 5th ed. Lyon: IARC Press, 2021.

[3]  王续,吴文浩.低剂量电子计算机断层扫描在孤立性肺结节随访中的价值分析[J].生物医学工程学进展, 2021, 第42卷(1): 42-44

[4]   LAMBIN P, RIOS V E, LEIJENAAR R, et al. Radiomics: extracting more information from medical images using advanced feature analysis[J]. Eur J Cancer, 2012, 48(4):441-446.

[5]  孙姗姗,李惠民,陆建平.肺结节大小和密度测量在AIS精准判断中的价值[J].中国CT和MRI杂志,2018,第16卷(9): 1-3,33

[6]  段海峰,贾永军,马光明,张喜荣,陈静,樊丽华,于楠,杨创勃.低剂量CT结合自适应统计迭代重建测量体模肺结节[J].中国医学影像技术,2021,第37卷(2): 278-283

[7]  叶钉利, 姜雯, 吴佳妮, 等. 基于CT影像组学模型预测肺原位腺癌及微浸润腺癌与浸润性腺癌[J]. 中国医学影像技术, 2020, 36(9): 1345-1349.

[8]  杨露, 欧阳治强, 单海燕, 等. 影像组学在预测非小细胞肺癌表皮生长因子受体基因突变中的应用[J]. 放射学实践, 2023, 38(6): 783-787.

[9]  王辉,张伟,时凤宝.CT靶扫描及3D重建技术结合人工智能诊断肺结节临床应用[J].医学影像学杂志,2024,第34卷(3): 148-150,156

[10]  林文俊,李凯.CT影像组学对T1期非小细胞肺癌中CD8+T淋巴细胞浸润程度的分析[J].医学影像学杂志,2023,33(11):1989-1993.

[11]  薛丽敏,李瀛,强金伟,于红,张玉,邓林,陶广昱.基于靶扫描和常规扫描CT 图像的影像组学模型预测肺磨玻璃结节的2年生长[J].复旦学报(医学版),2021,第48卷(6): 739-747,771

*本文暂不支持打印功能

monitor