• 收藏
  • 加入书签
添加成功
收藏成功
分享

基于深度学习与多模态超声图像的胎儿肺成熟度评估研究

田雪琴 李喆时
  
学术与研究
2025年51期
石家庄理工职业学院 河北石家庄 050228

摘要:【目的】针对传统胎儿肺成熟度超声评估方法存在分类单一、依赖主观经验等问题,提出一种基于深度学习与多模态超声图像的量化评估模型,为围产期临床决策提供客观依据。【方法】收集 1800 例孕 22-39 周胎儿的多模态超声图像(二维灰阶 + 三维断层成像),设计“局部区域随机擦除”数据增强策略,构建双分支改进ResNet-50 网络,通过跨模态注意力机制融合二维与三维特征,并引入对比学习优化特征区分度。模型经多中心盲法验证,评估指标包括平均绝对误差(MAE)、灵敏度、特异性及 AUC。【结果】模型预测胎肺龄的 MAE 为( 1.1±0.3 )周,灵敏度达 89.3% ,特异性为 91. 7% ,AUC 为 0.93,显著优于单模态 ResNet-50(MAE=1.6 周)及传统 Logistic 回归( MAE=2. 8 周)。消融实验表明,局部擦除策略使MAE 降低0.3 周,跨模态注意力机制提升灵敏度 4.2% 。【结论】多模态数据融合与对比学习方法可有效提升胎儿肺成熟度评估精度,模型具备临床推广潜力。

关键词:胎儿肺成熟度;多模态超声;残差网络;对比学习;跨模态融合

1. 引言

胎儿肺成熟度不足是早产儿呼吸窘迫综合征(RDS)的核心诱因[1],传统羊膜腔穿刺术因有创性难以普及,而无创超声评估多依赖医生经验,存在主观性强、分类粗糙(仅成熟 / 未成熟二分类)等局限[2]。近年深度学习技术为医学影像分析提供新思路[3],但现有研究多聚焦单模态二维超声图像,缺乏对三维空间信息的利用及细粒度特征挖掘。

本研究创新性提出:

1. 多模态数据融合:联合二维灰阶超声的纹理细节与三维断层成像的空间结构 [4],构建互补性特征表达;

2. 对抗噪声增强:设计“局部区域随机擦除”策略,模拟临床超声图像中的噪声干扰,提升模型鲁棒性;

3. 轻量化模型优化:在ResNet-50 中嵌入深度可分离卷积 [5] 与跨模态注意力模块,实现高精度与低计算成本的平衡。

2. 方法

2.1 数据采集与预处理

联合西安交通大学第一附属医院等 3 家三甲医院,前瞻性纳入孕 22-39 周单胎孕妇 1800 例,采集二维灰阶超声图像(探头频率3-5MHz)及三维断层成像(容积角 70° -90°),图像分辨率统一为512×512 像素。同步记录孕妇年龄、孕周、新生儿 Apgar 评分、呼吸系统疾病等临床数据。数据增强包括局部擦除与弹性形变。

2.2 模型架构设计

模型由双分支 ResNet-50、跨模态注意力模块及对比学习优化层构成:

1. 双分支特征提取:

分支 1(二维灰阶图像):通过 ResNet-50 提取肺纹理的局部特征(如支气管树形态、肺泡密度);

分支 2(三维断层成像):利用 3D 卷积层捕捉肺部空间结构特征(如肺叶体积、膈肌位置)。

2. 跨模态注意力融合:设计通道空间双重注意力机制,动态计算二维与三维特征的权重矩阵,公式为:

αi,j=Softmax(Wc⋅[F2D(i),F3D(j)])

其中 为可学习参数, F2D 、 F3D 分别为双分支输出特征。

2.3 训练与评估

模型训练采用初始学习率 0.001,批量大小 16,优化器选用AdamW,训练周期 100。评估指标包括平均绝对误差(MAE)、灵敏度、特异性及 ROC 曲线下面积(AUC)。对比基线为传统 Logistic 回归与单模态 ResNet-50。

3. 结果

3.1 模型性能对比

如表 1 所示,本文模型(多模态 + 对比学习)在测试集上 MAE 为1.1 周,显著优于单模态 ResNet-50(1.6 周)及传统方法(2.8 周)。特异性提升至 91.7% ,AUC 达 0.93。

表1 不同方法性能对比

3.2 消融实验

局部擦除策略:MAE 降低0.3 周( 1.41.1) );

跨模态注意力:灵敏度提升 4.2% ( );

对比学习优化:AUC 提升0.04( 0.890.93) )。

3.3 临床验证

在合作医院的盲法验证中,模型对 50 例早产儿(孕 28-32 周)的肺成熟度预测准确率达 86% ,误诊率较医生经验判断降低 32% 。

4. 讨论

4.1 多模态融合的价值

三维断层成像补充了二维图像的空间深度信息。实验表明,当二维图像因胎位遮挡导致肺叶边界模糊时,三维特征可校正预测偏差,误差由 1.8 周降至 1.0 周。

4.2 对抗噪声的鲁棒性

局部擦除策略使模型在低质量图像(如存在声影或运动伪影)中保持稳定。对噪声图像的 MAE 波动仅为 ±0.2 周,优于未增强模型的±0.5 周。

4.3 局限性及改进方向

数据集中于孕中晚期,未来需纳入孕 20 周前样本以扩展应用范围。模型推理耗时0.8 秒/ 例,计划引入MobileNetV3 进一步轻量化。

5. 结论

本研究成功构建了基于深度学习与多模态超声图像的胎儿肺成熟度评估模型,通过融合二维灰阶图像的纹理细节与三维断层成像的空间结构特征,结合局部擦除增强策略与对比学习优化方法,显著提升了预测精度与鲁棒性。模型在包含 1800 例临床数据的多中心验证中表现优异,胎肺龄预测平均绝对误差为(1. 1±0.3 )周,灵敏度与特异性分别达 89.3% 和 91.7%,较传统方法误差降低 60% 以上。该模型将在合作医院开展临床试点应用,辅助医生快速评估早产儿肺发育风险,减少经验依赖导致的误诊问题。未来研究将进一步扩大数据覆盖范围(如纳入孕早期样本),优化模型轻量化部署效率,并探索其在胎儿脑、肝等多器官联合评估中的扩展潜力,为围产医学的智能化、精准化发展提供技术支撑。

参考文献:

[1] He K, Zhang X, Ren S, et al. Deep residual learning for image recognition. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2016: 770778.

[2] 李明 , 王芳 , 张伟 , 等 . 基于多模态超声图像与深度学习的胎儿肺成熟度评估研究 . 中国医学影像技术 , 2023, 39(5):689694.

[3] Chen L, Li Y, Wang S, et al. Multimodal fusion of 2D and 3D ultrasound for fetal organ development prediction. Medical Image Analysis, 2023, 85: 102876.

[4] 张华 , 刘洋 , 赵敏 , 等 . 基于改进 ResNet 的胎儿超声图像特征提取与分类研究 [J]. 中国医学影像技术 , 2023, 39(3):201-206.

作者简介:

田雪琴(1983—),女,汉族,河北保定人,硕士副教授,研究方向:人工智能技术。

基金项目:河北省教育厅科学研究项目资助(项目编号:QN2023137)

*本文暂不支持打印功能

monitor