- 收藏
- 加入书签
多模态数据融合在老年人下肢运动能力评价中的研究进展与应用
摘要:随着我国人口老龄化进程加速,老年人下肢运动能力下降已成为影响其生活质量的重要因素。传统的下肢运动能力评价方法存在主观性强、定量标准缺乏、数据整合不足等问题,难以满足精准化评估需求。本文综述了基于多模态数据融合的下肢运动能力评价方法研究现状,重点分析了步态图像、关节运动学数据和地面反作用力数据的采集与处理技术,深入探讨了基于改进 CNN 与决策融合算法的评价方法以及基于Xception-LSTM 网络与核主成分分析的评价方法。研究表明,多模态数据融合能够有效提高下肢运动能力评估的准确性和全面性,改进的深度学习模型能够更精确地从步态特征中提取关键信息。同时,本文还探讨了下肢运动能力评价系统平台的设计与实现,为老年人提供个性化助行设备和控制策略提供了理论基础和技术支持。未来的研究方向应着重于深度学习算法的优化、多模态数据融合策略的改进、评价指标体系的标准化以及评价系统的智能化和便携化,为解决老龄化社会中老年人下肢功能障碍问题提供更加全面和有效的解决方案。
关键词:多模态数据融合;下肢运动能力;深度学习;评价方法;评价系统
人口老龄化已成为全球性趋势,尤其在我国表现得更为明显。据统计,截至 2022 年底,我国 60 岁以上老年人口已达 2.8 亿,占总人口的 19.8%,预计到 2050 年将超过总人口的 30%[1]。随着年龄增长,老年人下肢运动能力普遍下降,导致行走障碍、平衡能力减弱、跌倒风险增加等问题,严重影响其生活质量和身心健康。因此,准确评估老年人下肢运动能力,并据此提供个性化干预和辅助方案,已成为当前老年健康研究的重要课题。
传统的下肢运动能力评价方法主要包括功能性测试(如计时起立行走测试、Berg 平衡量表等)和临床观察评估,这些方法操作简便,但存在主观性强、定量标准缺乏、测量精度有限等问题。近年来,随着计算机视觉、生物力学分析和人工智能技术的快速发展,基于多模态数据的下肢运动能力评价方法逐渐兴起,为精准评估老年人下肢功能提供了新的技术路径[2]。
多模态数据融合是指将来自不同传感器或不同角度的数据进行综合分析,以获取更全面、准确的信息。在下肢运动能力评价中,常见的多模态数据包括步态图像数据、关节运动学数据和地面反作用力数据等。通过融合这些数据,可以从多个维度分析老年人的下肢运动特征,建立更加精确和客观的评价模型[3]特别是近年来深度学习技术的快速发展,为多模态数据的处理和融合提供了强大工具,显著提高了评价的准确性和适用性。
本文旨在全面综述基于多模态数据融合的老年人下肢运动能力评价方法研究现状,重点分析改进CNN 与决策融合算法的评价方法以及基于Xception-LSTM 网络与核主成分分析的评价方法,并探讨下肢运动能力评价系统平台的设计与实现。通过本研究,期望为老年人提供个性化助行设备和控制策略提供理论基础和技术支持,促进老年人下肢功能障碍问题的有效解决。
步态图像是分析人体运动特征的重要信息源,可直观反映个体步行姿态、步幅长度、关节活动度等特征。步态图像的采集主要通过高速摄像机完成,采集过程需控制实验环境的照明条件、背景色调和步行路线等因素,以确保数据质量。通常采用前视、侧视和后视三个角度的摄像机同时记录被试者的自然步行状态,采集频率一般为30-120 帧/ 秒,以捕捉完整的步态周期。
2. 多模态数据采集与处理2.1 步态图像数据采集与处
1. 引言
步态图像处理首先需要进行图像预处理,包括去噪、增强、分割等操作,提取人体轮廓并去除背景干扰。传统的步态图像特征提取方法包括基于模型的方法(如关节点跟踪、骨架模型等)和基于外观的方法(如轮廓提取、能量图等)。近年来,深度学习方法在步态特征提取中表现出显著优势,如卷积神经网络(CNN)能够自动学习步态图像的空间特征,长短期记忆网络(LSTM)能够捕捉步态序列的时间特征。
步态特征提取的难点在于个体差异大、环境变化敏感、视角依赖性强等。为克服这些困难,研究者提出了多种改进技术,如多视角融合、时空特征结合、注意力机制等。特别是结合空间金字塔池化(SPP)层的改进 CNN 模型,能够处理不同尺寸的输入图像,生成固定长度的特征向量,有效提高了模型的泛化能力和识别精度。
关节运动学数据主要反映人体关节在运动过程中的角度变化、速度和加速度信息,是评估下肢功能的重要指标。数据采集主要采用光学运动捕捉系统或惯性传感器系统两种方式。光学系统通过多个红外摄像机捕捉贴附在人体关键点的反光标记,精确记录其三维坐标;惯性传感器系统则通过佩戴在关节处的小型惯性测量单元(IMU)直接测量关节角度和运动参数 [4-8]。
地面反作用力(Ground Reaction Force, GRF)数据是评估人体步行动力学特性的核心指标,反映了身体与地面之间的相互作用力。数据采集主要通过力平台或压力步态分析系统完成,前者测量整体反作用力,后者可获取足底各区域的压力分布情况。采集频率一般为100-1000Hz,以捕捉步态周期中的快速力变化。
GRF 数据处理首先需要进行时间归一化,将不同步态周期的数据标准化到 0-100% 的相对时间尺度上。传统特征提取方法主要关注 GRF 曲线的峰值、谷值、峰值时间点等离散特征;而近年来的研究更倾向于采用主成分分析、独立成分分析等方法提取 GRF 曲线的整体模式特征,或应用小波分析等时频方法研究力变化的频域特性。
关节运动学数据处理首先需要进行滤波去噪和标准化处理,消除采集过程中的随机误差和系统误差。特征提取方面,传统方法主要关注关节角度的峰值、范围和各步态阶段的特征参数;而近年来的研究更倾向于采用主成分分析(PCA)等降维技术提取关节运动模式的主要特征,或应用小波变换、傅里叶变换等时频分析方法捕捉关节运动的频域特征。
关节运动学数据分析的难点在于个体差异导致的数据变异性大、关节角度精确测量难、多关节协同作用复杂等。研究者通过标准化处理、参考模型建立和异常模式识别等方法,提高了关节运动学数据分析的准确性和可靠性。特别是膝关节角度作为评估下肢功能的关键指标,通过 PCA 提取特征后结合最优分类算法,能够有效识别正常步态和病理步态的差异,为下肢运动能力评价提供重要依据。
2.2 关节运动学数据采集与处理
2.3 地面反作用力数据采集与处理
GRF 数据分析的难点在于步速对数据的显著影响、个体步行习惯差异大、异常模式多样化等。为克服这些困难,研究者提出了步速标准化、个性化参考模型建立和异常模式分类等方法。特别是通过 PCA 提取GRF 特征后结合分类算法,能够有效区分正常步态和病理步态,为下肢运动能力评价提供客观依据。
3. 基于 CNN 与决策融合的下肢运动能力评价方法
针对传统 CNN 在步态图像处理中存在的输入尺寸固定、网络收敛慢等问题,本研究设计了一种改进的 PC-CNN(SPP and COCOB CNN)网络结构。该网络在卷积层 C7 与全连接层 FC9 之间加入了空间金字塔池化层 SPP8,同时在网络训练过程中采用连续硬币投注优化算法(COCOB)代替传统的随机梯度下降(SGD)算法。
COCOB 优化算法是一种无需手动设置学习率的优化方法,它通过自适应调整每个参数的更新步长,实现更快的收敛速度和更稳定的训练过程。与传统SGD 相比,COCOB 不需要精心调整学习率超参数,大大简化了网络训练流程,且在实践中表现出更好的鲁棒性和收敛特性,特别适合处理步态数据这类具有高度个性化特征的数据。
在实践中,PC-CNN 网络将实验对象的对照组(年轻健康组,YG)的步态轮廓图像标记为1(正常组),实验对象的实验组(老年组EG、疾病组MG)的步态轮廓图像标记为0(病理组)。通过这种二分类设计,PC-CNN 网络能够有效学习正常步态和病理步态的差异特征,为后续的多模态融合奠定基础。
决策融合是一种集成学习方法,通过整合多个模型的决策结果,提高整体系统的性能和鲁棒性。在下肢运动能力评价中,决策融合模型整合了步态图像、膝关节角度和地面反作用力三种模态数据的分类结果,综合反映被试者的下肢功能状态。
空间金字塔池化层能够接受任意尺寸的输入图像,通过多尺度池化生成固定长度的特征向量,显著提高了网络的尺度不变性和泛化能力。相比传统的最大池化或平均池化,SPP 能够保留更多的空间结构信息,特别适合处理步态图像中不同步幅和姿态变化导致的尺寸差异。
3.2 多模态数据决策融合模型
3.1 改进 CNN 网络设计
多模态融合模型的建立主要分为四个步骤:首先,将数据集分为训练集和测试集;其次,利用训练集训练各模态的独立分类器;然后,通过测试集评估各分类器性能,为每种模态选择最佳分类器;最后,将这些最佳分类器的输出概率作为输入,训练决策融合算法。
对于膝关节角度和 GRF 数据,本研究采用 PCA 提取特征后,比较朴素贝叶斯(NB)、k 近邻算法(KNN)、支持向量机(SVM)和随机森林(RF)四种分类器的性能,选择最优分类器。在融合阶段,将PC-CNN 网络输出的 Softmax 概率和两种最优分类器的输出概率作为输入,通过神经网络(NN)、KNN、NB、SVM 和RF 五种融合算法构建最终的决策融合模型。
基于上述分析,单独分类器或融合模型的预测概率可定义为下肢运动能力评价指标(Gait AbilityScore, GAS),范围为 0 到 1,当 GAS 越接近 0 时,表示步态异常越严重。考虑到测量误差的影响,最终分析采用受试者多个实验样本的 GAS 平均值(Gait Ability Mean Score, GAMS)作为评价结果。
这种多模态决策融合方法充分利用了不同模态数据之间的互补性,能够全面捕捉步态异常的各种表现形式,提高评价的准确性和鲁棒性。特别是对于老年人这类步态特征复杂多变的群体,多模态融合能够从不同角度反映其下肢功能状态,为个性化干预提供精确依据[9]。
针对步态视频数据包含丰富的时空信息,单纯的 CNN 或 RNN 难以充分捕捉其特征的问题,本研究提出了一种 Xception-LSTM 并联网络结构。该网络由在 ImageNet 上预训练的 Xception 网络和双向 LSTM网络组成,通过注意力机制融合两个网络提取的特征,实现对步态视频的高效表征。
Xception 网络是一种基于深度可分离卷积的深度神经网络,包含14 个卷积块(Block_1 ~Block_14)。相比传统CNN,Xception 的核心创新在于将标准卷积分解为深度卷积和点卷积两步,大大减少了参数数量,同时保持或提高了模型性能。此外,Xception 还引入了残差连接,有效缓解了深度网络的梯度消失问题,加速了网络收敛过程。
4.1 Xception-LSTM 网络结构
4. 基于 Xception-LSTM 的下肢运动能力评价方法
双向 LSTM 网络包含两层 LSTM 层,能够同时考虑序列的前向和后向信息,特别适合捕捉步态视频
最后,通过神经网络注意力机制融合 Xception 和 LSTM 网络提取的特征,得到全连接层特征 FC。注意力机制能够自适应地调整不同特征的权重,突出重要信息,抑制次要信息,进一步提高了特征表征的有效性和判别力。
中的时间依赖特征。与单向 LSTM 相比,双向结构能够更全面地利用上下文信息,提高时序建模能力,对步态周期中的关键相位变化更为敏感。
在网络训练过程中,采用迁移学习策略,先固定 Xception 网络的所有卷积块参数,仅训练 LSTM 网络,然后再微调整个 Xception-LSTM 模型。这种分阶段训练方法有效降低了过拟合风险,提高了模型的泛化能力,特别适合处理数量有限的步态视频数据。
核主成分分析(Kernel Principal Component Analysis, KPCA)是 PCA 的非线性扩展,通过核函数将数据映射到高维特征空间,能够捕捉数据中的非线性结构。在下肢运动能力评价中,KPCA 用于对 Xception-LSTM 提取的步态视频特征与膝关节角度、GRF 数据的融合特征进行降维处理,去除冗余信息,提取主要特征模式。
特征融合过程首先将 Xception-LSTM 网络提取的全连接层特征 FC 与膝关节角度和 GRF 数据经归一化后串联成融合特征矩阵。归一化处理确保不同量级的特征能够在融合过程中得到公平对待,防止某些特征因数值较大而主导模型决策。
KPCA 降维过程通过定义阈值E 和方差贡献度(Variance account for, VAF)来确定降维后的特征维度根据实验分析,通常保留能解释 90% 以上原始数据方差的主成分,在保留关键信息的同时,有效降低了特征维度,提高了计算效率。
基于降维后的特征矩阵,建立下肢运动能力评价指标GAS。不同于基于CNN 与决策融合的评价方法,这里的 GAS 采用 Z-Score 转换后的数值,范围更广,结果大于或等于 100 表示运动能力正常;得分越低表示运动障碍越严重。这种指标设计更加符合临床评估习惯,便于与其他评估方法比较和结合。
4.2 基于 KPCA 的特征融合与评价指标
这种基于 Xception-LSTM 与 KPCA 的评价方法,充分利用了深度学习在视频处理中的优势和多模态数据的互补性,能够从时空两个维度全面捕捉步态特征,为下肢运动能力评价提供了一种高精度、高鲁棒性的技术路径。特别是针对老年人这类步态特征复杂多变的群体,该方法能够更准确地反映其下肢功能状态,为个性化康复和辅助方案提供科学依据[10]
Django 作为一个功能完备的Web 开发框架,提供了用户认证、数据库接口、模板渲染等核心功能,大大简化了系统开发流程。Bootstrap 框架则确保了系统界面的响应式设计,使系统能够在不同设备上(如PC、平板、手机)提供一致的用户体验。数据存储采用MySQL 数据库,具有良好的性能、可靠性和可扩展性,适合管理大量评估数据。
下肢运动能力评价系统平台采用 B/S(Browser/Server)架构,基于 Python 语言、Django 开发框架和 Bootstrap 前端框架实现。系统整体架构分为三层:表现层(前端界面)、业务逻辑层(服务器)和数据存储层(数据库)。这种分层设计有利于系统的开发、维护和扩展,同时支持多用户远程访问,提高系统的可用性和适用性。
系统功能模块主要包括评估信息管理、用户管理、角色管理和系统维护四大模块。评估信息管理模块负责下肢运动能力评估数据的录入、查询、统计和分析;用户管理模块负责受试者、评估人员等用户信息的管理;角色管理模块负责系统角色的权限设置和管理;系统维护模块负责系统日志、备份恢复等基础功能。
5. 下肢运动能力评价系统平台
5.1 系统架构与功能设计
特别是在评估信息管理方面,系统支持多模态数据的导入、处理和可视化展示,用户可以查看步态图像、关节角度曲线、地面反作用力曲线等原始数据,也可以查看基于CNN 与决策融合或Xception-LSTM与KPCA 的评价结果。系统还支持历史数据比较和趋势分析,帮助用户了解下肢功能的变化情况。
数据是评价系统的核心资产,数据管理与安全策略直接关系到系统的可用性和可信度。系统采用标准化的数据格式和接口,支持多种数据源的接入和整合,确保数据的一致性和完整性。数据存储采用分层结构,将原始数据、处理数据和分析结果分开存储,便于数据的管理和使用。
5.2 数据管理与安全策略
数据安全方面,系统实施了多层次的安全防护措施。在用户认证层面,采用用户名 / 密码认证和角色权限控制,确保用户只能访问其权限范围内的数据和功能。在数据传输层面,采用HTTPS 协议加密通信内容,防止数据在传输过程中被窃取或篡改。在数据存储层面,采用加密存储敏感信息,并定期备份重要数据,防止数据丢失或损坏。
综上所述,基于多模态数据融合的下肢运动能力评价方法,为老年人提供了更加精准、全面的评估手段,为个性化干预和辅助策略提供了科学依据,对提高老年人生活质量和健康水平具有重要意义。该方法为解决老龄化社会中的健康问题提供了重要工具,未来研究应着力于算法优化、系统智能化、标准化体系建设和个性化干预策略开发,为老年人提供更加精准、便捷的健康评估和服务。
[1] 国家统计局 . 中国统计年鉴 2023[M]. 北京 : 中国统计出版社 , 2023.[2] 张燕 , 李威 , 王建宙 , 等 . 基于 TF-CNN 与 KECA 的下肢运动能力评价方法 [J]. 仪器仪表学报 ,2018, 39(10): 211-222.[3] Pirker W, Katzenschlager R. Gait disorders in adults and the elderly[J]. WienerKlinische Wochenschrift, 2017, 129(3): 81-95.[4] Muro-de-la-Herran A, Garcia-Zapirain B, Mendez-Zorrilla A. Gait analysis methods:An overview of wearable and non-wearable systems, highlighting clinical applications[J].Sensors, 2014, 14(2): 3362-3394.[5] 张鹏, 刘叶, 王中智.PNF 对脑卒中偏瘫患者下肢运动及自动态平衡功能的影响[J]. 中国医学创新 , 2025, 22(07):73-76.[6] 刘小玲 , 姜财 , 章晨 , 等 . 三维步态分析在衰弱老年人中的应用进展 [J]. 中国医学创新 ,2024, 21(29): 174-178.[7] Whittle M W. Gait analysis: an introduction[M]. Oxford: Butterworth-Heinemann,2014.[8] 吕佳乐 , 高学山 , 石永杰 , 等 . 基于多传感器信息的人体下肢步态识别 [J]. 兵工自动化 ,2021, 40(10): 85-90.[9] 王成龙, 李明哲, 聂明剑, 王晶晶. 老年人时间- 空间步态特征和不良健康结局风险. 中国组织工程研究 , 2024, 28(34): 5565.[10] Misu S, Asai T, Doi R, et al. Association between gait abnormality andmalnutrition in a community-dwelling elderly population[J]. Geriatrics and GerontologyInternational, 2017, 17(8): 1155-1160.
为保护用户隐私,系统严格遵循相关法规和标准,如《网络安全法》、《个人信息保护法》等,只收集必要的个人信息,并在用户知情同意的前提下使用这些信息。系统还提供了数据匿名化和脱敏处理功能,在进行统计分析和科研使用时保护个人隐私。
系统的应用场景主要包括医疗机构、康复中心、养老机构和科研单位等。在医疗机构,系统可用于老年人下肢功能的筛查和评估,为临床诊断和治疗提供客观依据;在康复中心,系统可用于评估康复效果和制定个性化康复方案;在养老机构,系统可用于老年人下肢功能的定期监测和健康管理;在科研单位,系统可用于收集和分析大量下肢功能数据,支持相关研究工作。
系统评价主要考虑功能性、可用性、可靠性和安全性四个方面。功能性评价关注系统功能是否完备、准确,满足用户需求;可用性评价关注系统是否易于学习和使用,界面是否友好;可靠性评价关注系统是否稳定运行,能否处理异常情况;安全性评价关注系统是否能保护数据安全和用户隐私。
初步应用结果表明,系统能够准确评估老年人的下肢运动能力,提供个性化的助行设备建议和康复方案,得到了医护人员和老年用户的认可。特别是系统的可视化展示功能,让用户能够直观了解自己的下肢功能状态和变化趋势,增强了健康管理的积极性和参与度。
基金项目:福建省自然科学基金面上项目(项目名称:融合多模态数据的下肢运动能力评价方法与评价系统研究,项目编号2024J01867)资助
5.3 系统应用与评价
6. 结论
参考文献
京公网安备 11011302003690号