• 收藏
  • 加入书签
添加成功
收藏成功
分享

基于随机森林算法对首发缺血性脑卒中患者出院90d复发的预测作用分析

韩海荣 刘德全
  
卷宗
2023年1期
1.郑州大学附属洛阳中心医院 2.天津金域医学检验实验室有限公司

摘要:目的:探讨基于随机森林算法对首发缺血性脑卒中患者出院90d复发的预测作用。方法:对我院2021年06月2022年06月就诊的200例发缺血性脑卒中患者资料进行回顾性分析,其中,出院90d出现复发的为30例,设为复发组,另外170例未复发,设为正常组,应用随机森林算法和多因素Logistci回归模型对其复发的影响因素进行筛选,对比两种方式的准确度、灵敏度、特异度,并对随机森林算法的预测效果进行评价。结果:首发缺血性脑卒中患者出院90 d内复发率为15.00%(30/200)。随机森林算法的准确性、灵敏度、特异度明显高于多因素Logistci回归分析法(P<0.05)。结论:对于首发缺血性脑卒中患者出院90 d的复发预测,应用随机森林算法临床价值更高,值得进一步应用。

关键词:随机森林算法;首发;缺血性脑卒中;复发;预测

基金项目:洛阳市社会发展领域指导性科技计划项目;项目名称:基于随机森林算法利用脑卒中数据库建立缺血性脑卒中早期神经功能恶化(END)模型;课题编号:2022024Y;项目来源:河南省医学科技攻关计划联合共建项目;项目名称:非持续性亚临床甲减对急性缺血性脑卒中预后的影响及机制研究;课题编号:LHGJ20191206

在全球范围内,脑卒中具有较高的发病率、病死率、复发率。这些年来,国内外关于脑卒中复发的研究较多,但主要是研究脑卒中复发的独立危险因,对多因素联合预测的研究甚少。随机森林是应用分类树的算法,由于其对样本量无太高要求,且其稳定性较好,现阶段在人工智能、大数据分析等领域被广泛应用。为此,本文选取首发缺血性脑卒中患者进行研究,应用随机森林算法,预测其出院90d的复发情况,具体过程总结如下。

1.资料与方法

1.1一般资料

对我院2021年06月2022年06月就诊的200例发缺血性脑卒中患者资料进行回顾性分析,其中,出院90d复发的有30例,设为复发组,另外170例未复发,设为正常组。

纳入标准:对患者实施头颅CT、MRI检查后确诊的患者;出院诊断为缺血性脑卒中;配合度较高的患者。

排除标准:恶性肿瘤患者;心肝肾功能不全患者;出院90 d内死亡的患者;配合度较低患者。

1.2方法

应用大数据平台,收集患者基本资料,包括患者性别、年龄、高血压史、糖尿病史、吸烟史等;并且,对患者血液检查值进行统计,包括33个指标,主要有红细胞计数、血红蛋白、白细胞计数等。MHR=单核细胞计数/高密度脂蛋白胆固醇,NLR=中性粒细胞计数/淋巴细胞计数。患者出院90 d后,采用电话随访的形式,询问患者复发情况。判定标准为:90 d内新发神经系统表现、原有症状突然加重,或对其实施头颅MRI、CT检查确诊新发。

1.3观察指标

应用随机森林算法和多因素Logistci回归模型对其复发的影响因素进行筛选,对比两种方式的准确度、灵敏度、特异度,并对随机森林算法的预测效果进行评价。

1.4统计学方法

应用SPSS20.0软件分析,计量数据采用均数±标准差(X±S)表示,计数资料采用百分比表示;等级资料采用秩和检验。计数数据采用x²检验,如果两组P<0.05,差异具有统计学意义。

2.结果

2.1 两组临床资料对比

首发缺血性脑卒中患者出院90 d内复发率为15.00%(30/200)。复发组和正常组对比,结果显示男性、吸烟、饮酒﹑糖尿病﹑高脂血症比例提升,肌酐、MHR水平升高,舒张压、总蛋白、白蛋白、高密度脂蛋白胆固醇、载脂蛋白A、载脂蛋白B表现为更低水平 (P<0.05)。其他特征指标相对比,均有一致性(P>0.05)。

2.2多因素Logistic回归分析复发影响因素

首发缺血性脑卒中患者出院90 d内复发的独立危险为:饮酒﹑糖尿病﹑高脂血症﹑舒张压﹑载脂蛋白A。

2.3随机森林算法的预测分析

随机森林计算法中,重要程度排序如下:载脂蛋白A、天门冬氨酸氨基转移酶、白蛋白、红细胞压积﹑糖尿病﹑乳酸脱氢酶、肌酐、尿素、饮酒、总蛋白。

2.4比较两种方式应用价值

随机森林模型的准确性、灵敏度、特异度明显高于多因素Logistci回归分析法(P<0.05)。

3.讨论

目前,随机森林算法已广泛应用于人工智能等领域,在医学相关领域研究较少。本文记过显示,首发缺血性脑卒中患者出院90 d内复发率为15.00%(30/200),应用随机森林算法在排名前6的影响因素中,载脂蛋白A、糖尿病、饮酒与多因素Logistic回归分析中差异有统计学意义的变量一致。还要,随机森林算法的准确性、灵敏性、特异性均高于多因素Logistic回归分析法。由此证实,随机森林算法准确率较高。

在随机森林算法的各项因素中,当前公认的脑卒中复发的危险因素是饮酒、糖尿病;载脂蛋白A主要存在于高密度脂蛋白中,可对低密度脂蛋白氧化、激活卵磷脂胆固醇脂酰基转移酶进行有效抑制,减少炎症反应,降低复发率;天门冬氨酸氨基转移酶是细胞酶类,可在全身细胞内存在,一旦脑细胞受到损害,会促使细胞内酶释放活性增加,现阶段未出现对脑卒中复发的影响相关研究;临床上,通常采用血清总蛋白、白蛋白对患者的营养状态进行评价,其水平降低,会延长患者的住院时间,增加感染率等,导致脑卒中的复发;红细胞压积对血黏度产生重要影响,动脉血管的血流动力异常会对脑卒中斑块的形成、发展产生影响;脑组织受损时,乳酸脱氢酶极其敏感,大量蛋白酶通过血脑屏障进入血液,进而增加乳酸脱氢酶活性,导致脑卒中复发; 急性肾功能障碍的显著症状就是肌酐、尿素出现变化,肾功能不全属于脑卒中发生的独立危险因素,其和脑卒中复发的关系还需深入探讨。

综上,针对首发缺血性脑卒中患者出院90 d的复发预测,应用随机森林算法更为准确有效,值得临床大力应用。

参考文献

[1]李素娜,胡佳佳,吴慧.优化急诊护理路径对首发缺血性脑卒中患者抢救效率及后期康复的影响[J].基层医学论坛,2020,24(36):5189-5191.

[2]时兴华,曲立新,周君,杨风刚,王鹏.首发急性缺血性脑卒中患者神经功能损伤程度及其危险因素分析[J].实用预防医学,2022,29(07):861-863.

[3]张晓林. 基于机器学习的首发缺血性脑卒中患者1年复发危险因素及预测研究[D].南昌大学,2022.

作者简介

韩海荣(1979-)女,汉族,山东济宁人,硕士研究生,主治医师,研究方向:中西医结合内科。

刘德全(1984-)男,汉族,山东菏泽人,硕士研究生,副主任医师,研究方向:神经病学。

*本文暂不支持打印功能

monitor