• 收藏
  • 加入书签
添加成功
收藏成功
分享

基于随机森林模型对信用卡持有人的还款概率预测分析

徐丽伟
  
学术与研究
2025年67期
北京联合大学商务学院,北京市,100000

摘要:本文旨在对个人信用卡还款行为进行研究,针对近年来中国信用卡逾期人数和金额显著增长的挑战,深入探讨了个人特征与经济状况对信用卡还款行为的具体影响。本研究从年龄、家属人数等个人特征,以及负债比率、月收入、贷款数量等经济状况两个维度出发,通过收集相关数据并运用大数据分析方法 Python 和 MATLAB,深入分析这些因素如何作用于信用卡持有者的还款决策,并通过构建贝叶斯模型,分析在特定情况下,预测信用卡持有人是否会还款,从而帮助银行更好管控风险、计提坏账准备。

关键词:随机森林模型;信用卡还款行为

1.引言

近年来,个人信用卡还款情况呈现出一定的挑战。据官方数据显示,2024 年中国信用卡逾期人数已超过3000 万,较上一年度增长了约 15% ;信用卡逾期金额累计超过数百亿元,同比增长 20% 这些数据表明,信用卡逾期问题日益严峻。信用卡作为一种便捷的支付工具,极大地促进了消费活动,同时也对个人信用管理和还款行为提出了更高要求。人们是否按时还信用卡,已成为一个涉及多个复杂因素的决策过程,这一现象的深入研究对于理解现代金融行为具有重要意义。

2.文献综述

1.1 研究背景

信用卡是一种建立在信用和借贷关系上的电子支付卡,也被称之为贷记卡,不需要任何担保和保证金[1]。作为个人银行业务不可或缺的一环,信用卡业务受到越来越多的关注,成为银行业未来发展的重点领域,其不仅为消费者提供了便捷的支付手段,也为银行带来了可观的收益[2]。然而,在中国这一新兴市场中,信用卡业务的发展之路并非一帆风顺。由于中国的信贷基础相对薄弱,信贷政策尚处于逐步完善的过程中,经济发展与信贷风险之间的平衡成为亟待解决的问题[3]。如何在促进信贷市场快速发展的同时,有效防范和控制信贷风险,成为摆在中国银行业面前的一道难题。

信用评估作为预测信用卡申请人或借款人违约概率的重要手段[4],它通过对申请人的历史信用记录和还款能力进行综合统计分析,评估其信用状况,为银行决策提供重要依据。但在信用卡市场中,信息不对称现象尤为显著且不容忽视,掌握信息比较充分的一方,往往处于比较有利的地位,拥有更多的选择主动权;而信息贫乏的一方,则处于比较不利的地位,他们更多是被动的接受[5]。所以,借助大数据模型来预测信用卡持卡人的还款意愿,对于银行业的稳定和健康发展有一定的必要性。

3.实证分析

3.1 数据预处理和变量选取

先对数据进行预处理,使用 Matlab 导入数据,剔除数据中的异常值。通过粗糙集发现,年龄、负债比率、月收入、贷款数量以及家属人数所对应的矩阵中,1 是占大多数的,所以可以认为,年龄、负债比率、月收入、贷款数量以及家属人数对于是否还款的影响是显著的,粗糙集的模型拟合度很好,可以作为关键指标。

3.2 实证结果分析

使用 statsmodels 库的 Logit 函数,基于自变量 X 和因变量 y 训练了一个逻辑回归模型。模型结果显示,年龄、月收入和家属人数在 0.05 显著水平下,对于还款发生的可能性有着显著影响,而负债比率和贷款数量的 P值较高,表明它们对还款概率的影响不显著。其中年龄的系数为-0.0419,表明年龄每增加一岁,还款概率的对数几率减少 0.0419 月收入系数为-6.666e-05,表明月收入每增加一元,还款概率的对数几率减少 0.0419。家属人数的系数为0.2575,家属人数每增加一人,还款概率的对数几率增加 0.2575 并且所有变量的VIF 值都远小于 10,表明不存在多重共线性问题。

3.3 随机森林预测

为了预测信用卡持有人的还款意愿与还款概率,构建随机森林模。随机森林分类器对数据进行分类,将数据集分割为训练集和测试集,其中测试集占比 80%,预测集占 20% ,随机种子设置为 42 以保证结果可复现。然后计算准确度,第一次运行模型的准确率为 0.91,第二次添加数据运行的准确率为 0.98375,这表明模型在测试集上的表现略有差异,但总体上是准确的。模型在当前任务上表现良好。最后对测试集进行预测,我们根据信用卡持有人的特征来预测其还款概率,使用的数据集给出了不同信用卡持卡人的特征,包括持卡人年龄、负债比率、月收入、贷款数量、家属人数,预测的结果符合数据的调查结果。此模型可以用来帮助银行通过观察这些指标,来监测持卡人,提高还款的可能性,减少坏账的可能性。

4.总结

在本研究中,我们深入探讨了影响个人信用卡还款行为的多重因素,通过实证分析,揭示了年龄、月收入、家属人数等个人特征与负债比率、贷款数量等经济状况对信用卡还款决策的显著影响。研究结果表明,年龄与月收入的增加与还款概率的降低呈现正相关性,而家属人数的增加则有助于提高还款的可能性。通过构建随机森林模型并优化,来帮助银行进行预测分析持卡人是否会定期还款,以此为银行更好的进行风险管控和计提坏账准备。

通过对信用卡还款行为的深入分析,本研究不仅为金融机构的风险管理提供了科学依据,也为个人消费者和政府监管机构提供了宝贵的信息和建议。随着金融市场的不断发展和变化,我们期待未来的研究能够在此基础上,不断拓展和深化,为信用卡市场的健康发展贡献更多的智慧和力量。

5.政策建议

(1)倡导多元化与智能化的还款方式

在现有基础上,进一步丰富信用卡的还款渠道,如通过手机银行 APP、第三方支付平台等线上工具,以及ATM 机、银行网点等传统渠道,为持卡人提供更加灵活便捷的还款选择。同时,积极推广自动还款功能,让持卡人可以设置固定的还款日期和金额,系统自动完成扣款,有效避免因遗忘而导致的逾期问题,提升还款的准时性和安全性。

(2)优化逾期罚息与宽限期政策

金融机构在设定逾期罚息时,应该考虑适度降低罚息利率,避免过高的罚息给持卡人带来过大的经济压力。同时,建议设置合理的逾期宽限期,允许持卡人在一定时间内补救逾期问题,体现金融机构的人文关怀,同时也有助于维护良好的信用环境。

(3)加强消费者教育与信用修复机制建设

金融机构应加大对信用卡使用规则和还款政策的宣传力度,通过线上线下渠道,普及信用卡相关知识,提高持卡人的信用意识和金融素养。同时,建议建立信用修复机制,允许持卡人在逾期后,通过积极还款和良好信用行为的积累,逐步修复受损的信用评分,这不仅有助于提升持卡人的信用水平,也能增强金融机构的客户满意度和忠诚度。

参考文献:

[1]杨中.我国商业银行信用卡信用风险评估研究[D].湖南农业大学,2016.

[2] 郑璇.基于 Probit 模型对消费者使用银行卡频率的影响因素分析—— 以湖南为例[J].消费经济,2011,27(04):49-52

[3]向晖,杨胜刚.基于聚类的 bagging 集成消费者信用评估模型[J].消费经济,2011,27(01):50-52

[4] 闫 旭 . 基 于 信 用 评 分 卡 的 刑 释 人 员 再 犯 风 险 评 价 模 型 [D]. 吉 林 大学,2022.DOI:10.27162/d.cnki.gjlin.2022.001813.

[5] 李 云 川 . 银 行 信 用 卡 风 险 资 产 管 理 模 式 优 化 研 究 [D]. 重 庆 理 工 大学,2024.DOI:10.27753/d.cnki.gcqgx.2024.000187.

作者简介:徐丽伟(1998 年—),女,汉族,籍贯:内蒙古自治区通辽市,研究生在读,研究方向:数字金融,单位:北京联合大学商务学院。

*本文暂不支持打印功能

monitor