• 收藏
  • 加入书签
添加成功
收藏成功
分享

基于LightGBM算法多因子选股和Hurst指数择时的人工智能量化投资策略研究

潘宇欣 洪梦琳 景晓兰 李浩
  
大众理论媒体号
2023年12期
浙江万里学院商学院 浙江 宁波 315100

打开文本图片集

摘    要:本文根据沪深300股票池选取因子并进行处理,将因子带入LightGBM算法模型进行分类预测,建立股票仓。在择时方面,通过计算Hurst指数构建了股票卖出信号的交易策略,最终构建了基于LightGBM算法的多因子选股模型和Hurst择时的量化选股模型。

关 键 词:LightGBM算法,Hurst择时,多因子选股,量化模型

1引言

近年,量化投资的优势慢慢显现,投资者逐渐将目光转向了量化策略及机器学习来预测股票。肖国荣根据BP神经网络的非线性逼近能力和自学能力,对基金价格数据进行训练和预测,研究表明该方法能更准确地捕捉基金价格的变化趋势。韩磊使用BP神经网络训练学习历史数据,有效的找到股票市场变动规律,达到预测股票未来价格趋势的目的。本文基于LightGBM算法构建多因子选股模型,利用Hurst指数进行择时,构建出合理且有效的量化模型以获取投资收益。

2数据来源及处理

本文选取沪深300股票自2010年1月至2020年12月的数据作为数据样本,选取8类因子作为因子库并验证其有效性。根据因子与因变量的相关性、收益率、显著度剔除无效因子。考虑到某些数据存在异常值或缺失值,首先对沪深300股票中所有数据进行预处理,剔除下一个交易日停牌的股票、下一个月交易量为0的股票和上市三个月内的股票,从而提升算法的稳定性和准确度。

3 算法简介

LightGBM是基于Boosting算法的梯度提升集成算法,能够自动获取特征因子的重要性,本文利用这一特点将有效因子选取出来,其数学原理这里不再赘述。

Hurst指数主要用来判断一个序列是否为随机序列。Hurst指数是处于0至1之间的统计量。当时,此时为随机序列,因此将H和0.5进行比较,可以判断序列的持续性和持续性程度。当时,表示股市未来的趋势会与前期走势相似,Hurst 值越大,则表明当前市场的记忆性越强,与前期走势越相近。

4有效因子及lightGBM算法应用

本文主要利用LightGBM,通过计算得到每个因子对收益率的影响程度,然后对其进行重要性排序。多次尝试因子的组合,最终得到特征分数最高的十个因子如下表1所示。

将历史数据中的每只股票对应的数据看作一条样本,将所有样本数据组合在一起作为训练集,根据收益率将股票从高到低进行排序,通过标记转化为分类预测模型。带入LightGBM模型进行训练,以此构建股票组合,每个月进行调仓换股。

由于金融数据存在时序性,本文采用时序交叉验证法对数据进行处理,增强模型对不同市场的辨识度。将前三年数据作为训练集,带入LightGBM模型进行训练,第一次训练后,带入接下来一个月的数据作为测试集进行预测,修改优化模型。按照收益率对模型预测得到的股票进行排序,选取前10只股票,再向前

滚动一个月,循环滚动。通过计算每一期滚动验证集的准确率,可以看出前期滚动模型处于调整阶段,越往后模型的准确率越高,证明滚动调参对提高模型的准确度有显著效果。滚动结束后,最后筛选的股票带入测试集数据验证。按照收益率对模型预测得到的股票进行排序,选取前10只股票建仓。

结合上述分析,选取沪深300股票带入数据分析最终得到Hurst指数为0.638。由于股市是一个动态变化的过程,静态的Hurst指数不能一直作为判断股价上涨下跌的指标,因此引入局部Hurst指数概念来作为动态市场的衡量指标。另外,曲线线性关系消失点即为破坏市场记忆性的点。通过计算统计量随着n的变化趋势可知,上证指数平均循环周期为230天,即Hurst指数使用超过230 天将失去市场记忆。因此本策略将在230天后重新计算Hurst值。计算出Hurst<0.638时,卖出股票。

5 策略回测与评价

根据策略思路,通过同花顺mindgo平台试运行从最终回测结果看,该策略的收益率为302.42%,年化收益率为13.9%,夏普比率为0.53,Alpha值为0.11,Beta值为0.31,最大回测率为39.69%,超越所选的多只股票的平均收益率,证明了该策略可以获取超额收益,是有效的交易策略。策略收益大于基准收益,证

明了策略有实现的价值。

6 结论与基金资助

通过研究,我们发现基于LightGBM算法的多因子选股策略在复杂的股票数据堆积下具有良好的预测能力。通过回归法对筛选的因子进行有效性验证,根据因子与因变量相关性、收益均值、收益显著性等指标筛选出有效因子,是合理有效的。通过滚动回测发现,每月测试集的正确率呈现先降低后升高的趋势,说明LightGBM算法模型在前期不断调试,后期逐渐匹配,说明模型的滚动策略是合理且有效的。本文受到浙江省科技厅公益技术研究项目(编号LGF22G010002)的资助。

参考文献

[1] Vapnik, V. N. An Overview of Statistical Learning Theory[J]. IEEE Transactions on Neural Networks, 1999, 10: 988–999.

[2]Abraham A., Nath B., and Mahanti P. K. Hybrid Intelligent Systems for Stock Market Analysis[J]. In Computational science-ICCS, 2001, 10:337–345.

[3]肖国荣. BP 神经网络在基金价格预测中的应用研究[J]. 计算机仿真, 2011, 28(03):373-376.

[4]韩磊. 利用 BP 神经网络系统对股票市场进行预测与分析的研究[D]. 天津大学,2013,5.

[5]马晓君, 沙靖岚, 牛雪琪. 基于 LightGBM 算法的 P2P 项目信用评级模型的设计及应用[J]. 数量经济技术经济研究, 2018, 35(05): 144-160

*本文暂不支持打印功能

monitor