收藏
加入书签

添加成功

收藏成功

基于深度学习的蒙特卡罗期权定价研究

张校瑜

澳门城市大学数据科学学院中国澳门

摘要股票预测是投资领域关键性课题。针对浅层神经网络模型在股票隐含波动率预测中存在的非线性、高噪声以及时变特性，本文构建了一种基于深层控制变量网络的蒙特卡罗期权定价模型。选取沪深300ETF 期权 2024 年2 月17日至2025 年7 月10 日所有交易日数据作为时政分析对象。利用标的收盘价格作为输入，学习短期局部时序模式以及建模长期依赖与全局结构，通过门控融合得到最终的价格预测。通过MSE、MAE、MAPE 和R-squared 这四个模型评价指标来描述不同模型的预测精度，且用统一的数据进行比对，定量且直观的证明本文的模型在定价精度和稳定性方面的优势。

关键词：股票预测；深度学习；蒙特卡罗模拟；期权定价

Abstract Stock forecasting is a key topic in the field of investment.Neural Network model of shallow implied volatility of stock prediction of nonlinear，high noise and time-varying characteristics，this paper constructed a Control variable is based on the Deep Network montecarlo option pricing model.The data of all trading days of the CSI 300 ETF options from February 17，2024 to July 10，2025 are selected as the object for political and economic analysis.The model uses the underlying closing price as input，learns the short-term local time series pattern and models the long-term dependence and global structure，and obtains the final price prediction through gate fusion.Through the four model evaluation indicators of MSE，MAE，MAPE and R-squared，the prediction accuracy of different models is described，and the unified data is compared to quantitatively and intuitively prove the advantages of the model in terms of pricing accuracy and stability.

Key words：Stock prediction;Deep learning;Monte Carlo simulation;Option pricing

1. 绪论

1.1 研究背景及意义

自1997 年来深度学习的快速发展使得智能领域开启其飞速发展的势头。因前些年疫情的影响，社交媒体平台的带货直播与期券交易市场在易显著增长。深度学习以其强大的数据处理能力有效挖掘大量时间序列中潜在的有效信息，通过测模型实现预测股票的隐含波动率，明晰数据之间的长期依赖关系。

波动率是一种动态的复杂的金融学现象，其由深度学习模型得出的预测结果是能深度监测市场波动的变量，如利率、风险以及商品价格等。隐含波动率不同于其他历史价格数据，利用经典的Black–Scholes 期权定价模型，将市场上各种期权的实际交易价格代入到该期权定价公式中再通过公式来反向推出波动率的数值。

期权的交易价格直接会受到隐含波动率的影响，因为其最为直观得反映了市场中对于未来价格波动的集体趋势和预期，众多的市场交易者会利用去观测隐含波动率的变化来判断这笔期权是否会不会被高估或者被低估，也可以用以判断交易市场中的情绪，投资者断定乐观情绪亦或者是恐慌情绪来合理的去调控自己的仓位。所有的期权交易者们在做相关期权时必要去结合隐含波动率、标的价格和时间这三者的三个维度出发来进行相应的策略布局，在市场中用于衡量整体波动预期以及紧急避险压力指标的VIX 指数和GVZ 指数等市场情绪指标就都是基于隐含波动率来计算的，反映出期权交易市场中的标的价格波动并预测其预期值的同时顺带揭示供需关系以及情绪价值，是期权市场的投资者用以制定市场策略的重要工具。

1.2 研究思路及框架

本文以期权作为研究对象，期权是一段时间内以特定的价格买入或者是卖出，看涨期权或者是看跌期权标的资产的权力，期权的价格与未来标的资产价格的波动变化相关，即我们常讲的价格越高，看涨期权的价值越高以及看跌期权的价值越低，当隐含波动率高得时候期权价格通常也会较高，因为结合隐含波动率、标的资产价格和时间这三个维度来说较高得波动率会影响着标的资产价格大幅波动，作为期权的购买方来说取得的高收益有获得很大利益的可能性，也就需要支付相比旧时更高的期权价格。对于市场的中有极大风险的投资者来说，在期权价格便宜的时期将其买入会得到较高的买入期权的性价比，但是其标的资产价格浮动也就越小，风险越小性价比高波动越平稳很难会得到较高的收益回报。

近年来，深度学习在函数逼近方面展现出强大的能力，对于期权定价问题，将“从参数空间到期权价格”的映射视为一个待学习的高维非线性函数，我们再构建神经网络对该函数逼近，在保持较高精度的同时提升计算速度。在本文中，设计了深层控制变量网络模型，并借助沪深300 期权数据集，系统地进行指标的评价实验。基于蒙特卡洛期权定价公式，我们结合深度学习相关理论构建出期权价格预测模型。首先对 BS 定价模型进行充分地研究后，再来借助深度学习理论中的神经网络方法构建期权价格预测模型，以期来根据沪深300 期权数据对未来的期权价格进行较高精度的预测与分析。再经过对比分析线性回归、浅层神经网络和深层控制变量网络三个模型，同时运用多种评价指标对预测值与真实值之间的误差进行分析对比，并评价模型性能。

1.3 文献综述

期权定价理论的研究可追溯至二十世纪初，1900 年，Louis Bachelier 首次提出了一个随机模型用以刻画金融资产的价格波动【1】，被公认为现代金融学的里程碑。不过由于当时金融市场的局限，该理论并未得到广泛应用。

至 1973 年，Black 和 Scholes 推导 Black-Scholes 期权定价公式【2】为后来学者去研究期权定价的理论奠定了根本框架，Merton 在该模型的基础上进行修改提出 Black-Scholes-Merton 模型【3】更进一步接近现实情况；Hutchinson 等人于 1994 年将机器学习应用于金融衍生品的定价研究，提出数据驱动下基于人工神经网络的非参数化期权定价模型；Parkinson 假设无法漂移的连续几何布朗运动，该方法利用的不是收盘价反而去利用最高价和最低价；Garman 和Klass 利用开盘价、收盘价、最高价和最低价提出另一个代理变量；Rogers 和 Satchell 找到允许漂移的连续几何布朗运动代理变量，优于前文的Garman Klass 方法；Yang 和Zhang 假设进行处理漂移和开盘价的跳跃情况一个代理变量，在模拟中得到证实；Parkinson 和Garman Klass 代理变量高估存在大漂移时的真实方差，同时，只有Yang 和Zhang 的代理变量是在存在大的开盘跳跃的几何布朗运动下时是稳定的。

2.线性回归与浅层神经网络

2.1 线性回归

线性回归模型是传统的统计学的分析方法，该方法实际中用于确定两个以及多个变量之间的定量关系，即预测目标与输入特征之间存在着相对应的线性关系，即期权价格与期权的金融参数之间的线性关系。

本文应用 Black-Scholes 模型，由 Fischer Black、Myron Scholes 和 Robert Merton 于 1973 年提出。BS 模型首先提供一个封闭解公式，能够快速计算出欧式期权的理论价格，同时提供精确的数学工具用以简化期权定价，推动衍生品市场的飞速发展也促进期权市场交易规模的显著扩大。该假设无套利原则是市场中根本不存在没有风险的套利机会，资产价格严格地遵循着几何的布朗运动（GBM），随机变量的对数服从布朗运动即价格波动随机但连续。设St表示时间t 的资产价格或随机变量值，

几何布朗运动的公式：

dt ⁺ σSt dWt（1）

，μ为资产预期收益率，σ为波动率，dWt为标准布朗运动。

在期权交易的环境中假设投资者可以随时以无风险利率 r 借贷，那么该期权交易市场就没有任何的交易成本和以及本来可能产生的税收，因为标的资产价格特性是波动率σ和无风险利率 r 恒定。BS 模型的核心是看涨期权和看跌期权。

看涨期权的公式：

C=S₀ ⋅ N（d1） − X ⋅ e−rT ⋅ N（d2）（2）

看跌期权的公式：

P = X ⋅ e−rT ⋅ N（ − d2） − S0 ⋅ N（ − d1）（3）

公式中的变量定义：

d1 = ln （ S0/X）+（r+σ2 ）T（4）

（5）

其中，S0为标的资产当前价格，X 为期权执行价格，T 为距离期权到期的时间以年来计算，r 为无风险利率，σ为标的资产价格的波动率，N（d）为标准正态分布函数的累积分布值。

BS 模型一直以来都被投资者用来作为定价的基准，利用模型计算出期权的理论价格并用输出的价格；来参考评估期权市场的资产价格是否合理。但是期权市场中的隐含波动率常常伴随着时间和价格进行变化导致误差，且BS 模型忽略税收及市场流动性问题。

2.2 浅层神经网络

由于BS 模型的在复杂市场环境上的一些局限性，投资者使用多层感知机（MLP）架构进行尝试，其深度模型在金融领域展现强大的潜力。且此浅层神经网络模型在输入端采用了原始金融参数，加入特征工程所构造的额外特征如S_0/K、对数价内程度等。浅层神经网络包含1-3 个隐藏层的前馈神经网络，因其结构简单参数量少较为适合中小规模数据的分类与回归任务通过权重矩阵和偏置向量实现特征映射与非线性进行变换。

隐藏层的引入赋予了浅层神经网络模型出色的非线性的表达能力，根据通用逼近定理，包含一个隐藏层的前馈神经网络可以在任意精度下逼近任何连续函数。激活函数的存在使得网络能够对输入特征进行自适应变换，将原始的金融参数映射到更具解释力的高阶抽象特征空间，进而提升期权定价的准确性。在训练过程中，网络通过反向传播算法调整所有权重和偏置，最小化预测价格与市场真实价格之间的均方误差，获得数据驱动的定价模型。

3.预测模型构建

3.1 样本选取

3.1.1 样本产品描述

本文实证研究所选取的样本主体是沪深300ETF 期权，沪深300ETF 是以沪深300 指数为标的的交易型开放式指数基金（ETF），可以使得广大投资者能够以较低成本来参与中国A 股市场核心股的投资。

3.1.2 样本数据范围

本文样本数据的时间跨度为 2024 年2 月17 日至2025 年 7 月 10 日所有交易日数据作为时政分析对象，经过剔除因节假日等市场休市情形导致的缺失数据值之后，共得到11671 组数据。选取2024 年2 月17 日至2025年 3 月 27 日，共 9879 组数据作为训练集，选取 2025 年 3 月 28 日至 2025 年 7 月 10 日，共 1792 组数据作为测试集。

3.2 数据预处理

3.2.1 确定输入输出变量

本文选取的已知变量，包括期权标的资产的市场价格、期权的行权价格执行价、从当前距离到期日剩余时间T（折算成年）、无风险利率、标的资产价格的历史波动率作为输入变量，输出变量为当前收盘价格。

3.2.2 数据预处理

先对原始数据进行清洗和筛选，以确保正常进行处理缺失值和剔除异常值，并采取离差标准化的方法来对原始数据进行归一化处理，并且没有对无风险利率及历史波动率HV 进行归一化处理。

本文的初始价格与执行价均在[50，150]区间内均匀采样，无风险利率在[0，0.1]区间内均匀采样，波动率在[0.1，0.5]区间内采样，到期时间在[ 组参数（S，K，r，σ，T），利用 BS 闭式公式计算欧式看涨期权价格并将其作为理论在理论真值周围加入相对尺度约为 5% 的高斯噪声，得到一个作为模型的蒙特卡罗估计。这些金融领域的特征是能够在一定程度上线性化部分非难度的同时进一步增强我们构建的模型的可解释性。

3.3 深度学习模型的构建

3.3.1 多元线性回归模型

本文使用 python 来进行构建神经网络模型的操作，对比模型一为多元线性回归模型，线性回归模型的输入特征仅包括原始期权参数，标的资产价格执行价格 1率期权类型看涨或看跌。使用原始参数（S，K，r，σ，T）作为输入，Black–Scholes 定价函数本无法捕捉非线性模式，使用普通最小二乘法（OLS）进行参数估计，线性回归模型是征之间线性关系的最基本参数化方法。尽管隐含波动率与期权定价因素之间的实线性回归仍常被用作评估非线性模型改进效果的基准。

3.3.2 浅层神经网络模型

对比模型二为浅层神经网络模型，采用单隐层多层感知机结构，隐含层神经元数量约为32，激活函数为ReLU，优化算法为Adam，并使用早停策略避免过拟合。浅层神经网络模型初步引入非线性的建模能力，输入特征仅包括原始期权参数，标的资产价格执行价格、无风险利率以及期权类型看涨或看跌，在输入端中使用了扩展特征的集合，其中包括moneyness、log_moneyness、sqrt_T 等扩展特征，使得浅层神经网络能够在较浅地结构下捕捉更多地非线性关系。

浅层神经网络模型的隐藏层包含 32 个神经元，并采用了修正线性单元（ReLU）激活函数。我们把初始学习率的值设置为0.001，该值既能实现快速收敛又能避免参数振荡是最理想的数值。并且使用32 的批量大小足够以在GPU 的笔记本电脑内存利用率和梯度估计可靠性之间来得以实现最佳的平衡。

采取提前停止的办法是为了能够显示提高泛化能力并减少过拟合现象，从原始训练集中随机选取15%的部分书数据作为验证子集。在每次训练周期结束后都会进行评估验证损失，假设在连续进行10 个周期内均没有观察到验证损失的改善，那么我我们此时把patience 的值设置为10，这样做之后训练将被迫终止，而且保留对应于验证损失最小的训练周期的模型参数。这种能有效提前终止的策略可以确保良好的泛化能力的同时尽量避免了对训练数据的过度拟合。

这种仅包含一个隐藏层的浅层神经网络能够有效地模拟潜在波动动态中的非线性模式。其性能是显著优于传统的线性回归模型。

3.3.3 深层控制变量网络模型

本文提出的深层控制变量网络模型是在浅层神经网络基础上的改进版本，在Li 等人SketchMLP 的基础上进行的改进。本文深层控制变量网络模型的核心创新体现在两个方面的扩展，一是将MC_coarse 作为额外特征直接输入网络；二是将原本网络的结构加深为两层隐含层，显著增强网络对复杂非线性映射的表达能力。这种设计与近年来传统数值方法与深度学习的深度融合思路相契合，利用传统方法快速给出粗略估计，再由深度网络学习残差或校正项，从而实现精度与效率的平衡。

控制变量法是经典方差缩减技术的其中一种，我们一般都会在蒙特卡罗模拟中通过引入与目标变量高度相关的辅助变量来降低估计误差，在其基础上构造一个蒙特卡罗粗估计特征，针对于训练样本通过利用该样本的参数，利用执行少量的路径实验选取的是 200 条的蒙特卡罗模拟，用来模拟标的资产价格在几何布朗运动下的演化过程，演化完成后从而获得期权价格的近似估计值，再通过 Black-Scholes 闭合公式来反推出对应的隐含波动率。不过由于模拟的200 条路径数量远少于常规要求毕竟通常需要上万条蒙特卡洛的模拟路径，所以该粗估计包含有一定的噪声，但该蒙特卡罗估计蕴含传统数值方法对波动率的基础实验认知。我们将此粗估计作为额外的输入特征加入神经网络，也就相当于为深层控制变量网络模型模型提供了一个初始猜测，能够使网络可以专注于学习真实隐含波动率与这一粗估计之间的残差关系。另外从函数逼近的角度看，网络实质上在学习映射使得I෢V Γ=f（x，IV_MC），由于 IV_MC 已接近真实值，深层控制变量网络只需对残差Δ Γ=IV_true-IV_MC 进行校正的结果也显著降低了学习难度，从而提升模型的收敛速度与预测精度。

在获得粗估计的额外输入特征集后，我们设计了更深层的神经网络结构充分挖掘数据中的复杂因子。该模型的第一隐藏层包含 64 个神经元，激活函数同样为为ReLU，第一隐藏层的作用是将输入特征映射到更高维的表示空间，提取初级抽象特征；第二隐藏层总共包含32 个神经元，同样采用ReLU 激活函数，进一步压缩特征维度并提炼更高阶的非线性组合。64-32 的配置在参数量和表达能力之间取得了良好平衡，并且相比起单隐层的32 个神经元，加深网络并适当增加第一层宽度能够逐层提取更抽象更鲁棒性的特征，从而更好地拟合隐含波动率曲面中的细微结构。选用ReLU 来激活函数是因为其计算高效且能缓解梯度消失的特性，而将Dropout 的丢弃率设定为0.1，也是在提供轻度正则化，避免因过度约束而损失模型的拟合能力。

3.3.4 深层控制变量网络模型的损失函数

深层控制变量网络的训练目标是最小化预测隐含波动率与真实隐含波动率之间的差异，因此采用均方误差（MSE）作为损失函数，定义如下：

（6）

式（6）中 N 为批量样本数，MSE 有助于引导模型重点来关注偏差较大的样本继而提高模型整体的预测精度。

本研究的优化器同样选用Adam，初始学习率设为0.001，与浅层神经网络保持一致，以控制变量便于比较。批量大小设为32，最大训练轮数为200。力过拟合再次应用略，在每一轮训练后计算验证集损失，若连续 10 轮（patience=10）未见下降，则停训练的时刻的模型参数。验证集是从原始训练集中随机抽取到15%样本，抽取到的样本不参与梯度独立评估模型泛化能力。本研究的深层控制变量网络具有能够有效融合蒙特卡罗模拟与深度学习的强大拟合能力，从而实现对隐含波动率的高精度预测以及后续的期权定价任务。

图1 深层控制变量网络模型构架

3.3.4 蒙特卡洛期权定价

本研究采用蒙特卡罗模拟方法计算期权的理论价格，蒙特卡罗是基于大数定律的一种数值方法，是通过生成大量标的资产价格的可能路径来估算期权在即将到期时的预期收益，并使估算出的贴现到当前。蒙特卡罗期权定价具有高度的灵活性咳哟有效的处理复杂的支付结构和路径依赖型期权。

假定0 时当前资产价格为S0，则T 时资产价格可表示为：

（7）

其中WT遵循正态分布与平均值为 0 和方差为 T，看涨期权的收益为max （S_T-K，0），看跌期权的收益率为max （K-S_T）。

3.4 实验结果分析与对比

三种模型均采用均方误差作为训练损失函数，通过随机梯度下降变体进行优化，线性回归模型使用标准正规方程或等价的数值求解方法，浅层神经网络与深层控制变量网络模型则采用固定学习率、最大迭代轮数与早停策略的组合，获得相对平衡的训练时间与收敛效果，本研究通过MAE、RMSE、MAPE 和R²这四项指标来全面评价三个模型性能。

表 1 列出了三种模型在测试集上的性能指标对比

表1 直观看出深层控制变量网络在MAE、RMSE 和 MAPE 三个指标上均取得了最小值。R²显著高于线性回型并略优于浅层神经网络。表明深层控制变量网络在整体拟合能力和误差控制方面均处于最优水平。

表2 线性回归模型部分预测结果

线性回归模型预测值与真实值偏差较大，部分样本存在明显高估或低估。

表3 浅层神经网络模型部分预测结果

浅层神经网络预测比线性回归近，但与真实值仍存在一定差距。

表4 深层控制变量网络模型部分预测结果

深层控制变量网络预测值与真实值对比线性回归和浅层神经网络都更接近。

3.5 图像分析

为了直观表示三种模型在不同参数区域下的表现，本研究对测试集上的预测结果进行了多角度的可视化分析，大部分点紧密分布在对角线附近仅在极端数组合下出现少量偏离，说明深层控制变量网络模型在绝大多数情形下都能给出接近理论真值的估计，而线性散点图表现出明显的系统性偏差，浅层神经网络则介于两者之间。

图2 深层模型在测试集上的真值-预测散点图

图3 三种模型绝对误差分布的箱线图对比

图 3 展示深层控制变量网络模型的绝对误差中位数最低，箱体高度最小，表明其误差分布最为集中，同时异常值数量也较少，显示出比线性回归模型和浅层神经网络模型有更良好的稳定性和鲁棒性。

图4 在固定 r、σ、T 为中位数时，BS_true 在S0-K 平面上的二维热力图

图 4 的理论价格在S0-K 平面上呈现平滑的非线性形态，等高线随着S0增大而整体抬升，并伴随着K 增大而整体降低，与金融直觉表现的高度一致，表现出简单线性模型无法准确捕捉定价函数形状，深层网络可以通过非线性激活能够更好地逼近这一复杂曲面。

4.结论与展望

通过本次实验，验证了深度学习与蒙特卡罗控制变量在欧式期权定价问题上的有效性。深层控制变量网络在隐含波动率预测上显著优于线性回归、浅层神经网络，MAE 和RMSE 都更低的同时R²达到0.93。基于预测隐含波动率的蒙特卡罗定价误差同样最小，并且误差分布更集中以及模型稳定性更强，证明了引入MC_coarse特征和采用更深网络结构的设计思路是合理且有效的。本文的研究工作丰富了期权定价的应用，为投资者提供了新的参考。

参考文献

【1】 Bachelier L.Théorie de la Spéculation[J].Annales scientifiques de l'École Normale Supérieure，1900，17（1）：21-86.

【2】 Black，F.，&Scholes，M.（1973）.The Pricing of Options and Corporate Liabilities.Journal of Political Economy，81（3），637–654.

【3】 Merton R C.Theory of rational option pricing[J].The Bell Journal of Economics and Management Science，1973，4（1）：141-183.

*本文暂不支持打印功能