A DEEP IMPLICIT-EXPLICIT MINIMIZING MOVEMENT METHOD FOR OPTION PRICING IN JUMP-DIFFUSION MODELS
创建于 更新于
摘要
本报告提出基于深度隐式-显式最小移动法结合残差型人工神经网络(ANN)的新方法,用于多资产跳跃扩散模型下的欧式篮子期权定价。通过Merton跳跃扩散模型数值实验验证该方法的计算效率及高维表现,包含积分算子的两种近似技术(稀疏格点Gauss-Hermite和ANN特制求积法),并通过与深度Galerkin及深度BSDE求解器对比展示了其优越性[page::0][page::1][page::4][page::10][page::14][page::15]。
速读内容
- 研究背景与问题定义 [page::0][page::1]
- 欧式篮子期权价格满足带跳跃扩散的偏积分微分方程(PIDE)。
- 采用Merton跳跃扩散模型刻画资产价格动态,包括布朗运动和Poisson跳跃,跳跃服从多元正态分布。
- 方法创新点 [page::3][page::4][page::6]
- 设计隐式-显式BDF时间步进的最小移动法,结合能量泛函和偏积分算子显式处理。
- 选用深度残差神经网络(DGM层)架构,分时刻重新训练并利用前一时刻网络参数初始化。
- 通过对解的分解为时间价值和内在价值,解决非零的非齐次边界条件问题。
- 积分算子计算技术 [page::8][page::9]
- (a) 利用跳跃协方差矩阵的SVD旋转坐标,采用稀疏Gauss–Hermite积分近似积分算子,实现高维稀疏采样。

- (b) 设计另一辅助神经网络,训练学习积分算子数值,提高计算效率。
- 数值实验与效果验证 [page::10][page::11][page::12][page::13][page::14]
- 5资产和15资产欧式篮子期权定价均表现优异,误差在10⁻³级,相较伪蒙特卡洛方法差距很小。
- ANN积分方法计算更快,约提升1.7倍速度,Gauss–Hermite方法在极端moneyness表现更好。



- 与现有机器学习定价方法对比 [page::14][page::15]
- 深度隐式-显式方法相较蒙特卡洛和深度BSDE求解器,在速度和误差间取得良好平衡。
- 相比深度Galerkin方法,隐式-显式方法在网络参数量与计算时间上更为高效。
| 方法 | 定价价值 | 绝对误差 | 运行时间(min) |
|--------------|----------|-----------|----------------|
| 蒙特卡洛MC | 0.1647 | - | 533 |
| 深度隐式-显式 | 0.1633 | 1.41E-3 | 885 |
| 深度BSDE | 0.1661 | 1.36E-3 | 376 |
| DGM (+1层) | 0.1509 | 1.38E-2 | 1330 |
| DGM (+2层) | 0.1669 | 2.14E-3 | 1634 |
深度阅读
金融研究报告深入分析
报告标题
A DEEP IMPLICIT-EXPLICIT MINIMIZING MOVEMENT METHOD FOR OPTION PRICING IN JUMP-DIFFUSION MODELS
作者:Emmanuil H. Georgoulis, Antonis Papapantoleon, Costas Smaragdakis
机构:赫瑞-瓦特大学(Heriot-Watt University)、国家技术大学雅典(National Technical University of Athens)、Institute of Applied and Computational Mathematics, FORTH等
日期:文中未明示具体发表日期,推测为2023年至2024年间
研究主题:在跳跃扩散模型下利用深度学习方法对欧式篮子期权进行定价的一种新型数值算法设计和实现
---
1. 元数据与报告概览
本报告聚焦于金融衍生品中欧式篮子期权的定价问题,其基础资产价格服从跳跃扩散过程。作者提出一种创新性的深度隐式-显式最小运动方法 (deep implicit-explicit minimizing movement method),结合深度残差神经网络(ANN)与时间步进优化,从而数值求解伴随的偏积分微分方程(PIDE)。
- 核心创新包括:
- 将期权定价问题表达为PIDE,采用最小运动方法构造时间步进的能量最小化框架,结合隐式-显式后向差分方法(BDF),保证数值稳定和计算效率。
- 对复杂的积分项采用两种高维数值积分策略:基于奇异值分解(SVD)自适应坐标轴的稀疏网格高斯-埃尔米特积分,和一种基于ANN的专用高维积分近似神经网络。
- 方法设计确保解的正确渐近行为(大底层价时保证边界条件的合理性),提高数值稳定性和准确性。
- 进行详细的数值实验验证,包括在Merton跳跃扩散模型下的低维(5维)和高维(15维)资产组合期权定价。
- 与现有的深度Galerkin方法(DGM)和深度BSDE方案(带跳跃)作对比,证明其在准确性和计算效率上的竞争力。
总体而言,报告主张该新方法能够有效缓解传统网格或变分方法中的维度灾难,适用于多资产期权定价问题,尤其适合跳跃模型的复杂积分项处理。
---
2. 逐节深度解读
2.1 引言与研究背景(第0-2页)
- 研究背景:
篮子期权涉及多个资产,价值受多个标的的加权组合影响。其支付结构为:
\[
\operatorname{Payoff}(x) = \left(\sum{i=1}^d \alphai xi - 1\right)^+,
\]
其中 \( xi = ST^i / K \) 表示归一化资产价格(moneyness),\(\{\alphai\}\)为资产权重,和为1。
- 跳跃扩散模型意义:
传统布莱克-斯科尔斯模型无法捕捉资产价格的跳跃行为,跳跃扩散(如Merton模型)更贴合实际市场,能够描绘资产对数收益的肥尾和偏斜现象,进而反映市场波动微笑。
- 文献综述:
- Merton模型作为跳跃扩散经典框架:股价由几何布朗运动+泊松跳跃组成,跳跃幅度服从多元正态分布,跳跃强度和幅度可通过市场数据估计。
- 业界主要通过傅里叶变换或COS法则定价单资产期权,但高维时方法受限(有效维度通常不超过8-10)。
- 有限差分、有限元方法直接求解PIDE在高维同样遭遇“维度灾难”。
- 报告方法亮点:
- 利用深度残差神经网络处理高维空间项,利用隐式-显式BDF时间离散获得数值稳定性。
- 基于De Giorgi最小运动方法理论,构造时间分步的能量最小化问题,利用上一时间步ANN参数为初始值,加速训练过程。
---
2.2 跳跃扩散模型数学表述(第2-3页)
- 以Merton模型为例,定义资产价格动态:
\[
St^{(i)} = S0^{(i)} \exp\left( bi t + \sigmai Wt^{(i)} + \sum{k=1}^{Nt} Zk^{(i)} \right),
\]
其中 \(Wt^{(i)}\) 为标准布朗运动,\(Nt\) 是强度为 \(\lambda\) 的泊松过程, \(Zk^{(i)}\) 为跳跃幅度,服从多维正态分布,且资产之间的依赖体现在扩散相关系数、跳跃相关性以及跳跃时刻的一致性。
- 等价鞅测度下,漂移项 \(b
\[
bi = r - \frac{1}{2} \sigmai^2 - \lambda \left( e^{\mu{Ji} + \frac{1}{2}\sigma{Ji}^2} - 1 \right),
\]
确保资产折现价格为鞅。
- 期权定价满足偏积分微分方程(PIDE):
\[
\frac{\partial u}{\partial t} - \frac{1}{2}\sum{i,j} \sigmai \rho{ij} \sigmaj xi xj \frac{\partial^2 u}{\partial xi \partial xj} + \sumi bi xi \frac{\partial u}{\partial xi} + r u - I\varphi[u] = 0,
\]
带初始条件为期权支付。
- 积分算子定义为:
\[
I\varphi[u] = \lambda \int{\mathbb{R}^d} \big(u(t, x e^z) - u(t,x)\big) \varphi(dz),
\]
\(\varphi\)为跳跃幅度的密度函数。
---
2.3 PIDE的泛函形式与数值方法(第3-4页)
- 定义更一般的算子 \(\mathcal{A}\):
\[
\mathcal{A} u = -\sum{i,j} a{ij}(x) \frac{\partial^2 u}{\partial xi \partial xj} + \sumi bi(x) \frac{\partial u}{\partial xi} + r u - I\nu[u].
\]
- 将高阶微分项写为散度形式:
\[
\mathcal{A}u = \mathcal{L} u + f[u],
\]
其中 \(\mathcal{L}\) 是自伴算子,包含对称部分(扩散及利率项),\(f[\cdot]\) 包含非对称漂移与积分项。
- 时间离散采用隐式-显式(IMEX)后向差分公式(BDF),包含Euler(二阶BDF-2)方法:
\[
\frac{u^k - u^{k-1}}{\tau} + \mathcal{L} u^k + f[u^{k-1}] = 0,
\]
- 关键在于该时间差分方程是某个能量泛函的欧拉-拉格朗日方程,可转化为带权重的最小化问题:
\[
\minu \frac{1}{2}\|\betap u^k - \sum \betaj u^{k-j-1}\|^2 + \tau \int \mathcal{E}[u] dx + \tau \sum \gammaj \int f[u^{k-j-1}] u dx,
\]
其中 \(\mathcal{E}[u]\) 为Dirichlet能量。
---
2.4 解的分解与边界截断(第4-5页)
- 期权价格解 \(u\) 近似分为两部分:
\[
u(t,x) = w(t,x) + v(t,x),
\]
其中
- \(v(t,x)\) 为内在价值(intrinsic value),显式已知且可据估计,表达式为
\[
v(t,x) := \left(\sumi \alphai xi - e^{-rt} \right)^+,
\]
- \(w(t,x) \geq 0\) 为时间价值(time value),代表超出内在价值的期权价值,且对于极端大市价有随之趋近于0的渐近行为。
- 通过分解,只对 \(w\) 施加零边界条件,使之适合在有限域 \(\Omega = [0, x{\max}]^d\) 上求解,避免无界域上的边界难题。
- 设计了光滑近似(如解的下界的Sigmoid光滑)以解决Heaviside函数的非光滑问题,控制平滑参数 \(\eta\) 调节精度和梯度平滑度。
- 提出域截断策略,通过构造映射 \(x \to y = q(x) x\) 将无穷域投射到有限域中的子集 \(\mathcal{R}\),并对超出部分用线性涨落近似连接,保证高市价区间内解的延拓合理。
- 图2.1演示了二维情况下的截断与映射,为数值计算提供基础。
---
2.5 深度神经网络架构与训练(第6-8页)
- 利用残差型深度神经网络(DGM层结构,由Sirignano & Spiliopoulos提出)对时间步解 \(U^k\) 进行空间函数近似。
- 对输入映射采用双层隐含层的残差结构,层间输出融合门控机制(G, Z, R, H)增强可表达能力。输出拼接时间价值、内在价值平滑项及截断线性补偿项,保证函数渐近特性。
- 参数优化通过最小化时间步对应的能量泛函,以Adam优化器迭代完成,且利用前一时间步参数作为初始值减少训练开销。
- 训练数据利用蒙特卡洛均匀采样点离散化积分项,结合Sobol低差异序列生成器提高采样效率。
- 初始化阶段,设置 \(w^0=0\) 并附以小幅平滑函数引导,避免网络权重初始稀疏收敛困难。
- 对积分算子 \(I\nu\) ,提出两种数值近似策略:
- 稀疏高斯-埃尔米特(Gauss-Hermite)积分法,基于协方差矩阵SVD后变换坐标,构建高效稀疏节点积分公式。该方法对高维正态跳跃强相关场景有效。
- 基于辅助神经网络直接拟合积分算子的高效估计器。训练时通过蒙特卡洛近似采样跳跃分布数据并最小化估计误差完成学习。计算效率高但在极端市价区表现略逊。
- 训练过程在每一时间步交替优化积分网络参数\(\phi^k\)和主解网络参数\(\theta^k\),保证整体数值一致性和效率。
---
2.6 数值结果分析(第10-14页)
- 参数设定:
\(\sigmai=0.5\),资产间扩散相关系数 \(\rho{ij} = \delta{ij} + 0.5(1-\delta{ij})\),跳跃强度 \(\lambda=1\),跳跃幅度协方差 \(\rho{J{ij}} = \delta{ij} + 0.2(1-\delta{ij})\),分别展开5维和15维测试。
- 5资产测试 (Gauss-Hermite积分) :
- 时间步长选择:Euler \(\tau=0.01\),BDF-2 \(\tau=0.04\)。
- 结果显示两者均与扩展Quasi Monte Carlo (QMC)接近,最大误差约\(10^{-3}\),Euler略优但较慢(慢1.8倍)。
- 价格和期权支付差值符合预期,数值稳定,无明显震荡。
- 5资产测试 (ANN积分) :
- 通过辅助神经网络计算积分,误差水平与Gauss-Hermite相近,计算速度快约1.7倍。
- ANN估计在常见市价区精度较好,而极端区性能略低于无采样依赖的Gauss-Hermite。
- 15资产测试 (仅ANN积分) :
- 使用相近时间步:Euler \(\tau=0.01\),BDF-2 \(\tau=0.03\)。
- 方法在三维资产维度提升情况下依旧保持较低误差,证明模型对高维跳跃资产篮子的良好适用性。
- BDF-2速度较Euler提升约1.7倍,但其时间步调小于5资产实验。
- 超参数设置与计算环境:
- 网络层数:2层DGM,每层64神经元。
- 学习率固定为 \(3 \times 10^{-4}\) ,采用Adam优化器。
- 训练使用Sobol序列保证采样均匀性。
- 在DelftBlue超算节点完成,硬件含12核心Intel CPU及NVIDIA Tesla V100S GPU。
---
2.7 与其他机器学习定价方法的比较(第14-15页)
- 对比对象:
- 深度BSDE求解器(Gnoatto等,2022),主要定位单点初始条件的价格学习。
- 深度Galerkin方法(DGM,Sirignano & Spiliopoulos,2018),通用PDE解法,隐式处理积分,适用空间时间全域求解。
- 差异点:
- BSDE方法只计算单点初始价格,适合快速估计单价,难以获得空间-时间全域解。
- DGM和本方法(deep IMEX)均一次训练得到空间时间域完整解,便于微分希腊字母敏感度计算。
- 实验结果(5资产欧式篮子期权,独立资产情形):
| 方法 | 定价值 | 绝对误差 | 运行时间 (min) |
| ------------- | ------ | -------- | -------------- |
| 蒙特卡洛 (MC) | 0.1647 | — | 533 |
| Deep IMEX | 0.1633 | 1.41E-3 | 885 |
| Deep BSDE | 0.1661 | 1.36E-3 | 376 |
| DGM (+1层) | 0.1509 | 1.38E-2 | 1330 |
| DGM (+2层) | 0.1669 | 2.14E-3 | 1634 |
- 结论:该新方法在误差和时间上与MC和BSDE接近,但能提供完整解场,综合优势明显。相较于DGM,计算效率和参数规模均有优势。
---
3. 图表深度解读
图2.1 域截断示意图(第5页)
- 描述:二维资产空间中域截断示意,绿色线表示投影边界线(\(\alpha1 x1 + \alpha2 x2 = xr\)),定义截断域的边界。
- 解读:图示展示如何将无界空间的高资产价格点通过线性投影映射到有限域内,保证数值算法可以只在该截断有限域内求解,同时通过线性补偿近似保证外推合理。
- 联系文本:域截断为数值稳定和精度提升提供基础,尤其处理价格跳跃时可能引起的极端资产价格。
---
图3.1 神经网络模型整体结构(第7页)
- 描述:展示输入 \(x\in \mathbb{R}+^d\) 如何被映射到中间投影点 \(y\in \mathcal{R}\),随后经由多层DGM层处理,输出时间价值 \(w^k(y;\theta)\),再结合内在价值及截断补偿拼接最终期权价格近似。
- 说明网络通过逐层残差传递结合门控,增强对期权价复杂结构的表达能力。
- 作用:体现作者设计的合理数据流与结构以保证模型的数值稳定性和渐近正确性。
---
图3.2 DGM层架构细节(第7页)
- 说明每个隐藏层如何通过门控机制(曲线状态更新,类似GRU结构)融合输入 \(y\) 和上一状态 \(s^{\text{old}}\),生成新状态 \(s^{\text{new}}\)。
- 该设计提升深层网络的收敛性能,控制梯度消失问题,适宜变量复杂关联特征的学习。
---
图3.3 二维相关正态分布的稀疏高斯-埃尔米特积分点分布(第9页)
- 图示显示积分点集中在相关联合分布高概率区域,点数较少且分布均匀,体现稀疏网格积分有效降低节点数,缓解高维积分难题。
- 说明该方法对协方差结构利用充分,为后续积分估计提供高效采样。
---
图4.1 & 4.2 5资产下使用Gauss–Hermite积分的定价及误差分析(第11页)
- 4.1 (Euler):左图显示与QMC估计的绝对误差约为0.001阶,右上图反映期权价与支付的差异符合预期期权特性。
- 4.2 (BDF-2):精度略逊于Euler,除深度价内区域差异稍大外,误差整体仍在可控范围。
- 数据趋势指示隐式-显式BDF组合策略的稳定性以及输出价格对市场参数变动的敏感度。
---
图4.3 & 4.4 5资产下使用ANN积分的定价及误差分析(第12页)
- 误差等级与Gauss–Hermite积分匹配,速度提高约70%。
- 误差曲线平滑,更适合反复采样场景。
---
图4.5 积分算子估计对比(第13页)
- 曲线显示ANN积分与Gauss–Hermite积分基本重合,只有极端区域出现轻微偏差。
- 支持两种积分方法的互补优势及根据实际场景灵活选择策略。
---
图4.6 & 4.7 15资产案例定价表现(第13-14页)
- 结果表明模型可扩展至更高维度,误差控制良好,计算效率和准确度平衡优异。
- 深层网络结构和隐式-显式时间步进策略充分发挥数值稳定性。
---
4. 估值分析
- 数值估值方法:
本报告不直接提出市场估值模型中的价格估值区间,而是针对PIDE数值求解设计策略。
- 优化输入假设:
- 模型参数(波动率、跳跃率、协方差)给定。
- 时间步长和平滑参数(\(\eta\))等控制数值误差。
- 数值稳定及精度提升:
- 隐式-显式BDF时间步进与最小运动法保证数值解满足离散最优性和稳定性条件。
- 报告中未涉及DCF或传统金融估值模型,而是关注用能量最小化加深度学习重构解的数值精度。
---
5. 风险因素评估
- 模型风险:跳跃幅度分布、跳跃强度估计不准确可能影响价格。报告通过参数设定涵盖高波动、高相关性情形,但实际估计仍存误差。
- 数值稳定风险:时间步长选择若过大,可能造成误差积累;报告通过参数调节和隐式处理部分确保稳定。
- 训练不收敛风险:网络初始权重设定和采样策略设计针对训练难点,策略包括初始函数逼近和平滑内在价值。
- 积分近似风险:两种积分方式各有优缺点,极端资产价格处可能出现估计偏差,需根据具体应用权衡。
- 维度灾难依旧潜在存在:虽然神经网络和算法设计减缓了维度灾难,但随着资产数量剧增,计算成本可能迅速增加。
报告未单独列出缓解策略概率,但算法设计自然包含多项机制稳定训练和数值计算。
---
6. 批判性视角与细微差别
- 报告声称隐式-显式BDF和最小运动方法带来的稳定性和效率改善是显著的,其方法依赖网络训练准确收敛,存在被非凸优化陷阱局限的隐忧。
- 对于积分项,两种方法均依赖截断参数和积分网格设计,极端案例可能存在积分估计不精确。
- ANN积分虽加速,但训练过程及泛化能力值得关注,尤其在未充分采样区域可能不足。
- 与同类深度学习解法对比采用部分简化多资产独立状态,结果可能不完全反映相关跳跃情形下性能差异。
- 维度扩展测试中,仍未突破几十维以上规模,真实金融组合中资产数量可能更多时,算法实用性需进一步检验。
---
7. 结论性综合
本文创新地将深度残差神经网络与隐式-显式BDF时间步进相结合,通过最小运动能源框架,构建了解决跳跃扩散模型下篮子期权定价PIDE的高效数值方法。关键技术包括解的内在价值与时间价值分解、域截断近似、多样的积分算子数值估计策略,以及良好设计的DGM层深度网络架构。
数值实验结果表明:
- 方法在涵盖5维及15维资产篮子的欧式期权定价中均表现出良好的稳定性、准确度和计算效率,误差控制在\(10^{-3}\)数量级,与扩展QMC模拟和现有深度学习算法相竞争。
- 使用辅助积分ANN比传统稀疏高斯-埃尔米特积分更快,同时保持相近精度。
- 与深度BSDE和DGM方法相比,本文方法在提供空间时间完整解的同时,保持合理计算时间和低误差,尤其在参数规模和运行效率方面具备优势。
- 域截断与分解方法确保解在数值域外正确渐近行为,提高边界处理的合理性。
综合而言,本文方法为高维跳跃扩散篮子期权定价问题提供了一个结构清晰、理论基础深厚且经过充分数值验证的深度学习方案,为金融工程领域多资产衍生品定价带来新的工具和思路。
---
参考文献溯源
全文各核心结论及数据均对应页码见下:
- 报告题目、背景与跳跃扩散模型原理:[page::0],[page::1],[page::2]
- 数学模型及PIDE形式:[page::2],[page::3]
- 数值离散与最小运动方法:[page::3],[page::4]
- 解分解与域截断方法:[page::4],[page::5]
- 神经网络架构与训练:[page::6],[page::7],[page::8],[page::9],[page::10]
- 数值实验与结果分析:[page::10],[page::11],[page::12],[page::13],[page::14]
- 与其他ML方案对比及结论总结:[page::14],[page::15]
---
附:主要图表地址(供插图调用)
- 图2.1 域截断示意图:
- 图3.1 神经网络整体架构:

- 图3.2 DGM层结构:
- 图3.3 稀疏高斯赫米特积分点示意:

- 图4.1至4.7各数值实验图详见对应页(11-14页),包括价格曲线及误差对比图。
---
以上为该金融科技方法研究报告的详尽而全面剖析,旨在为金融工程师、量化分析师及数值方法研究人员提供深刻技术洞见及实际应用指导。