Deep Joint Learning valuation of Bermudan Swaptions
创建于 更新于
摘要
本报告提出了一种基于深度联合学习与微分神经网络(DANN)的新型算法,旨在高效准确地估价早期行权产品——伯穆丹互换期权。通过结合蒙特卡洛采样的高噪声支付标签与多个相关金融产品的联合训练,极大提升了模型的泛化能力和预测精度。数值实验证明,该方法不仅显著缩减了估值误差,还实现了参数敏感度的自动计算,且具备推广到其他复杂衍生品的潜力 [page::0][page::1][page::3][page::9][page::11][page::15]。
速读内容
- 研究背景与方法创新 [page::0][page::1]
- 采用先进的深度学习技术,特别是差分机器学习(Differential Machine Learning)和多任务联合学习(Joint Learning)框架,构建基于差分人工神经网络(DANN)的衍生品定价模型。
- 通过蒙特卡洛模拟产生“噪声较大”的采样支付作为训练标签,覆盖广泛的市场参数空间,实现一次训练多场景估值的能力。
- Bermudan互换期权定价的难点与数学模型 [page::2][page::3][page::4]
- 利用线性高斯马尔可夫(LGM)短利率模型作为基础,欧洲互换期权可解析求解,伯穆丹期权因允许多次行权无闭式解,需数值方法。
- 通过退化为可取消利率互换(Cancellable IRS)的等价定价问题,使用动态规划和后向回归策略确定最优行权策略。
- DANN架构设计及训练策略 [page::5][page::6][page::7]
- Backward DANNs系列估算撤销(行权)策略,Forward DANN用于最终估值,形成交互关联的网络结构。
- 训练数据采用市场经验范围设定的均匀采样,包括均值回复参数$\kappa$、分段波动率参数(基于Rebonato模型参数化)、折现因子(利用Nelson-Siegel模型参数化)及远期利率扩散条款。


- 联合学习策略与多输出DANN结构 [page::9][page::10]
- 将多个同期欧式互换期权作为额外输出加入DANN训练,使用准确非噪声标签增强模型稳健性及训练效率。
- 采用带有雅可比矩阵反馈的微分传播机制,实现高维偏导数(敏感度)的联合训练。

- 定量实验结果与绩效提升 [page::11][page::12][page::13][page::14]
- 通过基于不同输入变量组合的多重实验展示模型对市场参数变化的拟合能力和误差水平。
- 联合学习显著降低了均值绝对误差和置信区间,最大误差基本减少一半,同时改进了模型对高噪声标签的适应性。





- 估值时间扩展与未来时刻预测 [page::14][page::17][page::18][page::19]
- Forward DANN结构扩展输入包含估值时间$t$及对应状态变量$x_t$,成功实现任意预设未来时刻估值。
- 多时点预测结果与传统蒙特卡洛方法高度一致,联合学习在短期估值时间点的改进效果尤为明显。



深度阅读
深度联合学习估值Bermudan掉期期权——全面详尽分析
---
1. 元数据与概览
- 报告标题:Deep Joint Learning valuation of Bermudan Swaptions
- 作者:Francisco Gómez Casanova, Álvaro Leitao, Fernando de Lope Contreras, Carlos Vázquez
- 发布机构及所属单位:
- BBVA, Spain
- Universitat Oberta de Catalunya (UOC), Spain
- CITIC研究中心,A Coruña大学,西班牙
- A Coruña大学数学系,西班牙
- 发布日期:2024年4月18日
- 研究主题:针对复杂金融衍生品,尤其是含提前行权特征的Bermudan掉期期权,利用先进的深度学习和人工神经网络(ANN)技术进行高效准确的估值。
- 核心论点:
- 结合差分机器学习(Differential Machine Learning)、蒙特卡洛模拟样本生成和联合学习(Joint Learning)技术,提出一套创新且高效的神经网络架构方案,用于复杂金融衍生品的数值定价。
- 针对Bermudan掉期期权,设计了一种新颖的相互依赖神经网络体系,能有效捕捉提前行权决策和估计过程,提高计算效率和精确度。
- 所提方法具备广泛适应性,可延展至其他衍生品估值问题。
- 作者传达的主要信息:
- 传统数值方法(如回归、树模型、PDEs、Fourier变换等)在计算效率和维度诅咒方面存在缺陷。
- 深度学习,尤其是结合差分信息和联合学习策略,能够突破传统估值的瓶颈,实现快速且准确的估值与风险敏感度计算。
- 通过一系列数值实验证明所提方法的优越性。
---
2. 逐节深度解读
2.1 摘要(Abstract)
- 关键内容:
- 提出结合差分机器学习、蒙特卡洛式训练样本和联合学习三大元素的深度学习方法,用于复杂金融衍生品估值。
- 设计基于多个相互依赖神经网络的模型,针对含提前行权时间窗的Bermudan掉期期权进行有效估值。
- 该方法提升了估值效率和准确率。
- 支撑逻辑:
- 传统针对早期行权衍生品的估值方法如动态规划、回归等难以应对高维和复杂性。
- 深度学习能够解耦复杂计算,利用带差分信息的网络增强拟合能力,联合学习则增强多任务学习能力。
- 创新点:
- 将联合学习应用于计算金融,结合相关衍生品信息辅助训练。
- 利用差分信息(价格对应敏感度)强化网络训练。
- 结论:
- 方法适用且可推广,为金融衍生品估值提供新范式。[page::0,1]
2.2 引言(Introduction)
- 关键论点:
- 金融衍生品估值面临的计算挑战及传统方法的不足。
- 提早行权衍生品视为自由边界PDE问题,需精确定位行权边界,传统算法计算成本高,精度受限。
- 蒙特卡洛方法结合动态规划与回归虽有效,但受限于维数灾难和重复计算。
- 深度学习优势:
- 训练阶段一次性高昂计算,查询时更快。
- 可借差分信息强化模型的估值能力,扩大泛化性。
- 选题动机:
- 以Bermudan掉期期权为研究对象,鉴于其市场流动性强且估值难度大,方法具代表性和实用价值。[page::0,1]
2.3 基础模型与金融产品定义(Problem formulation)
2.3.1 利率模型-LGM模型
- 利用一因素Linear Gauss Markov (LGM)模型刻画短期利率,定义状态变量\(xt\),满足简化的风险中性测度下的布朗运动扩散过程:
\[
dxt = \alpha(t) dWt, \quad x0=0
\]
- 定义数值基准及折现因子,并与Hull-White模型参数关联;如均值回复速率\(\kappa\),波动率\(\alpha(t)\)等。
- 提供零息债券价格解析表达式,作为后续掉期与期权定价基础:
\[
Z(t,xt;T) = \frac{D(T)}{D(t)} \exp\left( -(H(T)-H(t))xt - \frac{1}{2}(H^2(T)-H^2(t)) \zeta(t) \right)
\]
- LGM模型因结构简单、解析友好被广泛采用,且本方法不限于此模型。[page::2,3]
2.3.2 欧洲式掉期期权估值
- 掉期(IRS)定义为互换固定和浮动支付序列。
- 通过零息债券价格表达出IRS估值函数。
- 欧洲式掉期期权以掉期价值与0的正值函数形式定义行权收益。
- 基于LGM,给出欧洲式掉期期权解析定价公式,确保在\(t=0, x0=0\)时有简化表达。
- 公式关键涉及标准正态CDF\(\mathcal{N}(\cdot)\),以及基于隐含割点\(y
2.3.3 Bermudan掉期期权估值
- Bermudan掉期期权为多次提前行权期权,定价更复杂,无解析解。
- 引入可取消IRS(Cancellable IRS)作为辅助产品,通过与Bermudan掉期期权的关系(\(VC = VS - VB\))。
- 利用动态规划与蒙特卡洛回归等数值方法,构建最优行权策略,实现估值。
- 详细描述取消机会对应支付期,价格通过最优取消时间的不超过上确界的期望值定义,呈现为自由边界问题,强调数值求解难度。[page::4]
2.4 深度学习方法介绍(Deep learning for pricing Bermudan swaptions)
- 采用差分人工神经网络(DANN)结合蒙特卡洛噪声样本标签(sampled payoffs)作为训练标签,实现高效训练。
- 训练样本中每条路径对应随机不同模型参数,增强泛化能力,不同于以往同参数重复路径训练。
- 训练样本标签噪声较大,需引入联合学习,加强网络对相关衍生品多任务训练,提升准确性及稳定性。
- 引入基于相关联衍生品(如欧洲式掉期期权)输出的联合学习,借助这些无噪声、解析解标签辅助训练。
- 设计跨时间点相互依赖的多个DANN组成体系,类似动态规划中的后向递归结构,估算提前行权价值及政策。
- 训练样本生成设计科学,涵盖现实市场条件,使用自动伴随微分(AAD)精确获取价格灵敏度。[page::4,5]
2.5 DANN结构设计与训练样本生成
- DANN设计:
- 多个向后迭代的DANN构成“Backward DANNs”,每个对应不同的取消时点,递归估计后续价值。
- 通过“Forward DANN”结合Backward DANNs估算价格。
- 训练集生成:
- 利用联合分布模拟市场主要因子的取值:均值回复率\(\kappa\)、Rebonato参数化的分段波动率、Nelson-Siegel利率曲线建模参数与固定利率差价。
- 具体参数如均值回复率\(\kappa\)在指定区间均匀采样,波动率根据分段时间,用参数化模型生成,确保符合市场波动特点。
- 利用Nelson-Siegel模型生成折现因子,参数基于当前市场随机采样,确保曲线多样性和合理性。
- 样本标签中采用蒙特卡洛路径平均,平衡样本数与噪声水平。
- 样本输入层共有十个维度,分别为关键模型与市场参数。[page::5,6,7,8]
2.6 联合学习强化估值(Joint learning)
- 在DANN模型基础上,新增多任务输出,除估计主产品(可取消IRS)外,同时估计相关欧洲式掉期期权价格。
- 欧洲式掉期期权价格为解析表达式,无标签噪声,补充了主估值任务的学习信息。
- 通过联合优化,提升网络拟合能力,降低需要的训练样本规模和误差。
- 集成涉及Jacobian矩阵的差分学习,处理多输出对输入的偏导信息,构成统一反向传播网络架构。
- 使用差分机器学习提供的偏导标签,关联带来多任务迁移学习优势,提高整体估值精度。[page::9,10]
2.7 数值实验与结果分析
- 不同输入参数组增量测试:
- 分四组输入参数依次加入网络,考察不同市场信息对估值精度影响。
- 定义四个测试用例(Test Case I–IV),覆盖均值回复、波动率、折现因子及执行价差范围。
- 联合学习效果:
- 明显降低估计误差与偏差,准确度平均提高超过50%。
- 误差分布中心接近0,无明显系统性偏差,联合学习带来更窄分布区间。
- 在包含执行价格差异的测试中表现稍好,因价差影响标的价格波动幅度,某种程度平衡绝对误差。
- 训练样本数量与路径数影响:
- 增加训练样本数带来稳步收敛,误差减少有限,更多适合平衡样本质量与数量。
- 单样本蒙特卡洛路径数增加,标签噪声降低,估值精度显著提升,符合\(n^{-1/2}\)的理论缩减率。
- 联合学习策略使得对样本数量和路径数的需求降低,提升整体训练效率。
- 未来时间点估值扩展:
- 增加估值时间及状态输入,设计更大规模网络以捕捉时间维度动态。
- 估值结果与Backward DANNs估计吻合,说明模型能够准确外推。
- 精度较一般估值时间更晚时更高,短时间点估计复杂度更大。
- 联合学习同样显著提升估值性能,尤其在估计较困难时间点效果显著。[page::11,12,13,14,15,16,17,18,19]
2.8 结论
- 结合差分机器学习、蒙特卡洛样本生成和联合学习的深度ANN架构,成功解决早期行权金融衍生品估值难题。
- 联合学习引入相关金融产品帮助训练,显著提升估值准确度与稳定性。
- 模型具备良好泛化能力,适应多样化市场参数和未来时间估值。
- 方法不仅适用于Bermudan掉期期权,也可推广至其他复杂衍生品,例如篮子资产自动赎回产品等。
- 深度学习技术逐步构建为金融工程中自由边界和路径依赖衍生品估值的重要工具。[page::15,16]
---
3. 图表深度解读
3.1 图1:波动率分布直方图(第7页)

- 描述:展示了分段常数波动率函数中前四个时间段(\(\alpha
- 数据趋势:
- 波动率在0.002到0.016间集中分布,呈现对称峰形分布。
- 波动率样本依据Rebonato参数模型与均值回复率\(\kappa\)生成,合理反映金融市场波动波动特征。
- 与文本结合:
- 此图说明采样策略有效覆盖感兴趣的参数区域,保证训练数据具备代表性与多样性。
- 帮助DANN准确学得波动率结构对期权的影响。[page::7]
3.2 图2:不同时间点折现因子分布直方图(第8页)

- 描述:折现因子在\(t=1,4,7,10\)年对应的样本分布,展示使用Nelson-Siegel模型参数采样得到的随机利率曲线折现因子。
- 数据趋势:
- 折现因子总体均高于0.6,呈现略偏正态的平缓波动。
- 时间越晚,折现因子越趋于降低,符合实际利率贴现趋势。
- 随机性反映市场利率曲线多样性。
- 文本关联:
- 体现训练数据市场合理性,确保模型对现实利率环境响应。
- 为估值提供准确贴现基础。[page::8]
3.3 图3:多输出DANN结构图(第10页)

- 描述:集成联合学习的DANN示意图,显示前向传递及对应每个输出的偏导传播网络。
- 解读:
- 绿圈表示激活函数与相应的隐层节点。
- 两个独立输出路径带来两个差分计算路径,体现多任务联合训练和差分标签更新权重原理。
- 通过雅可比矩阵(Jacobian)多维偏导自动更新,提高模型训练效率及准确性。
- 支持文本论点:
- 图形视觉化联合学习复杂度,提高理解差分机器学习在多任务中的具体实现细节。
- 突出联合训练中权重共享和链式法则的应用。[page::10]
3.4 图4-7:四个测试用例的估价误差对比(第12-14页)
- 图中分别展示每个测试用例在“Plain DANN”和“DANN with Joint Learning”两种方法下的估值误差分布,单位为基点(bp)。
- 数据表现:
- 联合学习组误差峰值更集中,绝对平均误差及80%置信区间均明显缩窄。
- 无联合学习组误差范围更宽广,表现出较大估价不确定性。
- 文本总结:
- 联合学习方法大幅提升估价准确度,误差降低至约原来的一半甚至更好。
- 验证多输出联合训练带来的稳定性和泛化能力优势。[page::12,13,14]
3.5 图8-9:样本数量与蒙特卡洛路径数的影响(第15-16页)
- 图8(无联合学习)与图9(联合学习)展示不同训练样本数(\(2^{22}, 2^{23}, 2^{24}\))及不同蒙特卡洛路径数(1,4,16)下的估价误差。
- 结论:
- 样本数增加减少误差,但降低幅度有限,存在边际递减。
- 增加路径数显著降低噪声,提高准确度,符合Monte Carlo收敛率。
- 联合学习在所有条件下均带来更稳定、更低误差结果,抗噪声能力更强。
- 支持文章关于样本生成平衡的观点,指导实际训练设计。[page::15,16]
3.6 图10:含时间输入的估值比较(第17页)

- 展示不同未来时间点\(t=2,4,6,8\)下,Backward DANN与含时间的Forward DANN估值的散点图对比。
- 解读:
- 两方法估值高度一致,模型成功扩展至未来任意时间估值。
- 示意曲线呈上升趋势,预测反映支付残余时间价值变化符合金融逻辑。
3.7 图11-13:不同时间下联合学习的估价误差分布(第17-19页)
- 误差分布图清晰展示估价时间从接近合约末期向起始时间过渡过程中,误差随时间增长而增加,反映预测难度提升。
- 联合学习版本误差明显低于无联合版本,提升效果尤其明显于起始时间附近。
- 误差重心偏左略微表明联合学习估价出现低估趋势,分析原因系衰减权重源于同行金融产品的小于主估值产品值的特性。
- 提供细粒度时间误差变化说明,便于理解模型时间动态差异[page::17,18,19]
---
4. 估值分析
- 估值方法:
- 核心为基于蒙特卡洛采样的差分神经网络(DANN)近似定价。
- 结合动态规划思想构建Backwards DANN递归求解行权策略。
- 最终结合Forward DANN估计衍生品现值。
- 关键输入和假设:
- 利用LGM单因子利率模型作为标的资产动态。
- 市场参数覆盖均值回复率、分段波动率、利率曲线及执行价格差等,采样范围基于现实市场。
- 价格及对应敏感度被建模为神经网络输出及差分标签。
- 联合学习增值:
- 通过多任务学习联合估计相关欧洲式掉期期权价格(解析解),改进主任务估计。
- 估值效果:
- 误差平均和上下限均大幅降低,且模型具备对不同市场场景和估值时间的泛化能力。
- 敏感性分析:
- 增加训练样本数、蒙特卡洛路径数均提升性能,但须平衡计算资源。
- 联合学习策略可显著缓解单纯增加样本的边际效益递减问题。
---
5. 风险因素评估
报告本身虽然未显式聚焦风险分析,但可从内容推测关键风险及其影响:
- 模型偏误风险:
- 依赖LGM模型的简化假设,现实市场复杂性可能未完全捕捉,影响估值适用性。
- 训练数据代表性风险:
- 样本生成基于参数区间选取,若市场行情剧变超出该范围,模型表现可能下降。
- 噪声标注风险:
- 训练标签由蒙特卡洛样本估计,固有噪声可能导致过拟合或估值偏差。
- 联合学习偏误:
- 由于辅助任务估值通常低于主任务,联合训练可能带来系统性低估。
- 计算资源风险:
- 尽管较传统方法计算效率有所提高,高精度训练仍需大量算力支持。
缓解策略:
- 明确参数区间依照市场动态调整。
- 利用自动伴随微分准确捕获偏导,提升标签可信度。
- 设计训练时采用分层采样控制噪声影响。
- 监控及校正联合学习潜在的低估偏差。
- 结合分布式计算优化训练效率。
---
6. 批判性视角与细微差别
- 分析假设局限:
- 以LGM单因子模型建模利率,虽利于计算但忽略多因子风险与非高斯特征。
- 噪声标签虽成本低但风险增加,模型依赖于大量数据平滑噪声,训练时对超参数敏感。
- 联合学习潜在偏差:
- 辅助欧洲式期权价格普遍低于早行权产品,加入联合学习时存在估值系统性低估倾向,未来工作应加强权重平衡策略。
- 样本生成覆盖:
- 虽强调覆盖市场现实,但极端市场环境与黑天鹅事件难以包含,泛化性仍有限。
- 实验细节不足:
- 未详细对比传统最优回归方法或其他深度学习竞品,缺乏横向效果验证。
- 计算成本说明有限:
- 虽提训练阶段负载较大,但缺乏具体训练时长、资源需求的量化描述,不利于工程落地评估。
- 图表及算法叙述偶有歧义:
- 训练算法伪代码描述不够完善,图6格式杂乱,表述时需注意格式规范。
---
7. 结论性综合
本报告深入探讨了基于深度联合学习的Bermudan掉期期权估值问题,结合现代差分神经网络和蒙特卡洛采样技术,破解了传统定价方法在高维、复杂早期行权产品中的计算难题。其主要贡献与启示包括:
- 创新方法构建:
- 差分人工神经网络通过结合价格及其敏感度数据,提升网络拟合质量。
- 联合学习引入相关欧洲式期权作为辅助任务,利用无噪声的解析标签强化主估值模型学习,有效降低误差。
- Backward-Forward DANN架构模拟动态规划过程,网络间递归传递行权决策信息,实现结构化估价过程。
- 训练数据设计:
- 精细化蒙特卡洛样本随机生成,覆盖现实市场的均值回复率、分段波动率、折现因子与执行价格波动,确保模型具有良好泛化。
- 通过自动伴随微分计算差分标签,保证训练样本质量。
- 数值实验验证:
- 多组测试案例显示引入联合学习后,估值误差降低近半,估值分布更为集中,性能提升显著。
- 扩展到未来估值时间节点,模型依然表现出高一致性和稳定性,支持实务中多时点估值需求。
- 训练样本数量和路径数量提升均能改善表现,但联合学习提高了样本使用效率,降低计算资源需求。
- 图表深刻洞见:
- 波动率与折现因子样本分布显示训练数据覆盖充分的市场场景。
- 多输出DANN结构图清晰表达了联合学习优化过程的机理。
- 估值误差分布图展示联合学习显著减小误差波动。
- 未来时间估值图与误差跟踪验证了模型时序动态一致性。
- 应用展望:
- 方法潜在可推广至其他复杂衍生品如自动赎回产品。
- 提供了利用深度学习结合经典金融数学解决结构复杂金融产品估值的新范式。
综上可见,本文系统且详实地构建并验证了基于深度联合学习的复杂早期行权衍生品估值方案,在保证准确度的同时提高了计算效率和泛化能力,为金融工程及风险管理领域提供了极具应用价值的技术路径。[page::0–19]
---
参考重要图表汇总
| 图号 | 内容描述 | 关键见解 | 页码 |
|------|---------------------------------------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------|---------|
| 图1 | 波动率分布直方图(4段分段波动率 \(\alphai\)) | 波动率样本基于Rebonato模型与均值回复率动态生成,涵盖市场主要波动区间,有效支持多样化训练。 | 7 |
| 图2 | 不同时间点折现因子分布 | 利率模型反映现实折现环境,样本分布宽泛但合理,确保训练样本市场适用性。 | 8 |
| 图3 | 多输出DANN结构图 | 展示联合学习实现机制,通过多输出的前向和差分网络,提高多任务学习效率,增强主估值网络精度。 | 10 |
| 图4-7 | 各测试用例估价误差对比柱状图 | 联合学习使误差分布更集中,平均和置信区间误差减半。多组实验验证方法的一致有效性。 | 12–14 |
| 图8-9 | 样本数与路径数影响的误差图 | 样本增多与多路径均降低噪声与误差,联合学习显著提升样本利用效率,提高估值准确性和稳定性。 | 15–16 |
| 图10 | 含时间输入的估值对比散点图 | Backward与Forward DANN输出一致,证实扩展至未来任意估值时间的能力。 | 17 |
| 图11-13 | 不同时间总结误差分布 | 估值时间越早估计难度越大,联合学习减小误差尤为显著,短期估值精度提升明显。 | 17–19 |
---
以上为报告的极致详尽、结构严谨、全面深入的全方位专业分析解读。