Attribution Methods in Asset Pricing: Do They Account for Risk?
创建于 更新于
摘要
本文研究了在资产定价领域中,基于领域知识提出的若干风险相关公理,分析了两种主流归因方法——Shapley值和积分梯度(IG)在满足这些公理方面的表现。结果表明,Shapley值和IG均能保留大部分公理,但均存在不足,尤其是IG无法保持需求单调性,Shapley值则可能使用训练域外的计算,限制了其在金融危机等极端情况下的适用性。通过金融危机中的标普500期权价格实证分析,验证两种方法在风险归因中的优劣,提示实践中需根据具体风险特征选择合适归因方法[page::0][page::1][page::4][page::5][page::7]。
速读内容
- 研究背景与问题定位 [page::0][page::1]
- 机器学习在金融资产定价中应用广泛,但模型的解释性尤为重要,尤其是要反映风险管理相关的领域知识。
- 归因方法如Shapley值和积分梯度(IG)通过公理化方法解释特征贡献,但此前缺少结合资产定价风险的考量。
- 资产定价领域的基本知识 [page::1][page::2]
- 以零息债券和期权定价为例,资产价格对风险因素(如利率、波动率等)的敏感度可由一阶和高阶导数(Duration、Convexity、Greek字母)衡量。
- 这些数学导数反映了风险管理中的关键要素,归因方法应当能体现相应风险。
- 基于领域知识提出的风险相关公理 [page::2][page::3]
- 包括个体单调性(AIM)、需求单调性(DIM)、边际效应递减(DME)及递增(IME)、一阶单调支配(FMD)、训练域凸性(CG)等。
- 这些公理捕捉资产价格对风险因子的敏感性和变化趋势,指导归因方法的合理性。
- Shapley值与积分梯度的性能比较 [page::4][page::5]
- Shapley值能保持AIM、DIM、DME、IME和FMD,但不满足凸几何公理(CG),导致在训练外领域使用时风险增加。
- 积分梯度满足AIM、DME、IME、FMD及CG,但无法保持DIM,表现为当风险因子变化较大时,归因结果与预期不符。
- 2008年金融危机中期权定价实证 [page::4][page::5]
- 采用神经网络对期权价格建模,以五个核心变量(股价、利率、到期时间、行权价、波动率)为特征,解释基点和样本点进行归因分析。
- IG与Shapley值在多项风险特征归因中表现相似,但IG在含有高阶风险效应(如Gamma)时未能保持DIM,Shapley值在需求单调性表现更佳。
- IG路径避开了训练数据外区域,更适合极端市场环境风险归因。





- 主要结论与未来方向 [page::5][page::7]
- 两种归因方法均能反映大多数风险公理,但都存在不完全性,应根据具体应用场景权衡选择。
- IG更适合需要避免训练外域函数值的环境(如金融危机),Shapley值更适用于需保持需求单调性的场景。
- 未来研究可探索融合时间序列特征的新归因方法及在组合资产风险归因中的应用。
深度阅读
金融研究报告详尽分析
1. 元数据与概览
- 标题: Attribution Methods in Asset Pricing: Do They Account for Risk?
- 作者: Dangxing Chen(杜克昆山大学数学与计算科学中心)、Yuan Gao
- 发布时间: 未显示具体时间,文献内引用2023年的工作,推测为2023年或之后。
- 主题: 本报告聚焦于资产定价领域内应用机器学习解释方法(特别是归因方法,即attribution methods),探讨这些方法能否和如何准确反映风险因素。主要对比分析了Shapley值及Integrated Gradients (IG)两种归因方法,及其在金融风险解释中的适用性和限制。
核心论点:
随着机器学习的广泛应用,尤其在金融资产定价模型中,解释机器学习模型输出中的风险因素变得尤为重要。现有的归因方法侧重于通用公理体系下的解释,但缺乏领域知识的结合。该报告提出并基于金融资产定价中的领域知识,建立一套反映风险的公理体系,进而考察Shapley值和IG是否满足这些公理。结果显示,两者均可保留大部分公理,但皆存在不足,特别是IG不能满足需求单调性(demand monotonicity),而BShap(基线Shapley)计算时可能跨出了训练域,限制了其在金融危机等状况下的适用性。报告结合理论及实证案例说明归因方法如何反映风险及其使用时机。
2. 逐节深度解读
2.1 引言与背景(Section I)
报告从行业需求出发,强调金融中机器学习的成功及随之而来的可解释性需求,尤其在高风险、高利益冲突的领域(如金融)显得尤为关键。列举美国监管机构对ML模型需解释清晰的指令背景,指出现有ML解释方法主要基于抽象的公理体系,缺少领域知识的融合。金融资产定价与风险管理密切相关,强调SVB倒闭事件中风险管理失败的教训,提出核心问题:归因方法是否准确反映模型中的风险,进而指导决策。
重点提出研究目标和贡献:基于资产定价知识,设计能反映风险的公理;理论分析Shapley和IG,并用大量例证说明两者的优缺点及应用边界。
2.2 预备知识与归因方法概述(Section II)
- 模型与符号说明: 假设有\(n\)个输入特征,模型为实解析函数\(f:\mathbb{R}^n \to \mathbb{R}\),关注结果对特征的归因。
- 归因方法定义:
- Baseline Attribution Method(基线归因方法)定义为用两个点(解释点\(\overline{\mathbf{x}}\)和基线\(\mathbf{x}'\))及函数\(f\)得到特征归因向量的方法。
- Shapley值: 从博弈论借用,将特征视为“玩家”,分摊整体输出值,计算公式详见定义II.2。更关注Baseline Shapley(BShap),其中特征缺失时以基线值替代。
- Integrated Gradients (IG): 根据解释点至基线之间积分计算梯度加权归因。
该部分为后续论述提供数学、符号基础,突出了BShap与IG的数学表达式和性质。
2.3 资产定价基础(Section III)
聚焦两类金融资产:
- 债券(Coupon Bonds):
以零息债券为例,价格计算公式为\(B(r,c,T) = c e^{-r T}\),其中\(r\)代表利率,定义了债券价格对利率的导数(Duration,衡量价格对利率敏感度)及二阶导数(Convexity,衡量“曲率”)的重要性,凸性能减少利率变化对债券价格的敏感性。
- 期权定价(Option Pricing):
以欧式看涨期权为例,介绍Black-Scholes-Merton定价模型,强调“Greeks”(如Delta、Gamma、Vega)作为金融领域重要的敏感度指标,风险管理中常以这些导数设定交易限制。
报告指出基于金融领域公理化知识(数学导数)进行解释的重要性,提示模型归因需与这些风险参数符合。
2.4 领域知识衍生的风险公理体系(Section IV)
针对资产定价中的风险特点,报告提出以下公理:
- 一阶效应公理(Section IV-A):
- Individual Monotonicity(个体单调性):如果模型对某特征是单调递增,则该特征归因应为非负值。
- Average Individual Monotonicity (AIM):归因方法应反映此单调性平均趋势。
- Demand Individual Monotonicity (DIM):增加某特征值时,其归因应随之增加。
表4中示例III.1的利率对零息债券应是负向归因,体现风险价值。
- 二阶主效应公理(Section IV-B):
- Diminishing Marginal Effect (DME):边际递减效应,导数为非负、二阶导数非正,反映风险递增放缓。
- Reverse DME (RDME):相反,边际效果递增,导数非正、二阶导数非负。
- Increasing Marginal Effect (IME):边际增加效应。
公理IV.7、IV.10分别定义归因方法需反映这些特性,例如零息债券利率具有RDME特性,应体现在归因中。
- 资产间比较公理(Section IV-C):
- First-order Monotonic Dominance (FMD):若资产\(f\)对某风险特征敏感度恒大于资产\(g\),归因应反映出这种支配关系。
- Generalized Dummy (GD):无关特征归因应为零,且剔除哑变量后归因保持一致。
证明若归因方法满足线性、GD及AIM公理,则可保证FMD。该部分涉及了对资产组合、对冲的风险归因直观体现。
- 训练域相关公理(Section IV-D):
鉴于金融数据的实际分布特征及特征间的相关性(如图1显示的股价与波动率的负相关),归因方法计算应限制在训练数据支持域内,避免基于无数据支持点的风险误导。
- Convex Geometry (CG) Axiom:归因路径或采样过程应位于训练域的凸包内。
该点响应金融危机等极端情况下模型预测的局限性。
2.5 归因方法在公理上的表现(Section V)
报告通过理论证明总结如下定理:
- BShap能满足AIM、DIM、(R)DME、IME及FMD公理,但不一定满足CG。
- IG能满足AIM、(R)DME、IME、FMD及CG,但不满足DIM公理。
通过债券利率示例详细阐释了IG在利率极高时(长债+高利率环境)DIM不满足的现象,强调IG可能低估风险。另一方面,BShap虽满足DIM,但计算时需多个组合点,其中部分点不在训练域,导致违反CG。在实际金融危机数据(图1)解释时,BShap需要评估在训练域外点的函数值,存在不可用风险,而IG的积分路径多处于训练数据附近,表现较好。
2.6 实证分析(Section VI)
以2008年全球金融危机时期美国欧式期权市场为例,构建包含标的价格、风险利率、到期时间、行权价及波动率五个特征的神经网络,模拟期权定价函数。使用已定基线与待解释点,分别计算IG和BShap归因(图2、图3)。两者结果整体相似,主要归因于股价和行权价的变化,且符合期权定价领域理论。
接下来的实验进一步验证了两种方法对风险特性(如Delta为正负的call/put选项,Gamma为正的凸性)保留公理的能力(图4-6)。
- IG和BShap均能较好反映凸性(RDME)。
- 但对于put选项中存在负Delta且高Gamma时,IG的DIM公理可能被违反(图6),BShap表现更优。
2.7 讨论与未来展望(Section VII)
总结:
- BShap和IG均能反映多数风险公理,适用范围丰富。
- IG不满足DIM限制其在某些高风险资产解释中的适用,BShap不满足CG限制其在极端市场条件(如金融危机)中使用。
作者指出未来研究空间,包括设计能同时满足多种公理的新型归因方法,包含时序特性避免训练域外带来的风险,以及扩展风险归因至资产组合等应用。
3. 图表深度解读
- 图1(股票价格 vs VIX波动率散点图)
展示了2008年危机期间股价与VIX波动率的负相关性,数据位于图中标记的区域内,但未覆盖高股价高波动率和低股价低波动率区域,证明训练数据非矩形分布。基线Shapley计算需要四个角对应函数值,可导致训练域外估计。IG路径是连接基线与解释点的线段,位于训练数据分布附近,避免了外推风险。该图形象地支持了Convex Geometry公理的提出和归因方法比较的讨论。[page::4]

- 图2 和图3(IG与BShap的归因条形图)
对2023年2月5日某期权的解释,横轴显示每个特征归因值,纵轴为特征名称(股价S,利率r,到期时间τ,行权价K,波动率σ)。
归因重心在股票价格(S,负归因)和行权价(K,正归因),反映了期权价格主要受这两者影响。利率和波动率归因较小,符合金融理论。IG和BShap归因大小、方向一致,验证解释方法的一致性。
差异体现在具体数值细节(如利率、波动率),但总体趋势吻合。说明两种方法在常规市场情况均表现良好。[page::5]


- 图4(IME曲线): 显示随股价上升,IG和BShap的归因呈递增趋势,满足Increasing Marginal Effect公理,清楚验证归因方法能够捕捉一阶正向风险效应。[page::5]

- 图5(RDME曲线): 展示RDME条件下归因值随股价变化的非线性递减趋势,IG和BShap的曲线趋势基本一致且满意公理需求,反映风险边际递减效应。

- 图6(DIM违反示例): 对于put期权归因随股价变化绘图,IG归因曲线出现不平滑甚至违背理论递减趋势(底部呈现波动拐点),说明其不能正确保持Demand Individual Monotonicity,而BShap仍然平滑下降。确认IG在负Delta、高Gamma情景中归因不足。

4. 估值分析
本报告未展开传统意义上的资产估值分析,但对应归因方法中涉及的数学期权定价模型和债券定价模型具有许多敏感度(Derivatives,即Greeks)作为领域知识输入,这些为归因建模提供理论基础。报告阐释了基于朗格朗日积分和Shapley值分配的归因计算,揭示归因方法的理论根基和对风险参数的敏感映射,但没有展开现金流折现或多尺度估值模型。
5. 风险因素评估
通过公理体系设计,本报告系统梳理了金融资产定价中的风险因素及其对应的归因解释要求:
- 利率风险(Duration与Convexity)需归因方法体现对债券敏感性的准确反映。
- 期权价格对基础资产价格及波动率的敏感性(Greeks)需对应正向或负向归因,正确表示风险敞口。
- 资产间敏感对比(FMD)风险可被归因方法量化,辅助投资组合风险管理。
- 训练数据覆盖区域(CG)限制风险,避免归因模型在无数据支持区域盲目推断。
劣势及风险:
- BShap方法虽能较全维度反映风险,但需要计算超出训练数据分布的部分,产生潜在风险。
- IG方法较好地维护训练域限制,但DIM等敏感风险特征解释能力不足,可能导致风险低估。
报告正视这些风险因素,提醒用户关注适用上下文及选择合适方法。
6. 批判性视角与细微差别
- 报告优点:
- 创新地引入领域知识公理,结合机器学习归因与金融风险管理,填补了当前解释模型缺乏专业背景的不足。
- 理论与实证结合,细致比较两类归因方法优劣,具备实践指导意义。
- 清晰定义风险相关公理,体系化表达复杂风险特征。
- 潜在局限:
- 报告聚焦于两种归因方法,未涉及其它近年发展起来的归因技术,未来研究需拓展比较。
- 训练数据域划分及凸包假设较理想化,真实金融市场中数据边界及依赖关系可能更复杂,模型训练与解释可能面临更大挑战。
- 数学推导依赖于实解析函数集,实际非解析模型是否适用仍需考察。
- 实证神经网络模型相对基础,市场极端波动条件下的泛化能力待加强。
报告虽作适当提醒,但以上点提示未来工作方向及应用时需谨慎。
7. 结论性综合
本报告系统分析了基于机器学习模型的金融资产定价归因解释问题,聚焦于归因方法如何反映风险。通过引入基于资产定价专业知识的公理体系,报告建立了评价归因方法科学性的全新视角,并侧重剖析了广泛使用的BShap和IG两个归因方法。
数据和理论分析显示两者均具备反映大多数风险相关公理的能力,且在不同风险场景下各有优劣:
- BShap的优势在于满足需求单调性及多种风险特征反映,但其归因计算涉及训练数据外推,存在实际场景适用风险。
- IG严格在训练数据覆盖域内进行积分,适合避免外推误差,但不能全面保证需求单调性,导致风险辨识部分失真。
实证部分通过2008年全球金融危机数据分析,验证了两种归因方法对期权价格中Delta、Gamma等关键风险指标的解释能力及各自的局限性。
报告最后提出了未来方向,包括发展更全面的新型归因方法、结合时间序列特性避免域外估计、以及将风险归因拓展至投资组合等应用,指明了机器学习金融解释的前沿方向。
综上,报告强调金融领域中的归因方法应兼顾领域知识及统计特性,消弭风险解释盲区,指导风险管理策略制定。研究为金融机器学习解释领域提供了重要理论与实践基础。
---
参考溯源页码:
- 引言与研究主题: [page::0,1]
- 归因方法定义及数学模型: [page::1,2]
- 资产定价实例与领域公理: [page::2,3]
- 训练数据域的约束与凸几何: [page::3,4]
- 归因方法理论比较及局限: [page::4,5]
- 实证分析与归因比较: [page::4,5]
- 数学证明与模型训练细节: [page::6,7]