`

Towards modelling lifetime default risk: Exploring different subtypes of recurrent event Cox-regression models

创建于 更新于

摘要

本报告针对贷款生命周期内违约概率(PD)的动态建模,比较了三种包含或忽略重返违约事件的Cox回归模型子类型:时间至首次违约(TFD)、Andersen-Gill(AG)和Prentice-Williams-Peterson(PWP)。通过南非住宅贷款数据,结合丰富的时间固定与时间变化变量以及宏观经济因子,采用创新的分群时变ROC评估方法,结果表明TFD和PWP模型在模型拟合优度与违约风险期限结构预测方面表现相近,而AG模型效果较差,提示在违约重现率较低时可忽略重返违约事件。该研究为IFRS 9框架下的贷款违约风险管理提供有效建模工具和实践指导[page::0][page::5][page::16][page::19][page::21]

速读内容

  • 贷款违约建模现状与问题背景 [page::1][page::2]

- 传统违约预测模型偏静态,缺乏时变性,无法满足IFRS 9中贷款预期信用损失(ECL)动态调整要求。
- 贷款的违约并非吸收状态,可能多次“愈合”—再违约,故引入多重违约事件的“重返事件”建模至关重要。
  • 重返事件的Cox回归模型分类与数据结构 [page::3][page::4][page::8][page::9]

- 三种模型:时间至首次违约(TFD),只考虑首违约事件;Andersen-Gill(AG)基于日历时间;Prentice-Williams-Peterson(PWP)使用分层的间隔时间。
- AG假设所有违约周期共享统一基线风险,PWP允许周期特异基线风险,有助捕捉周期间差异。
- 模型的数据结构设计与风险集定义存在显著差异,影响估计过程。
  • 多重违约事件的信贷应用与方法创新 [page::4][page::5]

- 以南非大型住宅抵押贷款组合为例,包含近4800万条月度观测数据,样本超65万贷款。
- 引入采样代表性检验工具“分辨率率”,结合均值绝对误差(MAE)测量训练/验证集时间序列的均衡性,确保数据无偏。
- 时变ROC分析引入“分群tROC扩展”,解决同一贷款周期内观测值依赖性,提升模型评价准确性。
  • 贷款违约周期分布与违约率差异 [page::13][page::14]

- 约93%贷款仅经历单次违约周期,近7%多次违约周期,支持多周期建模合理。
- 不同违约周期的违约率显著不同,越后续周期违约率越高,反映客户状态动态变化趋势。

  • 关键变量识别及模型输入选择 [page::14][page::15]

- 主题变量选择策略结合统计显著性、相关性及业务理解,确保模型简洁且高效。
- 违规相关变量表现出最强辨识能力,如违约金额波动(DelinqSD4)等指标贡献最高。
  • 模型性能比较:拟合优度与区分能力 [page::15][page::16]

- 三种模型基于中位调整Cox-Snell残差均符合单位指数分布,拟合优度相近。
- Harrell’s c统计量均超99.6%,TFD略优;分群时变ROC分析显示随时间预测能力稳定,PWP优于AG但差异不大。

  • 违约风险期限结构的估计与比较 [page::18][page::19][page::20][page::21]

- 利用Kaplan-Meier估计实际事件概率分布,计算模型预测概率并求平均形成预期期限结构。
- 三种模型均揭示违约风险呈“U形”曲线,早期违约率高,随后下降,中晚期小幅回升。
- MAE指标表明PWP模型预测最贴合实际,AG模型表现最差,提示AG模型中共用基线风险的设定影响预测准确性。


  • 研究结论及未来展望 [page::20][page::21][page::22]

- 重复违约事件虽存在且部分客户多次违约,但其在违约风险模型中的增益有限。
- TFD和PWP模型表现相近,推荐视业务需求及数据特性选用,谨慎避免AG模型假设导致预测偏差。
- 建议后续研究扩展至高复发率贷款组合,完善期限结构估计方法,并探讨WLW模型及变量比例风险假设检验的有效性。

深度阅读

详尽分析报告《Towards modelling lifetime default risk: Exploring different subtypes of recurrent event Cox-regression models》



---

1. 元数据与研究报告概览


  • 标题:Towards modelling lifetime default risk: Exploring different subtypes of recurrent event Cox-regression models

- 作者:Arno Botha, Tanja Verster, Bernard Scheepers
  • 发布机构:Centre for Business Mathematics and Informatics, North-West University(南非西北大学)

- 发布日期:报告中未具体标注发布时间,但代码与后续工作标注为2025年,且引用了多篇2025年的文章,说明为近期研究。
  • 主题:该研究聚焦于使用不同类型的Cox比例风险回归模型(尤其是重复事件模型)来建模贷款的终身违约概率(PD, probability of default)。利用南非的抵押贷款数据,比较三种模型:传统的仅关注首次违约的模型(TFD),和两种容纳重复违约事件的Cox模型——Andersen-Gill (AG)Prentice-Williams-Peterson (PWP)
  • 核心论点:传统PD建模往往忽略借款人在贷款生命周期内多次违约的可能性,而这可能导致PD估计偏差,影响金融机构的风险缓冲。该报告通过实证数据评估不同重复事件模型的表现,提出多次违约可能被安全忽略,尤其在重复违约比例较低情况下。模型评估引入了传统拟合优度指标、Harrell的c统计量、以及创新的基于时间的ROC分析(含其针对集群数据的扩展)。最终,作者证明如何基于这些模型生成贷款组合的时间结构违约风险序列,并指出AG模型表现不及预期。
  • 结论评级及目标价

报告侧重理论和方法论研究,没有公开投资评级或目标价,而是强调模型选择与准确PD估计的实践意义,特别是在IFRS 9(国际财务报告准则)框架下。

---

2. 逐节深度解读



2.1 引言与背景(第1-2页)


  • 论点总结

银行贷款面临核心风险:借款人违约,导致资本损失。需求是动态、时间依赖的违约概率估计(PD),而非静态、周期无关的PD。尽管传统信贷评分模型关注稳定资本要求(比如巴塞尔委员会2019的要求),但这些模型往往忽略贷款生命周期和宏观经济变化的影响。[page::1]

IFRS 9针对贷款资产计提预期信用损失(ECL),要求动态更新贷款风险缓冲,这依赖于时间敏感的PD模型,因此动态性PD估计的准确性非常重要。贷款生命周期可划分为五个阶段(营销、获取、客户管理、催收、回收),准确的动态PD在各阶段有不同应用。PD的时间结构通常表现为非线性、初期高风险后逐渐下降,部分贷款风险甚至呈现“U型”,体现了时间和宏观环境影响的动态性。[page::1]
  • 逻辑及假设

强调“违约”并非吸收状态,贷款可能“治愈”出违约状态,后续继续暴露违约风险,因此存在多次违约(重复事件)。当前模型大多关注首次违约,忽略后续违约事件的信息,导致估计不足或偏差,[page::2]。

因此,贷款违约风险模型应针对“多重表现期(multi-spell)”设计,即贷款多次处于表现期和违约期交替状态。引入生存分析视角,尤其Cox比例风险模型在研究事件时长及发生概率方面已有稳定应用。经典研究(Banasik等1999,Bellotti和Crook等)使用时间依赖协变量模拟PD。尽管如此,现有研究普遍忽略重复违约事件,此报告提出通过引入重复事件Cox模型(AG和PWP)予以建模。[page::2]

2.2 理论方法和模型介绍(第3-9页)


  • 执行模型类别介绍

- TFD(Time to First Default):仅关注首次违约的经典Cox模型。
- AG模型(Andersen-Gill):以整段日历时间建模重复事件,假设所有违约事件共享一个基线风险,回归系数为全局统一。
- PWP模型(Prentice-Williams-Peterson):将每一次表现期视为一层分层(strata),设置每一层特有的基线风险,且时间在每个表现期重置(gap time格式),允许捕捉各表现期的差异。
  • 数据结构和风险集

详细 图2 描述不同模型对应的数据结构(起止时间、事件状态、表现期编号)。解释风险集定义方式的微妙差异(AG按日历时间,PWP按gap时间),这些差异影响估计过程的灵活性和准确性。[page::4, 8]
  • 模型求解

利用R语言中的coxph()函数进行建模,区别在于数据格式和PWP模型中需加strata()参数指定表现期分层。
Cox模型的部分似然函数基于风险内集,风险集定义因模型而异,决定求解过程中特定时间所考虑的贷款表现期集。[page::8-9]

2.3 新颖的评估指标设计(第10-12页)


  • 时间依赖ROC分析(tROC)

经典ROC无法直接适应带右删失的生存数据。通过Heagerty等(2000)的tROC,定义随时间动态变化的真阳率与假阳率,使用条件存活概率函数来估计。
采用Akritas最近邻核估计器对生存函数平滑处理,保证估计对标记分数的单调变换不敏感。[page::10-11]
  • 集群观察的tROC扩展

提出“clustered tROC-extension”处理同一贷款表现期内观察值的相关性问题。采用对表现期内的多个时点标记取均值方式对Akritas估计器和累积分布函数估计器进行调整。
该方法用以保证tROC分析中假设的独立性不致产生偏差,实操中通过R语言实现,增强了模型在时间依赖分类性能评估上的实用性。[page::11-12]

2.4 实证数据处理与输入变量选择(第12-15页)


  • 数据描述

利用覆盖南非大银行超过650,000笔抵押贷款,近5千万的月度表现观测,时间跨度2007-2022年。数据经过预处理(处理零值、账户关闭等),采用分层集群随机采样,分为训练集和验证集。
为提高运算效率,样本规模限制至90000笔贷款,分70/30归入训练/验证集。[page::12]
  • 表现期统计

绝大数贷款(93.1%)只有一次表现期(即无复违约),但仍有约7%贷款有多次表现期,最高达10次,说明复违约虽少但不可忽视。[page::13, 图4]
  • 表现期违约率变动

不同表现期的违约率随时间明显不同(图5),为模型选择复违约建模提供依据。[page::14]
  • 变量选择程序

多阶段主题式变量筛选:优先模型简约性,结合AIC衡量拟合优度,辅以领域知识分类变量主题(违约、贷款属性、宏观经济变量等)。使用变量间相关分析避免协变量冗余。以Wald检验确定显著性。结合Cox-Snell残差和Harrell’s c统计量评价。
变量重要性以单变量Cox模型的Harrell’s c统计量衡量,发现违约相关变量(如逾期次数和状态变化等)最有区分力。[page::14-15, 图6]

2.5 模型诊断与对比分析(第15-20页)


  • 拟合优度与判别能力

利用中位数调整后的Cox-Snell残差与单位指数分布对比,三模型(TFD、AG、PWP)均表现良好,Kolmogorov-Smirnov测试差异不大,AIC指标显示AG模型拟合最差。
Harrell's c统计量均超过99.6%,TFD略领先,说明变量选择及模型表现优异。[page::15-16, 图7]
  • 时间依赖ROC分析

经过集群tROC扩展,三模型在不同预测时点(三、十二、二十四、三十六个月)表现的tAUC非常接近,均较高(约95%-96%),表现无明显随预测期延长而下降。表明生存模型具有跨期稳定的预测能力,且三种模型间差异极小。PWP稍占优,AG处于中间,TFD略优于PWP。[page::15-17, 图8]
  • 违约风险“期限结构”建模与比较

- 实际期限结构由Kaplan-Meier估计得到,表现为以月为单位的期间边际违约风险,呈现明显U型曲线,早期风险高,随后降低,末端风险略有上升(可能与提前结清或抵押转让有关)。
- 模型预测的期限结构通过个体Cox模型的生存预测曲线计算各月边际违约风险的组合平均值得到。
三种模型中,TFD和PWP预测期限结构高度贴合实际,平均绝对误差(MAE)约在0.05% 左右,AG误差较大(约0.08%),明显偏离真实风险曲线,对尾端风险有过度预测。
这反映AG假设所有表现期共用基线风险、且计算时间使用日历时间格式导致预测不准确。PWP模型基线风险分层反映不同表现期风险差异,理论上更加合理,但实际数据稀少限制实际优势。[page::18-21, 图9-11]

2.6 结论(第20页后)


  • 主要发现

1. 引入考虑复违约事件的重复事件Cox模型(AG及PWP),与传统只关注首次违约的TFD模型相比,整体拟合效果和判别能力差异不大,且三者均表现优秀。
2. PWP相对于AG模型表现稍好,主要受益于允许不同表现期间基线风险差异。
3. AG模型表现较差,可能由于对所有表现期假定同一基线风险,并使用历时(总时间)违时间尺度。
4. 复违约事件的忽略在样本中影响较小——仅约7%的贷款经历复违约,样本统计能部分解释结果一致性。
5. 该研究创新提出了“分辨率率”用以检测分层样本的时间代表性,及集群tROC扩展算法来评估带集群结构的生存模型判别力。
6. 同时介绍了基于Cox模型个体风险累计生成贷款组合违约风险期限结构的方法,并对模型准确率进行定量评估。
7. 对IFRS 9规定的动态信用风险计量提供实用建模建议,强调只要复违约比例偏低,可耻复违约建模以简化流程且保证模型稳健。
  • 未来研究建议

鼓励此研究在其他贷款产品和多次违约频繁的数据上复验结论,改进期限结构合成方法(确保和为1,即满足概率公理),以及探讨WLW等其它重复事件模型。此外,变量选择过程亦可引入Schoenfeld残差等方法以检验比例风险假设。[page::21-22]

---

3. 重要图表详解



图1(第3页)


  • 描述:说明贷款表现期(spell)的不同状态示意图。图中纵轴表示不同贷款编号,横轴为时间(2016年-2022年)。颜色代表表现状态(蓝-违约,绿-结清,红-核销,黑-右删失)。

- 解读:贷款可能经历多次违约与恢复行为,多个表现期紧密相连,时间上可能有间隔。不同状态提示贷款在生命周期内复杂的风险演变过程。
  • 文本关联:图示直观支持文本中多重表现期的定义及模型中反复违约存在的实际基础。[page::3]


图2(第4页)


  • 描述:展示三种模型的数据结构示例。不同技术对事件起止的计时方式不同。

- 解读:TFD仅记录首次事件;AG记录连续的绝对时间起止;PWP重置表现期内部时间,使得每个表现期的数据结构分层分明。
  • 文本联系:图展示数据准备差异以及建模输入差异,是理解各模型操作底层的关键。[page::4]


图3(第7页)


  • 描述:三组数据集(完整、训练、验证)在默认事件分辨率率随时间的变化比较。折线图显示三者在2006-2023年间违约发生率趋势。

- 解读:三数据集违约率趋势高度一致,均显著反映2008年金融危机及COVID-19冲击,表明采样过程无明显时间偏差。MAE指标平均偏差均仅为5%以内。
  • 文本关联:验证数据样本及训练-验证集划分的代表性,为模型训练提供坚实数据基础。[page::7]


图4(第13页)


  • 描述:贷款最大表现期次数的频数分布直方图。

- 解读:绝大多贷款只有1个表现期(93.1%),约7%存在超过1次表现期。表明重复事件在实际数据中虽是少数,但并非罕见。
  • 文本关联:作为研究多事件模型的前提,实际数据中复违约的存在性得到量化支持。[page::13]


图5(第14页)


  • 描述:不同表现期编号的默认分辨率率随时间变化折线图,三种表现期类别叠加。

- 解读:后续表现期违约率明显高于首次表现期,且时间趋势也不同,隐含风险特性随再违约次数变化。符合复违约模型建模需求。
  • 文本关联:图示说服力支持复违约模型理论上的必要性与实际应用价值。[page::14]


图6(第15页)


  • 描述:单一输入变量为预测因子的Harrell’s c统计量柱状对比,颜色区分三种模型。

- 解读:违约相关变量(例如逾期状态)一般具有最高的区分率,而宏观经济、贷款属性变量次之。不同模型对个别变量的区分力略有差异。
  • 文本关联:指导最终输入变量挑选,强调核心变量的重要性及输入空间设计。[page::15]


图7(第16页)


  • 描述:三种模型的中位数调整后的Cox-Snell残差累积分布,叠加单位指数分布对比曲线。

- 解读:三者残差分布与理想指数分布均较接近,拟合良好且相似。AG模型的AIC最高,提示拟合劣势。Harrell’s c均超过99.6%。
  • 文本联系:确认三模型拟合数据合理,支持后续比较。AG拟合较差警示其局限。[page::16]


图8(第17页)


  • 描述:三模型在4个时间预测点(三、十二、二十四、三十六月)的时间依赖ROC曲线,和对应AUC数值。

- 解读:三模型AUC均为95%-96%,且随预测时长稳定,表现极佳。微妙差别下,TFD> PWP > AG。
  • 文本关联:表现时代ROC评估的结果肯定三模型预测能力,且忽略后续违约事件(TFD)未显著降低预测能力。[page::17]


图9-11(第19-21页)


  • 描述:三种模型对应的实际(Kaplan-Meier估计)与预测违约风险期限结构,月度事件概率曲线与自然样条平滑曲线对比。

- 解读
- 图9(TFD):只包含首个表现期,预测风险和实际吻合,呈现U型风险走势;MAE约0.05%。
- 图10(AG):预测周期风险曲线过度上涨,尾部风险常被高估;MAE约0.08%,明显劣于其他模型。
- 图11(PWP):预测分层风险结构更贴合实际,拟合优于AG,MAE最低约0.05%。
  • 文本联系:直观反映AG模型不合理假设对预测精度的影响,验证PWP在复杂违约结构下的优势,但优势有限。[page::19-21]


---

4. 估值分析



该报告为学术方法研究,无直接金融估值或目标价分析。其估值体现为三种Cox模型的性能对比,即预测违约风险的准确度和判别力,辅以拟合优度指标。
  • 采用的方法

- Cox比例风险模型(三种变体TFD、AG、PWP)
- 评估指标:AIC,Kolmogorov-Smirnov统计量(拟合优度),Harrell’s c,时间依赖ROC曲线及对应tAUC(判别能力)。
- 期限结构比较:Kaplan-Meier生存估计 vs Cox模型预测的平均事件概率。
  • 关键假设

- Cox模型的比例风险假设成立(报告中并未深入检验剩余偏差及模型假设)。
- AG模型假定所有重复事件共用单一区基线风险。
- PWP模型允许表现期分层,基线风险随表现期不同而异。
- 期限结构的构造采用个体生存估计曲线的均值,这一简化方法未强制概率和为1。[page::8, 19-22]

---

5. 风险因素评估



报告主要关注模型的统计学风险,体现为:
  • 模型假设风险:尤其AG模型假设基线风险不变,导致预测偏差。对PWP等模型未来是否适用比例风险假设的稳健性未详细探讨,存在潜在风险。
  • 样本偏差:通过分辨率率统计和相关MAE测度,确认训练与验证样本时间代表性较好,减缓采样偏差风险。
  • 复违约事件稀缺:仅7%的贷款有复违约,导致对复违约模型优越性的统计功效有限,样本不足可能影响结论普适性。
  • 数据质量风险:进行了大量数据预处理以修正逻辑错误,例如零余额和不合理金额,降低数据异常对模型性能的影响。
  • 模型泛化风险:使用时间依赖ROC扩展和独立验证集测试模型判别力,但未见多地区或产品类型验证,泛化能力不可完全确认。
  • 假设风险:报告强调未来工作需检验模型比例风险假设(如Schoenfeld残差分析),当前版本未充分覆盖此方面。


报告未明确缓解策略,主张未来研究完善和扩展。整体看风险意识清晰,但技术细节上仍需补强。[page::5-6, 12-13, 20-22]

---

6. 批判性视角与细微差别


  • 偏见与限制

- 研究基于单一南非大型银行抵押贷款数据,数据特性与违约行为可能不完全适用于其他国家或信贷产品。
- 观察到复违约比例较低(7%),这可能导致复违约模型优势未能显现,限制推广。
- 期限结构预测采用简单均值法,有概率和不为1的问题,尤其在贷款产品生命周期后期,对长期违约风险建模产生潜在系统偏差。
- 模型假设(例如Cox模型比例风险)未充分测试,不同模型间对时间依赖性及协变量动态变化的适应能力不明。
- AG模型基线风险统一的假设导致预测性能差,报告依此驳斥该模型。但同时也展现出PWP与传统TFD差异甚微,未深入探讨为何忽略复违约不影响结果的机制。
  • 内部矛盾与细节

- 报告一方面强调复违约行为影响违约风险显著(见违约率曲线按表现期变化),另一方面模型对比却显示建模复违约无显著增益,这种认知差异需更深入分析或解释。
- 使用集群tROC扩展方法对判别力调整,但对扩展方法可能引入的估计方差及偏差未探讨。
  • 模型选择逻辑

- 选择PWP模型主要基于文献推荐及对基线风险灵活定义优势,但实际效益微弱。
- 反复强调基线风险假设和时间计量尺度对模型结果影响,显示生存分析中特定技术细节对最终评价的决定性影响。

报告整体扎实,但部分假设检验和外推结论的保守性需特别注意。

---

7. 结论性综合



本报告围绕贷款生命周期内违约概率动态估计展开,将传统只模型首次违约的Cox比例风险模型与两种多事件重复违约Cox模型(AG与PWP)进行比较。研究基于庞大南非抵押贷款数据,设计了严谨的数据抽样、变量筛选、模型拟合与评估方案,创新性地提出了:
  • 分辨率率统计量用以检测训练和验证样本的时间代表性,确保模型训练基础稳健。
  • 集群tROC扩展用于准确评估Cox模型在带有表现期集群依赖的数据上的判别能力。
  • 一种基于模型输出反向生成贷款组合违约风险期限结构的实现方法,保证违约概率随时间变化动态刻画。


比较结果显示:
  • 三种模型在拟合优度(中位数调整Cox-Snell残差)、整体与时间依赖判别力(Harrell’s c与tAUC)均相近,均高于95%判别率。
  • AG模型在期限结构预测上出现明显偏差(MAE最高),说明其对基线风险单一假设存在局限性。
  • PWP模型因分层基线风险和gap时间尺度设计略优于AG,但对性能提升有限。
  • 传统TFD模型,即忽略复违约,仍能提供高效准确的PD估计,适用于数据中复违约比例较低的情况。


结合贷款生命周期数据实际特性,复违约虽影响表现期违约率,但在样本总体中占比有限,期望带来显著利得的复杂模型未必必要。报告最后强调该结论搭建在IFRS 9信用损失计提动态要求的背景下,确保贷款损失准备的合理性和及时性。

---

总结



本研究具有较强的实证基础和方法学创新,全面比较了重复事件Cox模型在信用风险领域的应用,提出了几项可推广的分析工具:
  • 对于银行风险管理而言:无需在重复违约频次较低的贷款组合上强制引入复杂的重复事件模型,可选用简洁有效的首次违约模型以平衡计算资源和效果。
  • 对于学术界:未来可扩展研究范围和方法(例如试验更多重复事件模型,增强期限结构建模方法),完善模型假设的验证,探索更多贷款产品场景以验证普适性。
  • 技术价值:提出的分辨率率和集群tROC工具可应用于带有时间和结构依赖的生存数据模型诊断。


具备稳定完整方法论框架与详尽的实证对比,在提高贷款生命周期信用风险预测动态性和精度方面具有显著贡献。[page::0-22]

---

以上分析严格依据报告内容进行,标注了对应页码以供溯源。

报告