An Interpretable Machine Learning Approach in Predicting Inflation Using Payments System Data: A Case Study of Indonesia
创建于 更新于
摘要
该报告利用印尼支付系统、资本市场和宏观经济数据,评估多种机器学习模型对通胀预测的表现,发现XGB模型优于传统ARIMA基准,能将预测误差降低45.16%,支付系统变量对通胀预测贡献显著,结合SHAP值解析模型解释性,提升了政策分析的直观性和准确性,推荐作为中央银行辅助预测工具 [page::0][page::11][page::13][page::21]。
速读内容
机器学习模型显著优于传统ARIMA基准 [page::11][page::12]

- 所有ML模型均在均方根误差(RMSE)和平均绝对误差(MAE)上优于ARIMA,XGB模型误差减少达53.22%。
- Diebold-Mariano检验显示ML模型与ARIMA预测结果差异显著。
数据划分对预测准确性的影响 [page::13]

- 测试集越短,训练集越大,预测准确性普遍提高。
- 长期(24个月)预测中,XGB和随机森林表现下降。
- 12个月测试期内,除XGB外,ARIMA预测表现优于多数ML模型。
支付系统变量在预测中的重要作用 [page::13][page::14]

- SHAP值显示ATM和借记卡(ATMD)、信用卡(CC)和利率(IR)是预测通胀的前三大关键特征。
- 支付系统指标占前十大重要变量中的七个,显示其在通胀预测中的核心地位。
机器学习模型的解释性分析 [page::14][page::15][page::16][page::17][page::18]

- 利用SHAP依赖图和局部Shapley展开,解释特征与通胀预测的关系。
- 信用卡使用增加与通胀正相关;利率提升与通胀负相关,符合经济理论。
- ATM和借记卡使用对通胀有正向影响,剔除异常值后利率与通胀的负相关性更明确。
- 变量间交互关系揭示利率与货币需求(CIC)、市盈率(PER)交互增强对模型预测的影响。
机器学习模型参数优化及性能对比 [page::9][page::33]
| 模型 | 超参数 | 范围 | 优化值 |
|---------------|--------------------------|--------------------|----------------------------|
| Ridge | Lambda | 0.001 to 0.9 | 0.001 |
| Lasso | Lambda | 0.001 to 0.9 | 0.001 |
| Elastic net | Lambda Alpha | 0.001 to 0.9, 0.05 to 0.95 | 0.001, 0.05 |
| Random Forest | Max Depth Max Features nestimator | 2 to 50, 2 to 20, 10 to 1000 | 9, 4, 131 |
| XGB | learningrate nestimators maxdepth Subsample Colsample_bytree | 0.005 to 0.5, 10 to 1000, 2-10, 0.1 to 0.9 | 0.08, 500, 10, 0.4, 0.7 |
| SVM | C Epsilon Kernel function | 0.1 to 50, 0.0005 to 1 | 50, 0.065, linear |
| 模型 | MAE | RMSE | RMSE减少百分比 | DM检验值 | p值 |
|--------------|-------|-------|---------------|----------|-------|
| ARIMA (基准) | 0.630 | 0.670 | - | - | - |
| SARIMA | 0.503 | 0.527 | 21.31% | 3.988 | 0.001 |
| OLS | 0.350 | 0.406 | 39.39% | 3.508 | 0.003 |
| Ridge | 0.346 | 0.402 | 40.01% | 3.472 | 0.003 |
| Lasso | 0.298 | 0.340 | 49.30% | 4.695 | 0.000 |
| Elastic net | 0.317 | 0.364 | 45.62% | 4.216 | 0.001 |
| 随机森林 | 0.351 | 0.417 | 37.76% | 4.462 | 0.000 |
| XGB | 0.264 | 0.313 | 53.22% | 4.875 | 0.000 |
| SVR | 0.315 | 0.368 | 45.07% | 4.442 | 0.000 |[page::33]
深度阅读
金融研究报告详尽分析报告
文献标题: An Interpretable Machine Learning Approach in Predicting Inflation Using Payments System Data: A Case Study of Indonesia
作者: Wishnu Badrawani
发布机构: Bank Indonesia Institute, Bank Indonesia
发布时间: 未明确具体日期,数据时间跨度至2021年底
研究主题: 利用支付系统数据结合机器学习预测印尼通胀率,重点关注模型解释性
---
一、报告概览与核心论点
本文旨在评估多种机器学习(ML)算法在预测印尼通胀率方面的表现,主要利用支付系统、资本市场及宏观经济数据。作者通过与传统单变量时间序列模型ARIMA及其季节性变体SARIMA对比,展示机器学习模型(包括收缩回归、集成学习和支持向量回归等)在预测准确性上的较大提升。文章的创新之处在于结合Shapley值方法实现模型结果的解释性,使预测不仅具备较高准确率,还能为中央银行的货币政策提供科学依据。XGBoost(极端梯度提升)模型被发现在多个机器学习模型及传统基准中表现最佳,平均预测误差降低幅度超过45%。[page::0,1,11,21]
---
二、章节深度解读
2.1 引言与研究动机
作者指出传统宏观经济预测模型在危机(如COVID-19)等非常态环境下面临准确性和适应性的挑战,呼吁采用AI/ML技术来捕捉复杂的数据关系。作品强调印尼作为新兴经济体,在通胀控制方面需要更精准及时的预测工具,并且注重模型解释性以辅助政策决策。支付系统数据因其全面记录经济交易的特性,被视为有价值的宏观经济预测变量源。[page::1,2]
2.2 文献综述
- 机器学习与经济预测
ML技术在宏观变量(GDP增长、股市)预测中显示出优于传统回归方法的潜力,尤其是在处理高维数据和非线性关系方面。领域内已有多项研究以深度学习、集成学习等方法提高宏观经济和金融市场预测的准确性。[page::2,3]
- 支付系统数据的利用
发达国家现有研究表明,支付系统数据能有效提升GDP和其他经济指标的预测能力。作者指出东南亚,特别是印尼,基于ML的支付系统数据通胀预测研究尚处于起步阶段。[page::3,4]
- 关键解释变量的经济理论背景
文中详述各解释变量对通胀的理论影响:
- 支付工具创新(例如ATM、借记卡)可能通过货币需求影响物价
- 资本市场表现及股价与通胀负相关关系
- 汇率对进口价格及通胀的直接和间接影响,非完全传递性
- 利率通常对通胀产生负向影响,体现货币政策传导机制
[page::4,5]
2.3 数据集描述
研究使用2015年1月至2021年12月的月度数据,涵盖支付系统变量(ATM交易、信用卡、电子货币等)、宏观经济指标(消费者价格指数、利率、汇率)及资本市场数据(股票市值、交易量等)。因数据来源权威(印度尼西亚央行及统计局),兼顾覆盖广度和数据质量。[page::5,6,26,34]
2.4 方法论详解
ML模型选择及原理
- 利用多种收缩回归方法(岭回归、套索回归、弹性网络)以降维及防止过拟合。
- 集成学习采用随机森林和XGBoost,后者基于梯度提升框架并含正则化机制,兼顾预测精度和防止过拟合。
- 支持向量回归(SVR)则应用于寻找最优超平面拟合数据。
[page::6,7,8]
数据切分及模型训练
- 采用80%训练、20%测试的切分比例,并逐步扩展测试集跨度至6、9、12、16及24个月以评估预测稳定性。
- 应用K折交叉验证和GridSearch超参数调优确保模型泛化能力和超参数选取的最优性。
[page::8,9,33]
预测精度评估
- 以RMSE和MAE评估预测误差,RMSE对误差平方的敏感性使其更适合凸显较大预测误差。
- 采用Diebold-Mariano(DM)统计检验方法判断各ML模型预测性能与ARIMA基准的显著差异。
[page::9,11,33]
2.5 机器学习结果与解释性分析
预测性能表现
- 所有机器学习模型RMSE均优于ARIMA。XGBoost获得最小RMSE(0.313)和MAE(0.264),预测误差相比基准下降53.22%。DM检验拒绝了模型性能无差异的零假设,证明显著提升。[表1、表2页::33]
- 图3展示2020年9月至2021年12月的预测走势,XGB精准捕捉住疫情期间及历史通胀波动。套索回归模型次之,随机森林表现欠佳。[图3页::27]
- 不同数据切分方案影响预测效果,较长预测期(24个月)XGB和RF误差有较大上升;12个月预测XGB表现仍优于大多数模型。[图5页::28]
特征重要性解析(基于Shapley值)
- ATM/借记卡交易量 (ATMD)、信用卡交易量 (CC)、利率 (IR) 为最重要影响变量,远超汇率(ER)、消费者信心指数(CCI)、资本市场回报率(PER)。[图6页::29]
- Shapley摘要图(红色高,蓝色低)揭示:
- 信用卡交易增加倾向于推动通胀上升
- 利率升高倾向于抑制通胀(负相关)
- 但局部图显示利率与通胀的关系存在复杂性,移除异常值后负相关更加明显,与传统货币政策理论一致。[图7、8、12页::29,30,32]
局部解释与变量关系探索
- 依赖图和局部函数形式分析揭示:
- ATM/借记卡使用量提升对通胀有积极推动作用,支持其货币需求替代作用的理论。[图9、10页::30,31]
- 货币需求与利率呈典型负相关,资本市场价格与利率负关系也得到确认。[图13页::32]
- 变量间交互提示利率的影响受货币需求及资本市场波动影响,强化了货币传导机制的复杂性。
[图13页::32]
2.6 风险因素与方法局限
- 作者未具体列出风险,但文中多处提及数据量较小、异常值处理、模型变量相关性对解释的影响。
- ML模型存在“黑箱”性质,解释需结合经济理论审慎解读,遵守计量经济学假设和稳健性检验原则。
- 长期预测能力衰减,特别是集成模型,应警惕在实际政策中盲目延伸预测期限。
- 多变量模型优于单变量模型的结论在短期内不一定成立(Banerjee等, 2005),提示政策制定需兼顾模型适用范围。
[page::20,21]
2.7 批判性视角
- 研究过程合理严谨,模型选择丰富且涵盖主流方法。
- 解释性工作的深入对ML模型应用于宏观经济预测极具参考价值,尤其是结合Shapley值的本地与全局分析。
- 数据集时间跨度和频率均有限,未来研究可考虑更细粒度数据及更丰富多样的外生变量。
- 预测 24个月距离远时模型性能强度减弱,应注意此类限制。
- 作者充分意识到因果推断的困难,并力图结合理论支持ML解释,体现审慎态度。
[Page::20~21]
---
三、表格和图表解读
图1(26页):主要时间序列变量趋势
- 图1a呈现2015年至2021年印尼通胀率曲线,显示从2015年高峰(约7%)回落到21年底约2%的低通胀环境。
- 图1b、1c披露支付系统部分关键指标(现金流通量、ATM/借记卡,资本市场交易额、信用卡交易等)的月度变化,反映支付系统活动与经济波动的关联性。
图2(27页):交叉验证示意图
- K折交叉验证通过分割训练集多次轮流测试,确保对模型的超参数调优得到稳健的泛化能力。
图3(27页):各模型2020年9月至2021年12月通胀预测对比
- XGB曲线最接近实际值,拟合疫情及经济波动特征明显,表现优于单变量ARIMA及其他ML模型。
图4(28页):长期时间序列预测及误差
- XGBoost模型对整个样本(2015年至2021年中)的拟合精准,误差主要集中于测试阶段,符合预期。
图5(28页):不同数据切分下模型预测误差(RMSE)
- 随着测试期缩短,预测误差下降,说明模型更适合短期预测。
- XGB和随机森林在长期预测(24个月)表现较差,波动较大。
表1(33页):各模型超参数及调优结果
- 超参数如岭回归和套索回归的lambda取最小值0.001,表明轻度正则化。
- XGB的学习率0.08,树深10,迭代次数500次,体现了充分训练。
表2(33页):各模型绩效指标对比
- XGB最小RMSE(0.313),RMSE减少53.22%显著优于基准。
- SARIMA表现优于简化线性模型但不及ML模型。
- 所有ML模型在DM检验均显著优于基准(p<0.01)。
图6(29页):根据SHAP值排序的特征重要性
- 支付系统变量占主导(ATMD、CC),利率次之,传统宏观变量如汇率、消费者信心相对较弱。
图7(29页):SHAP值汇总分布图
- 直观展现了不同变量的单点对模型输出的正负影响,颜色反映变量大小,供微观和宏观解释。
图8-13(30-32页):局部SHAP依赖图及函数形式
- 利率与通胀呈负关系,信用卡交易正相关。
- ATM交易和货币兑换交易的函数形式辅助理解负相关和无效关系。
- 交互效应揭示利率在不同资金需求与资本市场环境下的影响差异。
---
四、估值分析
本报告不涉及传统企业估值,而聚焦机器学习模型的预测评估。采用的主要评估指标包括RMSE、MAE及DM检验,无现金流折现或市盈率等金融估值模型。
---
五、风险因素评估
- 数据限制(样本量、观察期)可能影响模型稳定性及泛化能力。
- 长期预测准确率下降,政策应用需谨慎。
- 变量相关性可能干扰Shapley值解释,影响因果推断准确性。
- 异常值处理对利率等变量的经济直觉结果产生重要影响。
---
六、批判性视角
- 研究整合机器学习预测与可解释性分析,为印尼通胀预测提供创新思路。
- 对ML模型在经济领域应用中的局限和解释难点有清醒认知,避免“黑箱”式误用。
- 研究英文写作和表述严谨,数据和方法透明,复现性较好。
- 模型针对较长预测期存在性能下降,提示未来需要改进长期预测方法。
- 建议未来研究涵盖更多动态因果关系和更多非结构化数据。
---
七、结论总结
本文系统比较了5种类型机器学习模型与传统单变量ARIMA基准在利用支付系统及宏观经济数据预测印尼通胀方面的能力。研究通过细致的交叉验证和超参数优化,证明XGBoost模型具有最佳的预测表现,平均预测误差减小逾53%。特别突出的是,支付系统中的ATM/借记卡及信用卡交易成为通胀预测中的关键驱动力,而传统资本市场指标及宏观经济变量则相对次要,这一点丰富了宏观经济变量选择的视角。作者创新地利用SHAP值方法实现黑箱模型的解读,认证了ML模型预测的经济合理性,并揭示了变量之间复杂的交互作用。尽管ML模型在长期预测阶段表现下降,研究依然高度评价ML技术作为中央银行辅助政策决策的补充工具的潜力。
本研究不仅推动了经济学与计算机科学的交叉领域发展,也为印尼乃至类似新兴经济体的货币政策制定提供了具有现实操作价值的技术支持。作者同时提出模型应用和解释中的注意事项,如异常值处理和模型假设,体现出严谨求实的研究态度。未来研究可扩展至更长时间尺度,更丰富数据类型以及更多经济变量上,以不断提升模型的预测效能和政策参考价值。[page::0~21]
---
附加说明:主要图表
- 图1显示印尼通胀及关键支付系统与资本市场变量的时间动态(2015-2021)。
- 图3和4清晰展示各模型预测与实际通胀走势对比,XGB显著拟合优良。
- 图5揭示不同训练-测试拆分比例下各模型RMSE变化趋势,强调短期预测优势。
- 表2总结不同模型MAE、RMSE及显著性检验结果,明确XGB领先地位。
- 图6-13详尽呈现Shapley解释,局部和全局变量影响力及交互效应图,深化模型“黑箱”可解释性。
---
结语
该报告是一篇贯彻机器学习预测技术与宏观经济政策应用精髓的学术力作。它不仅证明了机器学习技术在新兴经济体通胀预测方面的卓越性能,更通过精准的模型解释,填补了传统经济学中政策应用和机器学习之间的鸿沟。通过系统的模型分析、指标评估及详尽的图表展示,本文为中央银行和相关政策制定者提供了新的分析工具和决策支持依据。