`

Multilayer Perceptron Neural Network Models in Asset Pricing: An Empirical Study on Large-Cap US Stocks

创建于 更新于

摘要

本研究提出基于动态结构的多层感知器(MLP)模型,用于大盘美股特征排序组合因子模型的资产定价,进而设计量化因子投资策略。结果显示,在数据规模限制下,MLP模型“更深更好”不再适用,2至3层隐藏层的MLP结构更适合建模因子,且MLP模型在控制下行风险方面表现优于追求绝对收益。包含COVID-19市场极端波动期间的数据提高了模型表现,验证了MLP模型在极端市场环境下的稳健性。[page::0][page::17][page::23][page::35]

速读内容

  • 研究基于182个由公司特征排序组合构建的因子,选取来自纳斯达克和NYSE的420只大盘股,覆盖21.38%的市场资本,使用扩展训练窗口和固定验证窗口进行时间序列训练与验证,测试期间包含与不包含COVID-19两种设定。[page::6][page::7]


  • MLP模型采用动态金字塔结构设计方法(Coqueret和Guida方法),输出为单只股票超额收益,采用ReLU激活函数,损失函数为带L1正则化的均方误差,优化算法为Adam,包含早停和批归一化以防止过拟合和梯度消失。[page::8][page::10][page::13]
  • 模型对比涵盖自研5个不同隐藏层深度MLP模型与OLS、PLS、PCR及GKX2020三种隐藏层深度固定结构MLP基准模型。最佳表现为2层隐藏层的MLP,平均OOS $R^2$ 达3.66%,显著优于其他模型,COVID-19期间数据提升了MLP模型表现,削弱基准模型的敏感性。[page::17][page::18]




  • 因子重要性分析显示“公告收益”和“盈利预测差异”为所有模型最重要变量,之后为市值(Size)、账面杠杆率、盈利预测修正等,2层和3层隐藏层的MLP模型表现最佳,隐藏层数增加导致过拟合及因子重要性降低。[page::23][page::25][page::26][page::27]
  • 量化策略基于单边正信号构建等权和价值加权投资组合,禁止卖空以防止极端杠杆风险,交易费用取0.5%作为折扣因素。2层隐藏层MLP策略在包含COVID的测试期取得最高夏普率(约0.27)、Sortino比率及最低最大回撤(约39%)。相比基准和GKX2020模型,拟合度更好,且更有效控制下行风险。[page::16][page::28][page::31]



  • COVID-19期间市场波动加剧,MLP模型表现明显优于非MLP模型,且股价市值和动量因子在极端市场环境下影响增强。疫情数据提高模型的表现和稳定性,同时也揭示“更深MLP”不总是更好,数据规模限制是关键因素。[page::19][page::24][page::28]

  • 研究证实GKX2020模型在无信号过滤机制时存在过拟合和交易信号捕获失败问题,建议未来关注交易信号过滤、超参数调优与样本选择以提升模型实用性和投资效能。[page::35][page::36]

深度阅读

金融研究报告详尽分析报告



1. 元数据与概览


  • 报告标题: Multilayer Perceptron Neural Network Models in Asset Pricing: An Empirical Study on Large-Cap US Stocks

- 作者: Shanyan Lai
  • 发布机构: University of York(约克大学)经济与相关研究系

- 日期: 未明确标注具体发表日期,引用中包含2024年的文献与数据
  • 研究主题: 将多层感知器(MLP)神经网络模型用于资产定价,特别是对美国大型市值股票的因子模型进行实证研究,并基于模型预测构建因子投资策略,探讨MLP结构的动态调整及其在不同市场状况(如COVID-19疫情前后)的表现。


核心论点及评级:
  • 该研究主要关注于MLP模型在资产定价中的有效性,特别是在高维“因子动物园”(factor zoo)问题下,通过动态结构的MLP解决维度灾难的问题。

- 研究发现MLP结构加深(即“deeper”)的提升并不明显(“deeper, better”论断不适用),2至3层隐藏层的动态MLP结构更适合建模大型市值股的因子。
  • MLP模型在控制下行风险方面表现优异,但对绝对年化收益的提升作用有限。

- 基于MLP模型的因子投资策略在COVID-19疫情期间表现出更加稳定与适应性。

本报告贡献在于引入了动态MLP结构、使用经济意义更强的特征组合、验证疫情对MLP模型适用性的影响,并提出实际可行的因子投资系统。

---

2. 逐节深度解读



2.1 引言与相关工作回顾(1-6页)


  • 论点总结:

引言回顾了资产定价的经典理论发展历程,包括CAPM单因子模型、APT多因子模型、Fama-French模型及其扩展,详细讨论了因子数量激增带来的维度灾难和多重共线性问题。
随后,介绍了机器学习在金融领域的兴起,尤其是MLP及其他方法(Elastic Net、随机森林、梯度提升树等)用于资产定价研究的先驱性成果(Gu et al.,2020,GKX2020模型)。
研究针对以下问题提出探索:MLP模型是否纯粹依赖数据挖掘,是否具有经济解释力,何种MLP结构适合因子定价,MLP在极端市场波动中的稳定性(如COVID-19)。
  • 关键数据点:

420只大盘股(纳斯达克和纽交所),占市场总市值21.38%。
融合182个基于公司特征排序的因子,优于GKX2020使用的900个原始特征。
训练/验证/测试时间窗口设计,并分别考虑包含与排除COVID-19疫情的测试时段。
  • 逻辑解释与推论:

逐步应用机器学习方法解决因子模型的高维问题,动态调整MLP结构对应输入特征维度,提升因子解释能力和投资策略表现。COVID-19作为极端市场事件,考验模型的稳定性和收益风险控制能力。

2.2 模型部分(8-14页)


  • 基本框架:

普遍资产定价模型中,资产超额收益被建模为因子函数加误差项。在传统线性框架中,该函数为线性,MLP模型通过多层非线性激活结构替代,能捕捉复杂特征映射关系。
  • MLP结构详解:

输入层:182维因子特征。
隐藏层数动态变化(1-5层),Coqueret和Guida提出的动态金字塔层设计结构,将每层神经元数动态计算以合理降维。
激活函数:ReLU,克服梯度消失问题。
损失函数:带L1正则化的均方误差,用于防止过拟合和特征选择。
参数更新:基于Adam优化器的随机梯度下降及反向传播机制。
训练策略包含early stopping和批量归一化,控制模型复杂度及训练稳定性。
  • 重要公式及金融含义:

MSE损失函数强调拟合超额收益时间序列,L1正则促进模型稀疏性,避免在多重共线性因子条件下过度复杂。动态层设计强调数据样本数和参数规模比例,提高模型泛化性能。

2.3 数据设计与实证方法(6-7,15-16页)


  • 数据样本细节:

响应变量:420只大型股票的超额收益,1957年至2021年期间。
预测因子:182个公司特征排序衍生的组合因子,来源于Andrew Y. Zimmermann提供的公开数据。
时间窗口:训练起点1957,验证窗口固定,测试窗口设定为包含及排除COVID时期。
模型评估指标:平均外样本MSE、外样本R²、Diebold-Mariano检验及基于预测性能的变量重要性排序。
  • 实证设计流程:

1) 数据准备
2) 模型训练与预测
3) 模型性能比较(不同隐藏层层数、GKX2020、传统统计模型)
4) 交易信号生成(仅开多仓,无空仓,降低系统风险)
5) 回测及策略表现评估(Jensen alpha、年化收益、Sharpe与Sortino比率、最大回撤等)。

2.4 模型表现结果(17-23页)


  • 核心结果:

MLP模型中的双隐藏层(fw2)结构在所有测试指标中表现最佳,平均OOS R²达3.66%,超过GKX2020及传统OLS、PLS、PCR方法。
包含疫情期间的测试时段内模型表现优于剔除疫情时段,表明MLP模型对极端市场波动具较好适应性。
隐藏层数过深(4层及以上)易导致过拟合,模型表现下降,验证了“deeper, better”在有限数据下不成立。
变量重要性分析显示,公告收益(Announcement Return)、盈利预期差异(Earnings Forecast Disparity)、规模(Size)、账面杠杆(Book Leverage)、盈利修正(REV6)等因子为主要驱动因子,多数因子在疫情期间影响力发生波动。
不同模型在变量重要性上略有侧重,深层MLP更重视动量与规模等因素。
  • 图表分析:


- 图3: 市值加权价格指数
显示自2000年至2022年标的股票价格走势,疫情期间市场剧烈波动,体现COVID-19冲击的典型市场波动样态,配合模型测试框架。


- 图4: OOS R²分布图
展示各模型下单只股票的R²分布明显左偏,疫情期间MLP模型的R²分布更集中且提升上界,表明模型在许多个股上具更稳定的解释力。


- 图5: MSE分布图
各模型单只股票的OOS均方误差统计,疫情包含期间,MLP模型普遍显示低且集中分布,进一步佐证模型稳定性提升。


- 图6-8: 变量重要性前20因子柱状图
分别对应全测试期、疫情前及疫情后1年,显示因子重要性时间的动态变化,Size、Announcement Return和Forecast Disparity持续位列前排,部分因子如动量指标疫情后影响增强。




---

2.5 投资组合回测表现(28-34页)


  • 主要组合指标:

年化收益、标准差(风险波动)、Sharpe比率(风险调整收益)、Sortino比率(只计下行风险调整收益)、最大回撤(最大资金峰谷跌幅)、Jensen Alpha(因子超额收益效应)。
  • 结果解读:

回测允许开多仓,交易成本取0.5%,剔除空仓,贴合真实做市环境。
等权和市值加权两种组合均测试。
包含疫情期间的全周期中,模型表现优于疫情剔除期间,伴随制约总体风险(如回撤控制显著);疫情大幅提升了组合的Sharpe与Sortino比率。
MLP双隐藏层(fw2)在等权组合和疫情期间表现最佳,SR达0.2651,MDD仅39.03%;市值加权组合表现更稳健,最低MDD降至33.04%。
深层模型(4-5层)虽表现出“深层更好”趋势,但交易信号捕捉失败表现趋近“买入持有”,过拟合且无法提供有效交易信号。
传统统计模型(OLS、PLS、PCR)普遍劣于MLP模型,且无明显优于买入持有策略表现,特别是在疫情期间。
Jensen Alpha均显著正值,表明因子投资确实提供了超额收益可能,但Alpha偏小意味着较好的因子解释能力。
疫情期间模型尤其擅长控制下行风险,支持MLP用于风险管理而非绝对超额收益驱动的结论。
  • 图表解析:


- 图10: 等权组合累积超额收益图
显示fw2、fw3等MLP模型明显优于OLS、PLS、PCR及GKX2020,同时买入持有策略收益最高但风险也最大。


- 图11: 市值加权组合累积超额收益图
绿色曲线(fw3模型)显示最优风险控制与收益平衡,其他深度MLP及GKX2020表现趋于平滑,未能捕捉有效交易信号。


---

2.6 结论与讨论(35页)


  • 总结核心观点:

本文基于GKX2020模型,结合动态MLP结构和经济含义明显的因子,改进模型拟合与投资组合表现。
通过大样本期间(含疫情)评测,确认MLP模型的最佳复杂度为2到3层隐藏层,层数过深反而导致过拟合。
模型对高频财务因子(尤其是规模、盈利预期、公告收益等)敏感,且在疫情等极端市场条件下表现更佳。
实际投资角度看,MLP模型更适合风险管理(下行风险控制)而非单纯追求绝对收益超额。
模型未包含交易信号过滤机制存在信号捕获困难,潜在改进方向是增加信号过滤提升交易信号鲁棒性。
投资组合选择(等权 vs 市值加权)对收益风险表现有明显影响,市值加权有助于降低风险。
* 研究强调MLP模型在现实市场中应用的可行性与有效性,提出未来工作重点为数据规模扩大、信号过滤及参数优化。
  • 对比GKX2020:

在数据、特征选择和模型结构方面均有改进,提升了泛化能力,增强了经济解释力和投资实用性。

---

3. 图表深度解读



图3 - 市值加权价格指数

  • 描述: 展示420只大盘股票2003-2021年价格指数走势,重点标注COVID-19疫情期间(2019年12月至2021年12月)

- 趋势: 疫情期间市场给出大幅波动,但整体在2020年后反弹强劲。贴合实际市场环境。
  • 联系文本: 为理解模型在极端市场环境下的适应性提供实证基础,揭示模型测试的现实意义。


图4 - OOS R²分布

  • 描述: 不同MLP模型及PCR模型在疫情前(1911)和疫情全测试期(2112)的单只股票外样本R²频次分布。

- 趋势/见解:
1. 所有模型在疫情全期表现出更高的集中度及尾部伸展,表明模型适应极端行情能力提升。
2. 双层隐藏(fw2)模型表现稳定,疫情期对R²分布右移,意味着更有效解释超额收益变异。
  • 文本对应: 支持“MLP增强因子解释能力,尤其在市场波动时更显著”。


图5 - MSE分布

  • 描述: 各模型在两个测试期间的单只股票均方误差分布。

- 趋势/见解: MLP模型在疫情包含期间显示更低的MSE,PCR在疫情期间亦有所改善,但总体表现不及MLP。
  • 解释: MSE与R²呈反比,MSE降低意味着预测准确度提升。MLP在数据扰动大时更稳健。


图6-8 - 变量重要性前20位

  • 内容: 展示5种不同隐藏层深度MLP模型在三个时段(全期、疫情前、疫情后1年)最关键的20个因子。

- 分析:
- 核心因子持续存在,包括 Announcement Return, Earnings Forecast Disparity, Size 等。
- 疫情后期Size的影响回升,与市场结构变化相呼应。
- 深度增加时,因子重要性分布趋于稀释(表明模型复杂度过高或过拟合)。
  • 意义: 验证了因子经济意义及MLP模型的经济解释能力。


图10-11 - 组合累积超额收益

  • 描述: 等权和市值加权组合在全测试期间不同模型的累积收益曲线。

- 数据解读:
- 等权组合中,双隐藏层MLP(fw2)表现最好,GKX2020模型趋势平平,接近买入持有。
- 市值加权组合中,三隐藏层MLP(fw3)兼顾风险控制与收益增长最佳。
  • 逻辑联系: 支持MLP模型在风险调整后的超额回报能力,尤其是在结构合理、动态调整层数后更优。


---

4. 估值分析



该报告侧重于资产定价模型中MLP对超额收益的拟合和预测,未涉及传统意义上的公司估值分析,但通过MLP模型拟合资产超额收益,进而构建因子投资策略,实质上完成了资产价值的动态评估。从技术实现层面:
  • 估值方法: 多层感知器作为非线性函数近似器,代替线性因子模型函数形式

- 关键假设: 因子与超额收益的非线性复杂关系可由MLP捕捉;动态调整层数与神经元数目以平衡拟合精度与过拟合风险
  • 输入及输出: 输入为182维公司特征排序因子,输出为单只股票超额收益预测

- 损失函数: MSE(带L1正则化)
  • 模型优化: Adam梯度优化算法,动态学习率,自适应参数更新

- 预测性能指标: 外样本R²、MSE、Diebold-Mariano测试

该方法为资产定价估值提供了一种替代传统线性因子模型的非线性高维方法,具备更高预测性能,特别是在高维因子集存在复杂交互效应时。

---

5. 风险因素评估



报告中明确识别和讨论的风险主要包括:
  • 数据局限性风险: 由于数据规模有限,模型复杂度受限,“deeper, better”原则不成立,过深模型易过拟合,导致预测性能下降。

- 市场时序风险: 过度拟合模型难以有效捕捉交易信号,尤其在极端市场环境下波动剧烈时,信号噪声加剧。
  • 信号过滤缺失风险: 目前MLP模型未集成信号过滤机制,直接影响到因子投资策略的信号准确性和实操可靠性。

- 模型超参数调整风险: 模型架构(隐藏层数、宽度)、正则化强度、学习率等超参数调整复杂,缺少统一优化指导,影响模型稳定性和泛化性能。
  • 投资组合风险: 等权组合与市值加权组合的选择对风险暴露有重大影响,尤其在极端市场事件中表现不同。


报告指出通过动态MLP层设计、正则化与批量归一化缓解过拟合风险,采用Adam优化器稳定训练,增加疫情影响期数据提升模型适应性。后续研究建议加入交易信号过滤机制、优化特征选择和超参数调优。

---

6. 批判性视角与细微差别


  • 模型“deeper, better”假设局限: 报告集中批判了MLP“层数越多,性能越好”的普适论断,指出在实际金融资产定价任务中,数据样本相对于参数量有限,深层模型反而降低泛化能力,产生过拟合。此假设偏见明确,体现了方法论上的谨慎。

- COVID-19疫情数据的双刃剑特性: 虽然疫情带来的极端市场波动提升了模型适应能力和模型性能,但疫情期间的强烈反弹也使得买入持有策略表现较好,抑制了MLP模型绝对收益的超越性,这表明模型性能评估受周期影响大,需谨慎解读。
  • 交易信号捕获能力不足: 模型在交易信号生成中未纳入有效过滤,信号噪声干扰,导致深层模型及GKX2020模型在回测中表现趋近基准买入持有策略,暗示实际交易执行中潜在弱点。

- 特征解释与模型黑盒问题: 虽利用置换重要性等方法提升模型可解释性,但深层MLP特征重要性逐层递减及影响模糊,反映深度模型在可解释性上的困难,金融应用需权衡。
  • 内外样本表现差异: 报告发现不同模型及不同市场阶段下,模型稳定性和表现存在波动,提示需进一步研究模型长期稳定性、稳健性。


---

7. 结论性综合



本研究以多层感知器神经网络为核心,针对美国大型股的资产定价任务发展并评估了动态结构的MLP模型。通过对比GKX2020及传统统计模型,采用182个经济含义清晰的公司特征排序因子,验证了MLP在建模资产超额收益及构建因子投资组合中的优势。关键发现包括:
  • MLP模型在2-3个隐藏层结构下获得最佳表现,深层结构带来过拟合,反驳“deeper, better”普遍断言。

- 疫情期间(COVID-19)极端市场波动增强模型的适用性和稳定性,同时显著提升回测指标中的风险调整收益(Sharpe和Sortino比率),强化了MLP模型对下行风险管控的能力。
  • 基于MLP模型的因子投资策略显示出正的显著Jensen Alpha,说明超额收益来源于因子有效提取,但策略回测中未包含信号过滤机制导致部分深层模型信号捕获不佳,交易表现接近基准买入持有。

- 变量重要性分析强调了公告收益、盈利预期差异、公司规模等财务特征的核心作用,疫情带动了动量等因子的权重再平衡。
  • 相较于等权组合,市值加权组合在风险控制和收益稳定性方面表现更佳。

- 研究成果为进一步探索机器学习模型在资产定价及因子投资中实际应用提供有价值的实证基础和建模指南,指出未来需解决数据样本限制、交易信号过滤及模型超参优化等关键挑战。

整体而言,该报告既有丰富的理论创新和实证深度,也对金融业界的MLP因子模型应用提供了切实可行的路径,符合当前资产管理领域机器学习方法的主流研究趋势和实际需求。

---

参考文献的学术完整度及规范性



报告附带详实的文献支持,包括CAPM经典文献、APT、Fama-French模型、机器学习在金融中的前沿研究以及相关优化算法和统计学工具,确保研究观点具备稳固的学术根基和广泛的对比视角。

---

总体评价



该报告科学严谨,结构完整明晰:从资产定价理论梳理、数据特征选择、模型构建细节、实证方法设计、结果多角度验证、风险提示及最后结论均涵盖充分。尤其对MLP结构设计与调整、疫情影响、市场风险与收益权衡做了细致剖析。图表丰富,数据解释清晰,结论合理客观,兼顾学术与实践的平衡,适合资产定价与金融机器学习领域的专业研究和实践应用参考。

---

关键引用页标识


  • 概念与背景介绍及研究动机:第0-3页 [page::0, page::1, page::2, page::3]

- 数据与方法论详解:第6-16页 [page::6, page::7, page::8, page::9, page::10, page::11, page::12, page::13, page::14, page::15, page::16]
  • 模型表现与实证分析:第17-34页 [page::17, page::18, page::19, page::20, page::21, page::22, page::23, page::24, page::25, page::26, page::27, page::28, page::29, page::30, page::31, page::32, page::33, page::34]

- 结论及未来展望:第35页 [page::35]

---

如此详尽分析,力求涵盖文本内容、方法细节、数据解读与逻辑推导,为深度理解该金融机器学习资产定价研究提供系统框架和核心洞察。

报告