`

基本面因子模型的深度学习增强

创建于 更新于

摘要

本报告提出了一种基于深度学习模型对基本面多因子选股模型进行增强的新方法。基本面模型通过盈利、成长和估值三大指标筛选股票,深度学习模型则构建了包含156个特征的七层深层神经网络预测股票未来走势概率。通过两步筛选法,首先基于宽松的基本面条件选出初选股票池,再用深度学习模型对其进行筛选,构建增强模型组合。实证结果显示,增强模型年化收益率显著提升至28.58%,超额收益夏普比率达到1.52,年化换手率控制在9倍左右,表现优于单一基本面模型、深度学习模型及因子加权模型,且在不同基准与交易成本下均具稳健性[page::0][page::3][page::4][page::6][page::8][page::9][page::11][page::12][page::13][page::14][page::15][page::16][page::17][page::18][page::19][page::20][page::21][page::22][page::23]

速读内容

  • 基本面模型基于盈利(ROE、毛利率)、成长(营业收入同比增长率、资产同比增长率)和估值(市现率倒数)三类因子构建,筛选出持股数量中位数为76只的股票组合,年化收益率为18.12%,较基准中证800超额14.07% [page::4][page::5][page::6]



  • 深度学习模型采用7层深层神经网络,输入156个股票特征涵盖传统选股因子、价量指标及行业哑变量,输出股票未来涨跌平概率,打分为上涨概率减去下跌概率。该模型每半年滚动更新,持股数量中位数为75只,年化收益率为24.70%,相较基准超额20.65% [page::6][page::7][page::8]



  • 两种模型相关性较低:深度学习模型与基本面因子相关系数均值在[-0.05, +0.05],股票分组多头部分重合度约为10%,且深度学习模型选股能力经基本面因子中性化后变化不大,显示两者选股逻辑和信息来源存在显著差异,利于组合互补提升 [page::9][page::10][page::11]




  • 因子IC加权模型将基本面因子和深度学习因子按过去120日IC均值加权组合,持股中位数78只,年化收益率24.62%、超额收益20.69%,表现类似深度学习模型,优于基本面模型 [page::11][page::12]



  • 增强模型采用两步筛选法:先基于放宽条件的基本面因子筛选出高质量初选股票池(持股中位数248只),再根据深度学习模型分组选择评分最高组股票,持股中位数约83只,兼顾基本面质量与技术面短期机会 [page::12][page::13]


  • 在双边千分之三交易费率下,增强模型年化收益率28.58%、年化超额24.29%,超越基准、中证800基本面模型、深度学习模型和IC加权模型,夏普比率1.52,换手率约8.83倍,介于基本面模型和深度学习模型之间,表现优异且换手率可控 [page::14][page::15][page::16][page::17]







  • 交易成本上升至千分之五时,增强模型延续优异表现,年化收益率为25.22%、年化超额收益21.00%,优于各基线模型,显示更低换手率优势减少费用侵蚀 [page::18][page::19]





  • 在沪深300指数基准下,增强模型年化收益率达到27.58%,超额收益22.23%,优于其他模型,且在11年回测期有9年表现提升,表现稳健 [page::20][page::21][page::22]







  • 深度学习分组数调整(n=3,4,5)对最终回测指标影响有限,持股数量随分组数增加略减,换手率小幅提升,年化收益与超额收益均明显优于基本面和IC加权模型,显示参数稳健性 [page::22][page::23]


| 分组数 | 持仓股票数量中位数(只) | 年化超额收益率 | 年化收益率 | 年化换手率倍数 |
|--------|----------------------|------------|----------|-----------|
| 3 | 83 | 24.29% | 28.58% | 8.83 |
| 4 | 62 | 22.81% | 27.03% | 9.44 |
| 5 | 50 | 23.42% | 27.60% | 9.80 |
  • 风险提示:模型有效性受市场结构、交易行为变化及参与者增多影响而可能失效,投资需谨慎。[page::23]

深度阅读

深度学习增强基本面因子模型研究报告详尽分析



---

一、元数据与报告概览


  • 报告标题:《基本面因子模型的深度学习增强——深度学习研究报告之八》

- 发布机构:广发证券发展研究中心金融工程团队
  • 发布日期:2021年3月7日

- 研究主题:采用深度学习方法增强基本面多因子选股模型,提高策略表现与收益率
  • 分析师

- 园2 0755-88286935 wenqiaojun@gf.com.cn
- 国公 0755-23948352 anningning@gf.com.cn
- 国公 020-66335128

核心论点:报告系统构建并测试了一种基于传统基本面多因子模型(盈利、成长、估值因子)并通过深度学习模型进行增强的选股策略。研究发现此“增强模型”在保持较低年化换手率的同时,显著提升了组合回报率与超额收益,尤其在中证800和沪深300基准下均取得优异表现。

报告提供完整回测数据、模型结构说明、组合策略设计及参数敏感性分析,结论明确推荐基于深度学习增强基本面因子模型的投资策略,具备较高的收益/风险比与较强的抗交易成本能力。[page::0,3,6]

---

二、逐节深度解读



1. 基本面投资与技术投资结合趋势



报告首先介绍了基本面投资(关注企业盈利能力及成长)和技术面投资(价量、舆情等高频信息)的各自特征与差异。基本面因子更新慢、换手率低,符合公募偏好;技术面或量化策略高频更新,换手率高但潜在回报强。

逻辑:结合两者信息来源差异,融合基本面与技术面因子(尤其深度学习模型提取的技术面特征)有望提升组合绩效,降低单一模型的换手率限制,扩大容量。[page::3]

---

2. 基本面多因子模型详细构建


  • 选股因子:盈利(ROE、毛利率GPM)、成长(营业收入同比YoyOr、资产同比YoyAsset)、估值(市现率倒数CFP)

- 筛选标准
- ROE和营业收入同比增长率取市场前25%
- GPM及资产同比增长率取市场前50%
- 估值因子选取前70%
  • 组合构建:选出同时满足5因子要求的股票,平均持仓76只


回测参数严谨,月度调仓,行业市值权重匹配基准,交易成本0.3%。

表现:回测2011-2021年3月基准为中证800,基本面组合年化收益18.12%,相对中证800年化超额14.07%。净值曲线稳定攀升,体现基本面模型的稳健性。[page::4-6]

---

3. 深度学习选股模型架构与表现


  • 技术路线

- 使用7层深度神经网络,输入156个特征(包括传统因子和价量指标如MACD、KDJ,及28个申万一级行业虚拟变量)
- 输出层三分类(上涨、平盘、下跌)概率分布,股票评分为上涨概率减下跌概率
  • 训练机制

- 半年更新一次模型参数,采用最近6年滚动数据训练
  • 持仓规模:中位数75只,模拟与基本面模型持股规模接近


表现
  • 年化收益24.70%,年化超额收益20.65%(中证800基准)

- 净值曲线显示深度学习模型权益显著优于基本面模型和基准,且超额收益稳定增长

显示深度学习模型通过捕捉价格与成交量的高频技术特征,实现了更强的短期选股能力。[page::6-8]

---

4. 两种模型组合的可能性及分析


  • 年化超额收益对比:基本面模型14.07%,深度学习模型20.65%

- 相关性分析
- Spearman等级相关系数介于-0.05至+0.05,说明两模型选股逻辑无显著相关性
- 多头组股票重合度仅约10%,接近随机水平,进一步说明选股差异
- 基本面中性化前后深度学习选股IC变化不大(IC均值约0.136,ICIR约2),t检验p=0.97,差异不显著,强化彼此选股信息互补

结论:两模型基于不同信息源,可组合构建以综合捕获中长期和短期alpha。

大类因子IC加权模型


  • 将基本面和深度学习因子加权(权重依过去120天IC均值)

- 持股78只,年化收益24.62%,超额收益20.69%,略优于单一深度学习模型

说明简易加权提升策略表现但仍有优化空间。[page::9-12]

---

5. 增强模型设计与实证



增强模型选股流程:


  1. 基本面模型筛选获得“初选股票池”,股票数量中位数248只(宽松筛选)

2. 深度学习模型对该股票池内股票打分,分为3组,选取深度学习因子最高分组构建组合,平均持股约83只

该两步分层筛选方式旨在充分发挥基本面因子选股的中长期优势,同时退避深度学习模型相对较高换手率的缺点。

回测表现(基准:中证800,交易成本千分之三):


  • 年化收益28.58%,较深度学习模型(24.70%)、IC加权模型(24.62%)和基本面模型(18.12%)均有明显提升

- 年化超额收益24.29%,夏普比1.52,高于基本面模型0.81
  • 换手率约8.83倍,较基本面模型3.51倍虽高,但显著低于深度学习和IC加权模型的10倍以上

- 不同深度学习分组数(3,4,5组)下组合表现差异不大,灵活性佳
  • 交易成本升至千分之五,增强模型依旧表现优异,显示鲁棒性良好

- 在沪深300基准下表现同样优异,年化收益27.58%,超额收益22.23%,且年化换手率保持在合理范围内

分年度结果显示增强模型在大多数年度(中证800下8年,沪深300下9年)相对基本面模型提升显著,且风险调整后收益更优。

[page::13-22]

---

6. 风险提示


  • 策略模型存在失效风险,因市场结构、交易行为的变化及同类策略增加可能削弱模型有效性


---

三、图表深度解读


  • 图1(基本面三要素):盈利、成长、估值三大因子构成基本面选股框架,视觉明确呈现因子之间关系[page::4]

- 图2-3(基本面模型):净值曲线稳定上升,年化收益18.12%,相较中证800优势明显;反映基本面因子筛选效果良好[page::6]
  • 图4-5(深度学习模型):净值曲线起伏但增长显著,年化收益达24.70%,远超基准显示技术面深度学习模型强大选股能力[page::8]

- 图6:两类模型年化收益对比,一目了然深度学习模型优于基本面,基于此进一步组合具有价值[page::9]
  • 图7-9:深度学习模型与基本面因子相关性及选股重合度极低,且中性化处理无明显改变选股IC,证实模型选择信号互补性[page::10-11]

- 图10-11(IC加权模型):净值曲线和收益率接近深度学习模型,但无明显超越,提示加权策略可以作为基础提升手段[page::12]
  • 图12(增强模型选股流程图):清晰表达两阶段筛选逻辑,强调先宽松基本面筛选,后细致深度学习筛选[page::13]

- 图13-18(增强模型表现,中证800基准)
- 净值曲线持续领先其他模型,最高收益率达28.58%
- 分组收益图揭示深度学习因子有效提升初选股票池质量
- 超额净值与年化超额收益均体现增强模型的优势
- 换手率总体控制合理,低于深度学习集合,减轻交易成本压力[page::14-16]
  • 图19-23(增强模型不同交易费率表现)

- 在更高成本环境下仍能维持优势,说明策略鲁棒性强,具备实盘可操作性[page::17-19]
  • 图24-29(沪深300基准表现与换手率)

- 净值、年化收益与超额收益以及分年度表现均超越其他模型
- 换手率虽高于基本面选股,但仍明显优于深度学习模型单独使用,显示较好折中效果[page::20-22]
  • 表1-5详细展示因子定义、模型网络层数、筛选条件、年度分表现以及分组调节实验,数据完整,为报告结论提供扎实基础[page::5,7,13,17,23]


---

四、估值与策略评价(模型估值含义)



本报告未采取DCF或传统估值法,而是通过年度收益率、IC、换手率等量化指标对模型“价值”进行评价。
  • 主要采用年化收益、超额收益和夏普比率评价策略表现,反映投资组合整体资产表现

- 换手率作为风险和交易成本指标考量,体现策略运营难度和可持续性
  • IC(信息系数)作为因子预测能力指标,支撑因子加权权重设定与组合优化

- 配合模型参数灵敏度分析(如深度学习分组数)保障模型的稳定性和调优空间

整体来看增强模型达到收益增长和换手率控制的合理平衡,反映了其优良的策略估值。

---

五、风险因素评估


  • 策略可能因市场结构变迁、参与者竞争加剧及交易行为变化产生失效风险

- 需警惕策略因相似机器学习模型普及造成alpha萎缩
  • 报告未详细披露缓解风险措施,投资者需结合其他风险管理策略慎重使用


---

六、批判性视角与细微差别


  • 报告较为乐观,依赖回测数据充分验证模型效果,实际应用中仍需关注模型过拟合风险

- 深度学习模型解释性较低,若模型失效则策略回撤风险较大,未见针对极端市场行为的特别讨论
  • 换手率虽较深度学习单模型低,但仍高于传统基本面模型,对公募仍有一定压力,操作难度和成本不可忽视

- 策略有效性与市场结构变化高度相关,报告强调了风险提示但未展示具体定量风险缓释方案

---

七、结论性综合



本报告深入探讨了如何利用深度学习技术提升基于经典基本面因子的多因子选股模型。通过结构化回测和多维度指标比较,得出以下关键结论:
  • 基本面模型采用盈利、成长及估值三大类因子合理筛选股票,构建基础选股框架,收益稳定且低换手率

- 深度学习模型利用156维多类别因子,通过7层神经网络精准捕获价量数据的复杂模式,实现更高的短期预测能力和较高收益
  • 两模型选股相关性极低,股票池差异明显,信息互补性强

- 通过分层筛选构建“增强模型”,先宽松筛选基本面股票池,再用深度学习模型精筛,实现收益率大幅提升到年化28.58%,超额收益24.29%,同时换手率控制在合理9倍以内
  • 新策略在不同交易成本及沪深300、800等基准下呈现良好稳健性,且独立参数分组调节表现稳定

- 该“增强模型”在保持可控交易成本与风险的条件下,显著优化了股票组合收益,提升量化策略整体竞争力

图表数据完备详实,清晰展示了模型设计、回测表现与收益比较,为深度学习在量化基本面投资中的应用提供了实践范例和方法论支持,对量化策略设计及投资运营具有重要参考价值。

---

总评:报告严谨系统,从模型构建、回测设计、数据分析到风险警示均全面到位,凸显深度学习技术对传统选股模型的显著增强作用。为投资者和量化研究人员整合两类模型、提升收益率同时控制换手率提出了切实可行的解决方案。

---

(全文结论及图表均基于广发证券发展研究中心报告原文,数据与观点均有明确溯源,详见正文页码标注)[page::0-24]

报告