`

基本面因子模型的深度学习增强

创建于 更新于

摘要

本报告提出一种基于基本面多因子选股模型的深度学习增强方案,通过先用基本面因子筛选初选股票池,再用深度学习模型进行次级筛选,实现了收益率与换手率的均衡优化。实证显示,增强模型在2011年至2021年3月期间,年化收益率达到28.58%,显著优于单独基本面模型和深度学习模型,且换手率控制在9倍以内,具备较好的交易成本适应性。该增强策略在双边千分之三至千分之五交易费率下均表现优异,且具备较强的年度超额收益稳定性,体现了基本面信息和技术面价量信息的有效融合[page::0][page::14][page::23]

速读内容

  • 基本面多因子选股模型以盈利(ROE、GPM)、成长(营业收入同比增长率YoyOr、资产同比增长率YoyAsset)和估值(市现率倒数CFP)三大类因子构建,筛选出基本面优质股票组合,年化超额收益率达到14.07%,年化收益率18.12%,持股中位数约76只,换手率较低[page::4][page::5][page::6]。

  • 深度学习选股模型采用7层深度神经网络,输入156个技术面特征(价量指标及申万28个行业哑变量),输出股票上涨、平盘、下跌概率,使用上涨概率与下跌概率之差评分股票,回测年化超额收益率达20.65%,年化收益率24.70%,持股中位数75只,换手率相对较高[page::7][page::8]。

  • 两类模型选股逻辑差异显著,深度学习评分与基本面因子评分相关系数接近零,十分档选股重合度约10%,基于基本面中性化处理后深度学习模型选股能力无显著变化,说明两者可有效互补[page::9][page::10][page::11]。



  • 因子IC加权方案将基本面因子和深度学习因子按120天IC均值加权,构建组合,年化收益率24.62%,超额收益20.69%,表现优于单一模型[page::11][page::12]。

  • 本报告提出的增强模型采用两步筛选:首先用放宽条件的基本面因子筛出初选股票池(中位数248只),再用深度学习模型对该池分3组选择打分最高组构建组合(持股中位数83只)。该模型年化收益率28.58%,超额收益率24.29%,换手率8.83倍,明显优于单独基本面、深度学习及IC加权模型,且换手率低于深度学习模型10.89倍,控制了交易成本[page::12][page::13][page::14][page::17]。


  • 增强模型在双边千分之五交易费率下仍显著优于基本面、深度学习及IC加权模型,年化超额收益率达21.00%,收益率保持25.22%,显示较好交易费用适应性[page::18][page::19]。

  • 以沪深300为基准进行回测,增强模型的年化超额收益率为22.23%,年化收益率27.58%,超越基本面模型和深度学习模型,并具备较低换手率,回测区间11年中有9年超出基本面模型表现[page::19][page::20][page::21][page::22]。

  • 增强模型对深度学习分组数敏感性测试显示,分为3至5组时持股数由83降至50只,换手率和收益率微调变化,均明显优于单独基本面模型和IC加权模型[page::22][page::23]。


深度阅读

报告分析解构:《基本面因子模型的深度学习增强》——广发证券发展研究中心



---

一、元数据与报告概览


  • 标题:《基本面因子模型的深度学习增强》

- 报告编号:深度学习研究报告之八
  • 发布机构:广发证券发展研究中心

- 发布日期:最新数据至2021年3月,具体发布日期未详
  • 分析师团队:罗军(首席分析师),安宁宁(联席首席分析师),史庆盛、张超、文巧钧等资深分析师组成

- 核心主题:本报告聚焦于将深度学习技术应用于基本面多因子选股模型,通过结合深度学习模型对基本面初选股票池的二次筛选,构建增强型选股策略,从而实现较低换手率下获得更高超额收益。
  • 核心论点与目标

- 传统的基本面多因子模型具有稳健的中长期选股能力,偏向低换手率策略;
- 深度学习模型基于大量价量技术指标及行业编码等特征,能够捕捉短期股价走势信号,具有优异的选股能力但通常换手率偏高;
- 两种模型的选股逻辑差异显著,相关性低,选股重合度仅约10%;
- 通过先使用基本面模型筛选出优质股票池,再利用深度学习模型二次筛选构建增强模型,显著提升收益表现,且换手率介于二者之间,实现收益与交易成本的最优平衡。
  • 风险提示:模型非百分百有效,市场结构变化及策略参与者增多可能导致模型失效。[page::0,3]


---

二、逐节深度解读



1. 基本面投资与技术面投资结合的背景(第3页)


  • 关键点总结

- 基本面投资强调宏观经济和公司财务数据,以盈利能力和成长性为核心选股依据,信息更新频率较低,换手率偏低,适合公募策略。
- 技术面投资利用价格和成交量(价量)数据及衍生指标,能够实现高频快速交易,适合私募策略,但换手率较高。
- 近几年,技术面量化策略在国内快速发展,机器学习和深度学习技术被引入以应对传统价量因子失效。
- 公募机构希望在基本面模型基础上引入技术面策略提高alpha,但控制换手率仍是关键。
  • 逻辑依据:结合基本面模型的稳定性和深度学习模型的短期预测能力,融合策略有望实现收益与策略容量的平衡。此处点明两者信息频率与数据类型重大差异,成为融合创新的动力。[page::3]


2. 基本面多因子选股模型构建与表现(第4-6页)


  • 模型构建

- 以盈利(ROE、毛利率GPM)、成长(营业收入同比增长率YoyOr、资产同比增长率YoyAsset)、估值(市现率倒数CFP)三大风格因子为核心筛选因素。
- 行业和市值因子中性化处理,兼顾风格均衡。
- 按照上述因子阈值(多数为前25%或50%-70%)进行股票筛选,最终构建持仓中位数约76只的组合。
  • 投资表现

- 月度调仓,剔除新上市、ST、停盘、涨跌停股票,交易成本双边千分之三。
- 2011年至2021年3月,基本面模型年化收益率18.12%,年化超额收益14.07%,净值稳步上升明显跑赢中证800指数。[图2,3][page::4,5,6]

3. 深度学习模型构建与表现(第7-8页)


  • 模型构建

- 使用7层深度神经网络,输入包含156个股票特征,涵盖价量技术指标、传统因子及28个行业编码变量。
- 输出层有3个节点,分别对应股票未来“上涨”“平盘”“下跌”三类概率,得分为上涨概率减去下跌概率。
- 模型采用滚动训练方式,每6个月用最近6年数据更新模型参数,持续预测未来收益。
  • 表现

- 持股数量中位数75只,调仓频率同样为20个交易日。
- 年化收益率高达24.70%,年化超额收益20.65%,净值曲线显著优于中证800,表现稳定。[图4,5][page::7,8]

4. 两种模型的组合潜力分析(第9-11页)


  • 模型表现对比:基本面超额收益14.07%,深度学习20.65%。

- 相关性与重合度
- 两模型之间横截面打分的Spearman相关系数均值在-0.05至+0.05之间,极低相关性。
- 十分档多头组股票重合度均值最高仅10.49%,与零相关理论期望10%接近。
- 基本面因子中性化前后深度学习模型的IC与ICIR不变,统计检验p值高达0.97,无显著差异。
  • 结论:两类模型的选股逻辑和结果极为不同,具备天然的多样化潜力和组合价值。

- 提出组合方案:通过大类因子IC加权和增强模型两种形式尝试融合。[图6-9][page::9,10,11]

5. 大类因子IC加权模型(第11-12页)


  • 将基本面与深度学习因子权重基于过去120天的IC均值加权形成综合打分,构建组合。

- 持股中位数78只,调仓频率同前。
  • 年化收益率24.62%,超额收益20.69%,大幅优于基本面模型,但与深度学习模型接近。[图10,11][page::11,12]


6. 增强模型设计与实证(第12-23页)


  • 增强模型逻辑

- 步骤一:利用基本面因子模型筛选出股票池(约248只,放宽筛选条件),确保中长期基本面优势股票全集。
- 步骤二:对上述初选股票池利用深度学习模型进一步筛选或分组(本报告中分为3组,选取上组,约83只),提升选股的短期有效性。
  • 实证结果(中证800基准)

- 费用千分之三下,增强模型年化收益率28.58%,超额收益24.29%,明显领先其他模型。
- 降低了换手率(8.83倍),显著低于传统深度学习模型(10.89倍)和IC加权模型,缓解高换手率带来的成本压力。
- 多头组三等分分组收益验证深度学习进一步筛选有效,年化收益率依次递增。
- 提高了超额夏普比率至1.52,基本面模型仅为0.81,说明增强模型风险调整回报更优。
- 超额收益分年度统计显示过去11年内增强模型有8年跑赢基本面模型。
  • 交易成本敏感性测试

- 在更高交易成本(双边千分之五)情形下,增强模型依然保持明显领先优势,换手率较低成为核心优势。
  • 沪深300基准下表现

- 交易费用千分之三情形下,增强模型年化收益率27.58%,年化超额收益22.23%,超额胜率77%以上。
- 超额收益逐年分析显示11年中9年跑赢基本面模型,换手率维持8.83倍。
  • 参数稳定性测试

- 深度学习分组数从3至5组,持股数由83只降至50只,换手率有轻度波动,年化收益率和超额收益均无显著差异,表明策略稳定。
  • 主要数据表与图表举例

- 表3 详列基本面筛选条件
- 表4、5 回测结果及参数敏感性
- 图13-29 净值、超额收益、换手率等重要指标趋势可视化
  • 结论:增强模型充分利用基本面选股的稳定估值基础和深度学习模型的短期择时优势,达成收益和成本平衡上的技术突破。[page::12-23,15-22]


---

三、图表深度解读



图1(基本面选股三要素,页4)


  • 展示基本面三大核心因子类别:盈利、成长、估值,形成选股的三大支柱。形象化强调模型构建的方向和因子覆盖的合理性。为下文选股具体因子奠基。[page::4]


图2&3(基本面模型净值、年化收益,页6)


  • 净值明显跑赢中证800指数,超额净值长期稳步上升,表明模型有效捕捉了市场价值。年化超额收益达14.07%,表现亮眼,奠定后续深度学习增强基础。[page::6]


图4&5(深度学习模型净值、年化收益,页8)


  • 显示深度学习模型在价格量技术因子基础上捕获显著alpha,超额年化收益达20.65%,明显优于基本面模型,支持融合必要性。[page::8]


图7(深度学习与基本面因子相关性,页10)


  • 曲线波动围绕0附近,无明显正负相关,表明两类模型信号独立,支持组合潜力。此图视觉强化量化科学中因子独立的重要性。

- 注意数据敏感性,相关性系数波动显示选股逻辑变化的市场适应性。[page::10]

图8(深度学习与基本面因子选股重合度,页10)


  • 重合度集中在约$10\%$,与理论独立模型完全吻合,进一步确认两模型差异明显。

- 该数据极具说服力,说明二次筛选增强模式带来实质性新信息。[page::10]

图9(中性化前后深度学习选股能力,页11)


  • IC值变化极小(0.1361 vs 0.1362);p值0.97表明无统计学差异,深度学习模型预测因子主动剥离了基本面因子影响,非简单重叠,保证二次筛选的实用价值。[page::11]


图10&11(IC加权模型净值与年化收益,页12)


  • 组合综合了两类因子,收益稳定提升,但未突破深度学习单模型水平,反映简单线性加权的局限。为下一步骤增强模型设计提供对比基础。[page::12]


图12(增强模型选股流程,页13)


  • 清晰展示两步筛选机制,层层收紧筛选范围,先保障基本面稳健,再用深度学习短期信号精炼,形象化方法论。[page::13]


图13-18(增强模型净值、年化收益和超额收益,页14-16)


  • 净值曲线明显优于所有其他模型,年化收益达28.58%,超额收益达24.29%。

- 不同深度学习分组收益验证二阶筛选有效性,客户兼顾收益和持股数量。
  • 年度超额收益多数年份正向,增强连续性好。

- 结合图18超额收益走势,策略抗市场波动能力较强。[page::14-16]

图19(年化换手率,页17)


  • 8.83倍换手率显著低于深度学习和IC加权模型,兼顾活跃程度和交易成本效率。支撑公募及大规模资金应用需求。[page::17]


图20-23(交易成本千分之五情景,页18-19)


  • 尽管交易成本提高,增强模型净值和超额收益维持领先,显示出优秀的交易成本敏感度和策略稳定性。[page::18-19]


图24-29(沪深300基准下表现,页20-22)


  • 明显延续中证800基准的优势,年化收益与超额收益均显著领先,换手率合理。

- 分年度表现稳定,9年超额,增强模型普适性强。[page::20-22]

表1-5(因子列表及策略表现细节)


  • 因子设计合理,综合考虑盈利、成长、估值,且均进行了行业与市值中性化规范化。

- 深度学习网络架构深度与节点设计符合复杂非线性关系抽取需求。
  • 策略参数调优充分,分组数变化影响较小,体现方案鲁棒性。

- 分年度细节数据充分体现策略的时间维度稳定性和风险回报特征。[page::5,7,13,16,23]

---

四、估值分析



报告未直接进行传统意义上的估值分析(如DCF、市盈率对比等),而是聚焦于多因子模型的选股收益及交易成本表现。投资者关注点为:
  • 不同模型超额收益能力对比

- 换手率及交易成本影响
  • 策略鲁棒性与风险调整后的夏普比率表现


增强模型通过分层筛选显著提升模型信息效率而非通过估值倍数变化获益,属于实证因子投资策略优化范畴。

---

五、风险因素评估


  • 策略模型非万能性:任何策略均有失效风险,深度学习和基本面模型的稳定性不能保证永远优于市场。

- 市场结构与行为改变:市场环境变迁(如监管政策、机构行为、参与者结构等)可能影响策略有效性。
  • 参与者增多导致拥挤:类似策略参与者的增多可能导致因子收益减少甚至消失。

- 交易成本和流动性风险:尽管降低了换手率,依然需要关注执行成本和流动性波动的潜在冲击。
  • 未提出明确缓解策略:报告中未详细讨论风险缓释措施,策略适用性需结合实际动态调整。[page::0,23]


---

六、批判性视角与细微差别


  • 模型假设敏感性:筛选阈值调整及深度学习分组细节对结果有潜在影响,虽然报告测试了3-5分组的影响,但更极端参数未讨论。

- 交易成本假设理想化:现实中交易成本与滑点可能高于报告设定,尤其在大资金交易时,策略实用性可能受限。
  • 中性化处理的局限:虽然统计上深度学习模型与基本面因子相关性低,但模型实际应用中,潜在非线性相关仍可能存在,需进一步解析深层交叉效应。

- 样本外验证缺失:报告主要基于回测,缺少样本外与实时交易验证,模型真实表现尚待市场检验。
  • 风险提示过于简略:潜在的市场极端波动风险及策略因过度拟合导致的回撤可能性分析欠缺。

- 持股规模变化风险:增强模型初选池规模相对较大,资金较多时流动性风险需关注。[page::23]

---

七、结论性综合



本报告深刻阐释并实证了如何利用深度学习增强传统基本面因子模型实现选股策略的质的飞跃:
  • 理论驱动:基本面模型强调公司盈利与成长的长期价值,深度学习模型敏锐捕捉短期技术和市场情绪信号,两者互补。

- 实证结果显著:结合两类模型的增强方案获得远超各单一模型的年化收益率(中证800基准28.58%,沪深300基准27.58%),且超额收益夏普比率大幅提升(1.52对0.81)。
  • 换手率控制合理:在交易费率较高环境下,增强模型将换手率有效限制于约9倍,显著低于传统深度学习模型,增强策略的资金容量和执行效率。

- 策略稳定性:分年度及参数敏感性分析显示增强策略大部分年份均实现正超额收益,且收益表现对深度学习分组数保持稳定。
  • 风险提示:模型存在市场结构变化及拥挤风险,策略并非万能,需持续动态调整。

- 创新贡献:首次系统展示了利用深度学习二次筛选基本面初选池的分步策略框架,有效解决传统深度学习策略换手率过高问题,兼顾收益与成本。
  • 图表数据:丰富图表系统支持结论,相关性(图7)、重合度(图8)、净值/超额收益曲线(图13-16,20,24)、换手率趋势(图19,29)、参数敏感性表(表5)等均展示了增强模型的优势与稳健。


总体而言,报告提供了在量化投资领域融合基础因子与深度学习技术的系统方法论,具有较强的实务指导意义与学术价值,推荐对公募及对冲基金等量化团队借鉴和深度开发应用。[page::0-23]

---

参考溯源页码:



概览及主要结论汇总于第0页;模型构造与理论基础详见第3-7页;深度学习模型结构和表现于第7-8页;模型相关性和重合度分析在第9-11页;组合模型设计及实证分析集中于第11-23页;交易成本和不同基准敏感性第17-22页;结论与风险提示第23页。

---

# 【全文完】

报告