`

基于GRU、TCN模型的深度学习因子选股效果研究

创建于 更新于

摘要

本报告基于GRU和TCN深度学习模型构建选股因子,训练数据涵盖多时间周期行情特征,验证了GRU模型优于TCN,预测10日收益表现优于5日,同时构建的指数增强策略在沪深300、中证500、中证1000及中证2000等主要指数中展现显著超额收益,超额年化最高达27.1%,显示深度学习因子在量化选股领域的潜力与实际应用价值[page::0].

速读内容


深度学习模型选股效果对比 [page::0]

  • 报告使用GRU、TCN和TCN+GRU三种深度学习模型训练选股因子。

- GRU模型预测表现最佳,略优于TCN+GRU,明显好于单独TCN。
  • 10日收益预测模型的超额收益优于5日收益预测模型。

- 模型输入包括30日和60日日行情以及30周行情的6个特征(高、开、低、收、均价、换手率)。

指数增强策略表现及参数设置 [page::0]

  • 构建市值行业中性化指数增强策略,成分股不少于80%,单边换手率不超过20%。

- 2017年以来沪深300超额年化收益11.8%,中证500为13.6%,中证1000为21.7%,中证2000达到27.1%。
  • 允许市值行业适当暴露时,沪深300及其他指数年化超额收益有所下降,但依旧表现出色。

- 交易费用双边0.3%情况下,年收益减少约3%。

深度学习因子相关性及复合因子效应 [page::0]

  • 深度学习因子与低波动、低流动性因子相关性较高,与反转因子存在一定相关性,少与高频及基本面因子相关。

- 等权加权复合因子表现优于单一因子,提升了选股能力。

模型训练与验证方法 [page::0]

  • 利用2017年以来数据,每年训练模型并用于次年选股。

- 采用前9年数据训练,10年数据验证。
  • 损失函数为收益率与预测值相关系数的负值。


风险提示 [page::1]

  • 历史数据规律存在可能失效风险,模型结果需谨慎对待。


深度阅读

国泰海通|金工:基于GRU、TCN模型的深度学习因子选股效果研究——详尽分析报告



---

一、元数据与报告概览


  • 报告标题:《基于GRU、TCN模型的深度学习因子选股效果研究》

- 发布机构: 国泰海通证券研究所
  • 发布日期: 2025年7月30日

- 作者: 郑雅斌、张雪杰、朱惠东(国泰海通证券分析师)
  • 研究主题: 本报告聚焦于使用两种深度学习模型——门控循环单元(GRU)与时序卷积网络(TCN)来训练深度学习选股因子,测试其选股效果及构建指数增强策略的投资表现。


核心论点及目标:

报告主要探讨基于GRU和TCN两种深度学习架构训练出的选股因子的表现,比较模型间的效果差异,探索其在沪深不同规模股(沪深300、中证500、中证1000、中证2000)指数增强策略中的超额收益情况及风险。报告发现:
  • GRU模型性能略优于其他组合模型(TCN+GRU)和单独TCN模型;

- 预测10日收益的模型表现优于预测5日收益的模型;
  • 深度学习因子与低波动性、低流动性因子相关,且构建的复合因子策略效果明显优于单一因子;

- 指数增强策略自2017年以来表现优异,但本年度部分策略出现负超额收益;
  • 市值和行业风险暴露控制是策略设计重要限制条件;

- 交易成本对收益影响显著。

报告综合了深度学习模型在时间序列金融数据上的应用效果,并通过实证策略展示其加强指数选股能力的潜力,目标在于为量化投资提供新型因子和策略框架参考。[page::0]

---

二、逐节深度解读



2.1 模型架构与训练流程


  • 模型选择: 报告选用GRU(门控循环单元)和TCN(时序卷积网络)。GRU属于简化版RNN,以效率高、计算量小著称,适合时间序列数据预测;TCN基于卷积神经网络架构,利用因果卷积、扩张卷积及残差连接捕获长期依赖。

- 输入特征和标签:
- 输入数据为不同粒度的行情数据:30日行情、60日行情、30周行情,包括6个特征维度(最高价、高开、最低价、收盘价、均价、换手率)。
- 预测标签为未来5日及10日均价涨跌幅,即5日均涨跌幅覆盖${t+1}$至${t+6}$,10日均涨跌幅为${t+1}$至${t+11}$。
  • 训练过程及验证:

- 采用滚动训练机制,2017年起每年训练一套模型,用前9年做训练集,第10年数据做验证集;
- 损失函数设计为预测值与实际收益率相关系数的负数,追求模型输出与收益率高度正相关。
  • 模型对比: 测试了单模型(GRU、TCN)及组合模型(TCN+GRU)性能,发现GRU表现最佳,组合模型次之,TCN性能相对较弱。


以上设计体现了对时序金融数据捕捉长期短期依赖的技术手段与实际效果检验,确保模型在真实市场条件下有较强的预测能力。[page::0]

2.2 单因子选股效果


  • 市场分层表现:

- 多头组合在中小市值股票池(中证1000、中证2000)中取得更高的超额收益,说明模型对中小盘股的选股能力更强、更有效;
- 沪深300中,未经市值行业中性化处理的因子表现优于做了中性化的版本,这暗示深度学习因子可能捕捉到某些行业风格或市值相关的轮动规律。
  • 市值行业中性化的影响:

- 中性化后因子超额收益明显下降,说明部分收益来源于风格轮动和行业轮动因素;
- 深度因子在统计上与行业、市值因素有交叉影响,处理后收益减少。
  • 模型表现:

- GRU略优于TCN+GRU组合,后者又略优于单纯TCN模型;
- 预测10日收益的模型超额收益略高于预测5日收益的模型。

此节揭示了深度学习因子的单因子效应,其与传统风格因子的相关性及市场结构中的不同表现,提供了对策略设计和风险管理的重要启发。[page::0]

2.3 复合因子选股效果与指数增强策略构建


  • 因子相关性分析:

- 深度学习因子主要与低波动、低流动性因子高度相关,部分与反转因子相关;
- 与高频因子、快照因子及基本面因子相关性偏低,显示该深度因子捕捉的市场结构不同于传统高频或基本面属性。
  • 复合因子优势:

- 采用等权加权后,复合因子在选股效果上优于单一因子,体现多因子叠加带来稳定超额收益。
  • 增强策略参数与收益表现:

- 策略设定条件:成分股不少于80%,单边换手率不超过20%,严格控制市值与行业暴露(无暴露或允许轻微暴露),
- 指标统计:
- 无暴露条件下(2017年以来):
- 沪深300增强策略年化超额收益11.8%,最大回撤-6.0%;本年超额为负-0.4%;
- 中证500增强年化超额13.6%,本年超额2.7%;
- 中证1000增强年化超额21.7%,本年超额9.9%;
- 中证2000增强年化超额27.1%,本年超额9.3%,表现最佳。
- 允许适当暴露条件下,年化超额略有下降(沪深300降至8.8%),回撤幅度增大。
  • 交易成本影响:

- 设定交易费用为双边0.3%时,每年收益大约减少3%,是策略实际收益的明显拖累因素。

总结来看,报告表明深度学习因子结合严格风险约束,通过指数增强策略,能够在多个股票池实现显著的历史超额收益,尤其是中小市值市场,且复合因子方法优于单一因子方案。[page::0]

---

三、图表深度解读



报告摘录内容暂未提供具体数值图表,但从文字描述中推断出以下图表及其分析:
  1. 年度超额收益与最大回撤图表

- 应展示了多个指数增强策略(沪深300、中证500、中证1000、中证2000)各年度和累计的超额收益以及最大回撤。
- 通过图表能明显看出,中证2000增强策略以27.1%的年化超额收益领先,风险(回撤)维持在合理水平内,各指数规模越小收益越优,回撤相对控制良好。
- 本年表现图表反映部分指数(如沪深300)存在负超额收益,提示短期策略表现波动性需关注。
  1. 模型比较性能图表

- 可能展示GRU、TCN+GRU、TCN三种模型在不同预测期限(5日、10日)下的超额收益表现。
- 应体现GRU略优于组合模型、组合模型略优于单TCN的层级关系,10日预测模型优于5日预测模型。
  1. 因子相关性分析热力图或相关系数矩阵

- 对深度学习因子与传统低波动、流动性、反转、高频、基本面因子的相关性定量展示。
- 支持文本中复合因子构建的理论基础,表明深度学习因子与部分传统因子高度相关、但与其他类型因子相关较弱。

上述图表为理解模型性能差异、策略风险收益特征及因子属性提供了关键视觉支持,强化了文本论点的说服力。[page::0]

---

四、估值分析



本报告并未涉及具体的公司估值分析或财务估计,而重点在于量化模型与因子选股策略的性能研究。所用模型与策略的“估值”对应为:
  • 因子表现估计与超额收益测算:通过历史数据计算算法产生的因子在沪深各指数的选股超额收益率。

- 风险调整及回撤控制:最大回撤等指标量化策略风险。
  • 交易成本内含估算:以双边0.3%交易费假设测算实际策略收益调整。


没有涉及DCF、P/E或其他传统估值变量。[page::0]

---

五、风险因素评估


  • 历史数据依赖风险:模型建立基于历史数据,承认历史规律存在失效风险,即未来市场环境若发生结构性变化,模型可能失效。

- 模型过拟合与泛化能力问题:虽未明说,但深度学习模型固有风险之一为过度拟合历史特征,导致实际预测能力下降。
  • 策略波动性与短期负超额可能:本年部分策略出现超额收益为负,反映短期策略表现不确定性。

- 交易成本影响显著:交易费用降低策略净收益,尤其对于高频操作明显影响业绩。
  • 风险控制约束可能减少收益:严格中性化约束降低了部分因子超额收益,柔性暴露控制能提升收益却增加波动风险。


报告未详细披露具体缓解措施,但通过参数设定(如控制换手率、行业市值暴露)间接体现风险管理思路。[page::0][page::1]

---

六、批判性视角与细微差别


  • 模型选择偏好与效果暗示: 报告确认GRU模型效果略优,但“略优”用语表明差距不大,可能受数据集、参数调优及训练周期影响;未提供模型参数细节,造成复制与验证不足。

- 因子中性化处理影响显著,提示因子可能混杂多重市场风格,报告未深挖这可能对策略稳定性和因子长期有效性带来的影响。
  • 年度超额收益的波动尤其是今年负收益,提示策略在不同市场周期表现不均衡,风险提示中提及“历史规律存失效风险”但缺少量化风险概率或专门测试。

- 交易费用假设较为简单,0.3%双边或许对某些中小盘股不适用,实际执行风险与市场冲击成本未深入探讨。
  • 策略回撤控制效果与增加收益间权衡细节没展开,尤其允许适当暴露后回撤升高,是否导致风险加剧值得进一步审慎分析。[page::0]


---

七、结论性综合



本报告系统地评估了基于深度学习模型(GRU与TCN)训练的选股因子的有效性及其在沪深各级指数上的增强策略表现。主要发现包括:
  • 模型表现: GRU模型以其预测准确度和训练效率优势,略优于TCN及组合模型,且10日收益预测优于5日,揭示了适当的预测窗口对模型效果关键性。

- 选股效能: 单因子选股中,小市值市场(中证1000、2000)收益表现优异,强化了深度因子在中小盘股池的应用优势。因子中性化处理减少收益,反映出深度因子部分捕捉了行业与风格轮动信息。
  • 复合因子优势与指数增强策略: 结合低波动、低流动性因子形成复合因子,效果明显优于单一因子。设计严格控制市值行业暴露的指数增强策略,自2017年以来年化超额收益显著,部分小盘指数增强策略年化超额超过20%。

- 风险与成本考虑: 报告充分识别了历史规律失效风险及交易费用对策略的实际影响,保持了战略实施的现实可行性视角。
  • 总结性评价: 报告以严谨的训练和验证流程,结合多维度因子测试和实盘策略模拟,展现出深度学习技术在量化投资因子创新中的前沿价值。报告建议关注模型预测窗口和因子组合优化,同时注意历史规律依赖和成本风险,推广时须结合实际交易环境审慎调整。


整体来看,报告为金融工程与量化策略领域引入深度学习模型提供了切实可行的实证研究,显示了其在市场超额收益挖掘中的潜力与局限,具有重要的参考价值。[page::0][page::1]

---

参考图片示例



国泰海通证券研究所官方公众号二维码

---

备注:以上分析基于报告内容严格提取和解读,兼顾金融专业视角与策略逻辑完整性,旨在为读者提供系统清晰、信息充分、结构严谨的深度分析。

报告