`

选股因子系列研究(五十二)——基于回归树的因子择时模型

创建于 更新于

摘要

本文基于回归树方法构建因子择时模型,突破传统线性相关假设,提升因子择时的灵活性与直观性。通过市值因子案例,采用近5年及10年数据构建回归树,发现市场波动率为关键择时变量,模型有效区分不同市场环境下因子表现。进一步引入衰减加权改进模型对近期数据的响应,提高拟合度。在因子方向性择时中,回归树模型能减少因子转向时损失,但在高收益动量阶段表现劣于长期持有。结合防御性因子择时思想,即在不确定时关闭因子敞口,实现稳健择时,回测显示该方法在提升组合稳定性的同时优化了部分年份表现。最终,防御性择时策略应用于多因子权重配置,年化收益略降但增强抗风险能力,尤其在2017年收益表现显著改善。报告指出未来可通过集成学习进一步提升模型稳健性 [page::0][page::4][page::5][page::7][page::8][page::9][page::10][page::11][page::12][page::13]。

速读内容

  • 采用回归树模型构建因子择时,放松因子收益与择时变量线性相关假设,将市场环境划分为不同情景,辅助预测因子未来收益表现 [page::0][page::4]。

  • 回归树以市值因子为例,用近5年与10年数据发现,市场对数波动率是主要择时指标,高波动市场小盘效应更显著,低波动市场大盘效应明显,表现为:


| 数据区间 | 市值因子月均溢价(高波动) | 市值因子月均溢价(低波动) |
|----------|-----------------------------|-----------------------------|
| 近5年 | 1.1% | -1.4% |
| 近10年 | 0.8% | -1.4% |




- 净值曲线显示高波市场下市值因子表现优异,低波市场大盘表现突出 [page::6]。
  • 引入衰减加权回归树后,择时模型更关注近期数据,选取不同的择时变量组合,如期限利差变化和信用利差,进一步增强模型拟合能力:

- 高波环境下期限利差变化划分市场,宽幅扩大时小盘效应高达2.4%,低幅扩大时0.6%;
- 低波环境下信用利差指示,小盘效应收益介于-1.1%至0.7%。


[page::7]
  • 回归树因子择时模型与长期持有组合对比,择时模型灵活降低回撤,但在市值因子强势年份(2015、2016年)收益不及持有。


| 模型名称 | 2013 | 2014 | 2015 | 2016 | 2017 | 2018 | 截至2019年7月 |
|---------------------|--------|--------|---------|--------|---------|--------|---------------|
| 长期持有 | 0.69% | 0.41% | 2.11% | 0.61% | -1.09% | 0.11% | 0.10% |
| 回归树因子择时组合 | 0.69% | 0.41% | 0.97% | 0.05% | -0.19% | -0.30% | 0.37% |
| 衰减回归树因子择时组合 | 0.69% | 0.41% | 0.64% | 0.34% | 0.26% | 0.11% | 0.67% |

[page::8][page::9]
  • 引入防御性因子择时的策略思路:当回归树择时模型与因子收益动量模型预测收益方向不一致时,关闭因子敞口,避免承担风险,实现稳健择时。

- 防御性因子择时模型在多因子方向性择时中的应用,带来更稳定组合表现,尤其在2017年因子回撤阶段净值曲线明显平滑。



  • 多因子防御性择时模型在多个因子上均表现出稳健性提升,部分年份收益改进,具体以市值因子为例:


| 年度 | 12个月动量预测 | 防御性因子择时 | 衰减防御性因子择时 | 24个月动量预测 | 防御性因子择时 | 衰减防御性因子择时 |
|---------------|----------------|----------------|---------------------|----------------|----------------|---------------------|
| 2013 | 0.69% | 0.69% | 0.69% | 0.69% | 0.69% | 0.69% |
| 2015 | 2.11% | 1.54% | 1.37% | 2.11% | 1.54% | 1.37% |
| 2017 | 0.30% | 0.05% | 0.28% | -0.81% | -0.50% | -0.28% |

防御性模型减少损失但年化收益略低于动量模型 [page::10]
  • 防御性因子择时策略运用于多因子权重配置,纳入市值、中盘、换手率、反转、波动、估值、盈利、盈利成长因子构建最大收益预期组合,结果显示:

- 叠加防御性因子择时后,组合年化收益降低,但2017年等关键年份表现明显提升,增强了投资组合的风险调整表现。



| 年度 | 12个月动量 | 防御性择时 | 衰减防御性择时 | 24个月动量 | 防御性择时 | 衰减防御性择时 |
|---------------|------------|------------|-----------------|------------|------------|-----------------|
| 2013 | 33.3% | 37.5% | 31.8% | 44.9% | 34.3% | 27.7% |
| 2015 | 144.3% | 127.3% | 130.8% | 156.2% | 135.0% | 129.9% |
| 2017 | -1.8% | 4.5% | 8.7% | -21.4% | -10.0% | -1.2% |

[page::11][page::12]
  • 投资建议与风险提示:

- 回归树因子择时提供直观有效的择时规则,通过衰减加权和防御性择时结合,提升了模型对市场变化的适应性和稳定性。
- 模型先进性突出,但回归树稳健性不足,推荐结合集成学习(如平均法或提升法)进一步提升模型表现和抗风险能力。
- 需关注市场系统性风险、资产流动性风险及政策变动风险对策略表现的影响 [page::0][page::13].

深度阅读

《选股因子系列研究(五十二)——基于回归树的因子择时模型》深度分析报告



---

1. 元数据与报告概览


  • 报告标题: 《选股因子系列研究(五十二)——基于回归树的因子择时模型》

- 发布日期: 2019年7月19日
  • 分析师: 冯佳睿、袁林青(均为海通证券金融工程研究团队成员)

- 发布机构: 海通证券股份有限公司研究所
  • 研究主题: 围绕因子投资领域,重点研究基于机器学习中回归树模型的因子择时技术,聚焦“消费”及“基金行业”等多个板块的因子组合策略,提出了改进的择时框架,融合传统动量模型与防御性因子择时思路。


核心论点与目标



报告继承了系列专题关于因子择时的研究基础,突破以往对因子择时变量与因子收益线性相关的假设,引入机器学习中的回归树算法,以非线性和情境划分的方式建立因子择时模型,旨在辅助投资者更精准地在不同市场环境下调整因子暴露。

报告强调:
  • 回归树模型能较好地截取不同市场环境对应的因子收益表现,提供直观的择时规则;

- 将回归树因子择时与传统因子收益动量模型结合,发挥两者优点,规避单一模型局限;
  • 推出了防御性因子择时方法,即在收益方向不确定时减少因子敞口,提升稳健性和组合表现;

- 最后,结合多因子权重分配策略,实现灵活且稳健的因子投资组合管理。

整体观点为:单纯抛弃传统动量择时不足为取,应结合回归树模型及防御性策略,以实现因子择时的效率和风险控制。

---

2. 逐节深度解读



2.1 决策树与因子择时(第1章)


  • 关键论点:

传统因子择时模型假设因子收益与择时变量之间存在线性关系,但实证追踪显示该假设不完全成立。为此,报告提出采用情景化择时思路,即认为因子在不同市场环境(基于择时变量划定)下表现不同,通过决策树模型非参数地识别因子收益的非线性、分段表现。
  • 方法论与技术说明:

决策树(包含分类树和回归树)在因子择时中用于将历史样本基于择时变量分群并统计因子收益以辅助预测。报告采用CART算法构建回归树,并使用时间序列交叉验证优化超参数,确保模型稳定性和泛化能力。
  • 择时变量库:

1) 债市指标(如利率水平、期限利差和信用利差及其变动);
2) 股市指标(如涨跌、波动、流动性和风险偏好);
3) 因子拥挤指标(估值价差、长期因子收益、波动率等),这些选择不仅涵盖宏观环境,也兼顾因子面内动态。
  • 因子收益定义:

以带约束的市值加权线性回归计算得到月度因子溢价(回归截面收益,约束确保行业间超额收益为零),可更换指标如IC等,提高灵活性。

---

2.2 单因子择时回归树(第2章)



报告以市值因子作为示范,构建并分析基于5年及10年数据的回归树模型:
  • 回归树结构与规则解释:

- 市值因子收益以1单位小市值敞口的溢价表示,正值代表小盘效应明显。
- 5年数据模型(图1)显示对数市场波动率是关键划分变量:
- 对数波动高于-2.06时,市值因子月均溢价为1.1%,明显利好小盘股;
- 低于-2.06时,因子收益为-1.4%,指示大盘效应。
- 10年数据模型显示相似趋势,平均溢价有所提升,高波动时小盘效应更明显。
  • 净值走势图(图2、图4):

展示了不同波动率环境下市值因子的净值表现,蓝线是因子净值,红线波动率,绿色阴影标示高波动期,灰色为低波动。高波动期间净值表现优异,验证树模型划分的合理性。
  • 引入衰减加权特性(2.2节,图5-6):

- 最新数据权重更大,提升模型对近期市场逻辑的捕捉能力。
- 择时决策不再局限于波动率,信用利差和期限利差变化成为后续划分关键指标。
- 观察得出,在高波动与利差扩大时,小盘收益率最高(可达2.4%),而在低波低信用利差时,大盘效应显著。
  • 本章总结(2.3节):

回归树模型简单直观,识别关键市场状态变量,有助于情境下因子择时,且模型可扩展到带衰减加权,增强对近期数据拟合度。

---

2.3 因子方向性择时(第3章)


  • 模型构建流程:

- 每月基于过去5年数据训练回归树并预测因子未来收益。
- 根据信号方向决定因子暴露(+1或-1)。
  • 历史表现(图7与表1):

- 与长期持有相比,回归树择时组合在因子转向期(2017年)回撤较小,但在因子表现强势期(2015-2016)收益较弱。
- 说明回归树择时具灵活性但牺牲部分动量收益。
  • 防御性因子择时提出(3.2节):

- 意图解决择时模型频繁交易和收益损失问题,特别是在收益方向不确定时关闭因子敞口,避免承担无法预测的风险。
- 采用“双模型一致性”原则,即动量模型与回归树模型信号一致时才暴露敞口,否则置零。
  • 实证结果(图8-9与表2-6):

- 防御性模型提高了稳定性,减少了大幅回撤。
- 在2017年市场动荡期表现明显优于单一模型。
- 对多因子进行了测试(换手率、反转、系统波动占比、盈利因子等),普遍验证了防御性模型的稳健改进作用。
  • 小结(3.3节):

回归树择时虽然灵活但单独使用存在收益波动风险。防御性择时通过结合传统动量,优化风险收益权衡,更适合实务应用。

---

2.4 多因子模型回测(第4章)


  • 权重分配思想:

传统因子权重依据收益预测幅度分配。引入防御性因子择时,通过判断收益预测方向一致性,调整因子最终收益预测,实现对风险敞口的灵活控制。
  • 组合构建:

使用市值、中盘、换手率、反转、波动、估值、盈利、盈利成长等因子,构建TOP100最大化收益预期组合。
  • 回测结果(图10-11,表7):

- 防御性因子择时组合相较纯动量组合,整体年化收益略有下降,但部分年份(尤其2017年)表现显著改善,体现更高稳健性。
- 组合相对中证500指数超额收益增加,尤其在市场波动剧烈年份有风险控制优势。

---

2.5 总结与展望(第5章)


  • 解除因子收益与择时变量线性关联假设,因子择时从情景分析视角切入。

- 回归树模型适用性强,可筛选关键择时变量,实现市场环境划分及规则制定。
  • 回归树因子择时既可用于方向预测,也可结合动量构建防御性择时模式,提高策略稳健性。

- 回归树模型对因子权重分配同样有效,通过防御性框架改善组合风险收益配置。
  • 未来可继续提升模型稳健性,例如引入集成学习方法(Averaging和Boosting)优化回归树。


---

2.6 风险提示(第6章)


  • 市场系统性风险:整体市场波动、宏观经济波动对择时效果有影响。

- 资产流动性风险:部分因子对应资产流动性不足时策略风险增加。
  • 政策变动风险:政策调整可能导致市场结构性变化,影响模型表现。


---

3. 图表深度解读


  • 图1 & 图3(市值因子择时回归树)

展示基于5年和10年数据的市值因子回归树结构。主节点均是“对数市场波动率(6个月)”,划分阈值约为-2.06。高于阈值对应积极的小盘效应(月均收益正1.1%、0.8%),低于阈值对应逆势表现(负收益-1.4%),说明波动率是判断因子表现的有效筛选指标。
该树结构简单且富解释力,便于投资者理解和应用。


  • 图2 & 图4(市值因子净值走势与环境划分)

结合对数波动率划定不同时间段的高低波动期(绿色为高波动,灰色为低波动),蓝线显示因子净值走势,红线为波动率指标,图表明显呈现高波动时期因子表现优异,验证回归树分群效果。


  • 图5(衰减加权回归树)

引入近期数据加权后,回归树拓展为多层结构,第一层仍是市场波动,后续层分别为信用利差和期限利差的变化,显示多维择时变量的递进判定,提高择时精细度。收益幅度从-1.1%到2.4%,显示市场环境多样性和因子反应差异。

  • 图6(净值走势与环境划分,衰减模型)

净值走势与不同环境颜色对应,显示更细致的市场环境刻画,净值走势在颜色变化区域内波动性较大,体现模型对近期市场变化的适应。

  • 图7(长期持有与择时组合比较)

三个组合净值走势图表,长期持有组合波动大但累计收益最高,回归树组合波动低但收益稍逊,衰减回归树则介于二者之间。图示说明因子择时的风险收益权衡问题。

  • 图8 & 图9(防御性因子择时模型)

显示防御性模式相比单纯因子收益动量组合更为平滑,尤其在2017年市场调整期表现突出,展示防御性择时模型对尾部风险的控制能力。


  • 图10 & 图11(多因子策略表现,与中证500超额收益)

防御性因子择时组合相较纯动量型组合波动较低,2017年表现改善,整体累计收益仍具竞争力,验证策略的实际适用性。



---

4. 估值分析



报告未涉及具体标的公司的估值,而是聚焦于因子择时模型自身的构建与组合表现回测,属于策略研究范畴。其“估值”部分主要是基于因子收益预测,用线性回归方法算出因子月度溢价,且应用于组合权重分配中。

模型中使用的计算方法:
  • 约束的线性市值加权回归计算因子收益溢价;

- 基于回归树划分的市场情景,进行非线性收益预测;
  • 通过结合动量模型与防御性择时策略动态调整组合权重。


---

5. 风险因素评估



报告重点提示:
  • 市场系统性风险: 宏观经济和市场整体波动可能导致因子择时失效,尤其在极端行情或不可预见变故时。

- 资产流动性风险: 流动性不足可能迫使因子择时模型操作受限,影响策略执行效率和成本。
  • 政策变动风险: 监管政策变化可能导致市场结构快速调整,破坏因子历史表现规律,风险难以提前量化。


报告未详细提出缓解措施,但多处强调防御性因子择时旨在降低不确定环境下的风险敞口,间接体现了风险管理思路。

---

6. 审慎视角与细微差别


  • 偏见与假设局限:

- 报告基于历史数据拟合回归树,假定未来市场环境与历史有一定相似,可能低估非平稳风险。
- 衰减加权虽然强化近期信号,但模型结构仍依赖于历史择时变量的选择,若未来环境中关键变量变化,模型适用性待检验。
- 防御性因子择时模型选择一致性作为暴露判断标准,有可能在极端市场中错过反转机会。
  • 内部一致性与潜在矛盾:

- 报告强调“放弃动量完全转向回归树不可行”,体现了对单一方法的限制认可,逻辑自洽。
- 多因子回测证实了防御性择时组合在局部年份盈利能力变差(年化收益略低于动量组合),与报告提出稳健性换取收益的观点相符。
- 风险提示简单,没有深入风险缓释手段,后续研究可考虑丰富。
  • 模型拓展空间:

- 提到集成学习(如Boosting)提升稳健性,暗示当前单棵回归树模型仍有改进空间。
- 报告尚无宏观因子择时与个股层面择时结合的联动分析,未来可进一步展开。

---

7. 结论性综合



本报告以机器学习回归树为核心工具,创新性地破解了传统因子择时对择时变量与因子收益线性关系的刚性假定,使因子择时更加贴近实际市场非线性环境表现。通过市值因子案例清晰展示了以市场波动率、利差等为划分因子的择时规则,且引入衰减加权后提升了模型对近期市场环境的适应力。

回归树因子择时模型不仅实现环境划分的直观规则提取,也可转化成实用的方向预测工具。回测结果揭示该模型在市场因子表现转折时有效规避部分损失,但动量强劲阶段萎缩收益,限制了单一模式的运用。因此,报告创新性地融合防御性因子择时理念,通过双模型方向一致性判断降低不确定风险,明显改善了选择性敞口的稳健性,特别是在2017年调整期内表现卓越。

防御性因子择时被进一步扩展至因子权重分配体系,在多因子组合回测中表现出稳健与灵活兼备的风险收益平衡,尽管全周期年化收益略低于纯动量模型,但在波动较大的年份显著提升了收益表现。

整体来看,报告清晰阐述了回归树模型在因子择时领域的应用价值与局限,强调结合多模型与稳健防御是未来因子择时的重要发展方向。报告所用大量实证图表和年度收益对比,直观地揭示模型性能和策略预期,具备较强的实操指导意义。

---

主要图表与数据洞察:


  • 回归树择时变量以市场波动率为首要划分节点,梯度收益明显区分大盘/小盘效应。

- 衰减加权回归树引入期限利差、信用利差,增强环境划分细致性,提升近期预测准确性。
  • 防御性因子择时组合继承了传统动量策略的优势,同时显著降低了因子转折期的大幅回撤风险。

- 多因子组合实测显示策略在实盘环境有望优化风险调整后收益,尤其适合波动市场中资产配置。

报告结论有效辅助投资者在因子投资中实现灵活择时、风险对冲并优化组合表现,为因子模型的改进和量化选股策略提供了创新路径和技术参考。[page::0,4-13]

---

参考文献与图表索引


  • 图1-6:因子择时回归树模型与净值走势

- 图7:因子方向性择时组合与长期持有比较
  • 图8-9:防御性因子择时组合净值走势

- 图10-11:多因子防御性择时组合与因子收益动量组合对比
  • 表1-7:年度收益详细对比,包括不同因子和模型间的表现差异分析


---

以上为海通证券研究所发布的《基于回归树的因子择时模型》报告的全面详细解析。通过逐节深入剖析模型构建、数据图表解读、风险分析与策略回测,报告展现了因子择时领域中机器学习方法的应用潜力与实践启示,对国内外量化投资者具有重要参考价值。

报告