`

构建高收益高胜率基金组合:量化选基因子体系初探(上)

创建于 更新于

摘要

本报告基于中国公募基金市场,系统构建并测试了基金特征因子、净值因子及持仓因子共34个量化指标的预测能力。研究发现,净值因子中的波动率、业绩基准超额收益及信息比率因子表现相对较好,尤其经过信息系数(IC)或因子收益调整后效果明显提升,波动率因子多空组合年化收益率最高达7.40%,IC达0.149。此外,持仓因子中衡量基金经理主动性的收益差距与主动性份额因子表现突出,调整后多空收益率均突破5%。本文还强调因子表现存在周期性波动,采用因子方向调整提升了因子稳健性,为量化构建高收益高胜率基金组合奠定基础 [page::0][page::1][page::4][page::5][page::10][page::11][page::17]

速读内容

  • 研究样本及因子调整[page::1]:

- 以主动偏股型基金为样本,2015-2025年进行实证;
- 统一调仓日设为每年4月及9月首个交易日,避免未来函数;
- 采用信息系数(IC)调整和因子收益调整两种方法改善因子方向的不稳定性。
  • 基金特征因子的表现及特征[page::2][page::4]:

| 因子 | 多空组合年化收益率(原始) | IC值(原始) | 调整后表现 | 备注 |
|---------|-----------------------|------------|------------|------|
| 存续时间(Age) | 1.64% | 0.032 | 调整后下降至约0.1% | 预测能力弱 |
| 规模(Size) | 1.61% | 0.053 | 调整后收益下降 | 管理规模小略优 |
| 资金流(Flow) | 0.38% | 0.002 | 表现不佳,无明显多空收益 | 无效因子 |
| 换手率(TO) | 0.50% | 0.007 | 无明显提升 | 无效因子 |
| 超额换手率(STO) | -1.48% | -0.019 | 调整后差异减小 | 低换手率基金表现稍好 |

- 总结:基金特征因子整体预测能力有限,规模因子较稳定,其他波动较大。
  • 净值因子(RBPs)效果突出因子[page::5][page::6][page::7][page::8][page::9][page::10]:

- 主要因子包括波动率(6M和12M)、收益率(6M/12M)、CAPM模型Alpha、四因子模型Alpha、相对业绩基准的超额收益(BMEXR)、跟踪误差(BMTE)、信息比率(BMIR)等;
- 经过IC或因子收益调整,波动率因子多空组合年化收益率显著提升至7.29%-7.40%,IC高达0.149;
- 相对业绩基准的超额收益和信息比率因子维持多空组合接近4%的年化收益;



  • 持仓因子(HBPs)及基金经理主动性因子优异表现[page::11][page::12][page::13][page::16][page::17]:

- 主动性因子包括收益差距(RG)、主动性份额(AS)、主动性权重(AW)、行业集中度指数(ICI)、风险偏移指标(RS)、GT业绩指标(GT),等性能指标;
- RG因子未经调整多空组合年化收益率达5.09%,调整后仍保持高收益;
- AS因子表现强劲,特别经过因子收益调整后多空收益率达5.83%;
| 因子 | 原始多空收益率 | IC调整多空收益率 | 因子收益调整多空收益率 | IC(调整后) |
|-------|----------------|-----------------|------------------------|-------------|
| RG | 5.09% | 4.49% | 4.26% | 0.058 |
| AS | 4.91% | 4.36% | 5.83% | 0.102 |
| AW | 3.14% | 1.64% | 1.88% | 0.013 |
| ICI | 2.70% | 0.56% | 5.53% | 0.067 |
  • 业绩拆解类持仓因子表现稍弱,但风格选股能力(CS)、择时能力指数(TSI)经IC调整后有一定收益表现[page::14][page::15]:

- CS因子调整后多空组合收益率4.17%,TSI调整后5.84%,表明选股与择时能力调整有助提升因子效果。
  • 量化策略核心思想及调整逻辑[page::0][page::1][page::17]:

- 因子预测能力不稳定,因而采用历史IC值或因子收益做平滑调整,以修正因子方向,提升策略稳定性;
- 多数情况下,调整后因子表现更佳,例如波动率和跟踪误差类因子。
  • 风险提示及数据说明[page::0][page::1][page::17][page::18]:

- 模型失效风险、市场风格变化风险以及数据测算误差风控;
- 报告基于历史公开数据,投资需注意模型和市场环境变化。

深度阅读

构建高收益高胜率基金组合:量化选基因子体系初探(上)—详细分析报告



---

1. 元数据与概览


  • 报告标题:《构建高收益高胜率基金组合:量化选基因子体系初探(上)》

- 作者/发布机构:西部量化团队,西部证券研究发展中心
  • 发布日期:2025年5月12日对外发布,公众号推送版为2025年5月13日

- 研究主题:本报告聚焦于中国公募主动偏股型基金市场,系统构建并测试了量化选基因子体系。主要涉及基金特征因子、基于净值的因子(Return-Based Predictors, RBPs)及基于持仓的因子(Holding-Based Predictors,HBPs),以预测基金未来业绩表现,发现高胜率和高收益的基金筛选策略。

核心观点与亮点


  • 构建5个基金特征因子、18个净值因子(RBPs)和11个持仓因子(HBPs)。其中净值类中Alpha和超额收益类因子,以及持仓因子中的收益差距和主动性份额,展示出较强的未来基金业绩预测能力。

- 基金因子的预测稳定性较低。通过历史信息系数(IC)或因子收益的调整对因子方向进行校正,有效提升部分因子的表现。
  • 净值因子(如波动率、超额收益、信息比率)和持仓中的主动性因子(收益差距、主动性份额)表现优异,分别实现7%以上和5%以上的年化多空收益率,体现较强的选基价值。


---

2. 基金数据样本与因子调整方法



2.1 样本选择


  • 研究聚焦主动偏股型基金,搜集股票型、偏股混合型、平衡配置型和灵活配置型开放式基金数据,剔除股票仓位低于60%及不流动封闭基金。

- 分析以主基金份额为核心,回测时间为2015年1月1日至2025年3月7日,调仓定于每年4月和9月首个交易日,保证使用最新公开的年报及半年报持仓信息,防止未来数据泄露。

2.2 因子调整方法


  • 信息系数(IC)调整:计算半年期换仓IC时间序列,取近两期均值进行平滑。用最新因子值乘以平滑后的IC,方向可自动调整(IC为负时因子排序反向)。

- 因子收益调整:基于回归模型计算因子收益(基金收益对因子值回归系数),同样进行双期平滑后调整因子方向。
  • IC调整和因子收益调整在多数情况下一致,但由于平滑可能导致差异,二者对因子表现改善均有贡献。


---

3. 基金特征因子分析(5个因子)



| 因子名称 | 计算方法及含义 | 表现概述 |
|---------------|----------------------------------|----------------------------|
| 存续时间(Age) | 基金存续月数的相反数,反映短期存续基金可能更优 | 多空组合收益1.64%,调整后效果弱(不到0.5%);预测力弱,平均IC约0.03 |
| 规模(Size) | 基金资产净值的相反数,反映小规模基金更有优势 | 多空收益1.61%,IC约0.05,调整后效果减弱 |
| 资金流(Flow) | 净买入额与前期资产比,衡量资金流向 | 多空收益弱,约0.4%,无明显预测能力,IC接近0 |
| 换手率(TO) | 报告期大买入或卖出成本额与持股均值比,反映交易频率 | 多空收益低至0.5%,调整后表现不佳 |
| 超额换手率(STO) | 超过历史平均换手的标准化度量,反映活跃交易 | 负多空收益(-1.48%),活动越大反而收益越差,调整后改善不足 |
  • 总结:基金特征因子预测效果较弱,且非常不稳定。图1显示基金规模因子收益较稳,但其他因子收益波动明显,反映市场风格与基金行为时变。因子收益和IC均偏低(表6),提示该类型因子参考价值有限。[page::2,4]


---

4. 基金净值因子分析(18个Returns-Based Predictors)



重点关注基于日收益率、回归模型和基准比较的因子,涵盖波动率、收益率、Alpha、多因子Alpha等。

4.1 波动率因子(Vol-6M与12M)


  • 设计初衷:根据低波动异象,低波动基金未来表现更好,因子值取相反数。

- 表现
- 原始因子多空收益负值(-4%左右),显出错误方向;
- IC调整后收益转正,6M 3.44%、12M 5.58%;
- 因子收益调整后更优,6M 7.29%、12M 7.40%收益率,IC提升至0.15,显著改进预测力。
  • 图2展示因子收益周期波动明显,验证调整必要性。[page::5]


4.2 收益率因子(Return-6M与12M)


  • 原始因子呈现正多空收益约2.5%,反映业绩持续性;

- IC和因子收益调整后大幅缩水,变成负收益,表明短期历史收益可能因市场变化而失效。

4.3 CAPM与四因子模型Alpha(CAPM和FFC4)


  • 多空组合年化收益区间在2%~4%;

- 四因子Alpha优于CAPM模型Alpha;
  • 经过IC或收益调整,CAPM-6M Alpha表现提升明显(4.42%),但其他时长表现不稳定;

- 四因子Alpha调整后表现一般,无显著提升。

4.4 四因子模型Alpha的t值及R2


  • Alpha的t值因子经过调整后多空收益在1.5%-2.5%范围;

- 四因子模型拟合的R2反转因子(R2越小越好)调整后收益提升明显,多空收益超过3%,IC约0.04;
  • 指示基金私有信息(非系统风险定价部分)可能带来超额收益。


4.5 相对业绩基准超额收益(BMEXR)、跟踪误差(BMTE)、信息比率(BMIR)


  • BMEXR原始因子多空收益3.3%-3.5%,IC约0.10,表现优于多个指标;

- 跟踪误差经过调整多空收益提升至3-4%区间,IC近0.1;
  • 信息比率多空收益约3.4%-3.9%,表现稳健;

- 统计结果与业绩基准比较指标揭示,基金相对基准的超额表现和稳定性是强预测因子。

4.6 小结



波动率和跟踪误差类因子均存在显著的动量特征,经过IC或收益调整提升明显。收益类因子如业绩基准超额收益和信息比率表现稳定,体现公募基金具备一定的业绩持续性和可预测性。整体来看,净值因子表现优于基金特征因子,IC水平往往达到0.1以上。[page::8-11]

---

5. 基金持仓因子分析(11个Holding-Based Predictors)



根据持仓数据,刻画基金经理交易行为及组合特征,考察主动性及风格因素。

5.1 重要主动性因子:



| 因子 | 描述及计算方式 | 2015-2025年多空收益表现及IC |
|---------------|--------------------------------------------------------------|-----------------------------------------------|
| 收益差距(RG) | 公式为实际收益减去买入持有收益,量化主动交易增值能力 | 多空收益5.09%,IC调整后仍达4.49%,IC约0.06 |
| 主动性份额(AS) | 测量基金持仓偏离市场权重的幅度 | 多空收益4.91%,因子收益调整后提升至5.83%,IC约0.10 |
| 主动性权重(AW) | 测量基金持仓偏离自己持仓加权组合的程度 | 多空收益3.14%,调整后下降,但仍为正 |

5.2 其他因子表现


  • 行业集中度指数(ICI):反映行业配置集中度,调整后收益率最高达到5.53%,IC约0.07。

- 风险偏移指标(RS):衡量基金持仓风险变动,表现为负收益,暗示风险飘移可能损害表现。
  • GT指标:描述基金仓位变化效应,多空收益约1.65%。

- 风格选股能力(CS)和择时能力(TSI):选股能力调整后多空收益4.17%,择时能力由负转正,调整后最高达5.84%。
  • 选股能力指数(PSI)表现不佳,调整后仍为负或低回报。

- 持仓久期(FD)表现弱,多空收益基本为正但微弱(不足1%)。

5.3 小结



持仓因子特别是衡量基金经理主动性的收益差距和主动性份额因子表现最为出色,均实现5%以上的年化多空策略收益,且具备较好稳定性(IC最大接近0.1)。行业集中度指数等因子调整后亦取得不俗成果。业绩拆解类因子表现不一,其中风格选股能力及择时能力经过IC调整后有效性显现。[page::12-17]

---

6. 图表深度解读



6.1 图1(基金特征因子因子收益时序)


  • 展示了5个基金特征因子(Age, Size, Flow, TO, STO)自2015年至2025年的因子收益变化。

- 规模(Size)因子呈现较为稳定的正收益,而其他因子波动剧烈,因子收益在正负之间切换,表明这些因子不能稳定预测基金收益。
  • 该图支持了报告中对基金特征因子有效性较弱的结论。[page::4]


6.2 图2(波动率因子6M累积收益)


  • 图示分为D1(低波动组)、D10(高波动组)、D1-D10多空组合及D1相对万得指数收益。

- 多空组合呈现周期性波动,2015-2018与2022-2024年间低波动组表现较好;2019-2021年高波动组优势明显。
  • 反映因子方向选择需动态调整,用IC调整修正因子方向可显著提升策略效果。[page::5]


6.3 图3-5(净值因子收益时间序列)


  • 图3-5分三部分分别展示18个净值因子时间序列,重点波动率和跟踪误差因子呈阶段性趋势变化明显,说明动态调整的重要性。

- 其中各类Alpha因子时序收益表现跳动较大,验证报告关于因子稳定性低的论断。
  • 净值因子动量与周期性特征较强,适合采用IC平滑调整。[page::10]


6.4 图6-7(持仓因子因子收益时间序列)


  • 图6体现5个主动性因子中收益差距(RG)、主动性份额(AS)表现多维度突出与稳定,呈现明确的正向因子收益。

- 图7则描绘6个业绩拆解因子,选股和择时能力经调整后有所提升,但整体波动较大,部分因子如风险飘移表现负面。
  • 进一步强调成熟的持仓因子在预测基金业绩中的优势。[page::16]


---

7. 估值分析



本报告并未涉及传统意义上的公司估值分析、估价模型(如DCF、市盈率等)或目标价预测。研究重点集中于基于历史数据构建基金因子模型,预测基金投资组合的未来表现,属于量化因子模型构建和检验范畴。

---

8. 风险因素评估



报告明确提出的风险主要包括:
  • 模型失效风险:因子模型基于历史数据构建,模型在未来市场环境和风格发生改变时可能失灵。

- 市场风格变化风险:基金表现及因子有效性受资产配置、市场风格轮替等影响较大。
  • 数据测算误差风险:所用基金净值及持仓数据来自第三方,存在数据披露不及时、误差及遗漏的可能,影响回测结果的准确性。


报告并未详细列明每个风险的发生概率及具体缓解措施,但通过因子收益和IC的动态调整,部分抵御了风格变化的影响。[page::1,17,18]

---

9. 审慎评析与细微差别


  • 报告在因子选择及调整方法上充分体现了对因子表现时变性的认识,采用IC与因子收益双重平滑调整,是提升策略稳定性的有效做法。

- 基金特征因子表现较弱,但报告未忽视其可能的周期性表现,体现谨慎态度。
  • 净值因子和持仓因子表现存在显著差异,其中持仓因子若无完整持仓数据可能难以监测,实际操作中数据可得性需关注。

- 风格选股和择时能力因子表现波动较大,部分结果呈现负收益,显示基金估值及预测复杂度高,模型假设可能简化实际行为。
  • 报告基于过往10年数据构建,受特殊年份投资环境影响不能完全排除偶发事件对结果的影响。

- 部分表格格式或数据标注存在一定混乱(如表25内少许数据错位),需关注数据整理的严谨性。

---

10. 结论性综合



本报告系统构建并检验了针对公募主动偏股型基金的量化选基因子体系,形成三大核心类因子群:基金特征因子、净值因子(RBPs)、持仓因子(HBPs)。主要发现和结论如下:
  1. 基金特征因子整体表现较弱,预测未来业绩能力有限,IC普遍低于0.05。基金规模因子相对较稳定,理论支持小规模基金优于大规模基金的现象,因子收益超1.6%。
  2. 净值因子表现优异,尤其是经过平滑的IC和因子收益调整之后,波动率因子表现突出,最高可实现超7%的年化多空收益率,IC达到0.15。相对业绩基准的超额收益(BMEXR)、跟踪误差(BMTE)和信息比率(BMIR)也是表现稳定的优质因子,反映基金相对基准的超额表现和稳定性是预测业绩的核心信号。
  3. 持仓因子中,衡量基金经理主动性的收益差距(RG)和主动性份额(AS)均具备很强的预测能力,年化多空收益均超过5%,且调整后表现更优。行业集中度指数(ICI)等因子也有不错提升,而综合业绩拆解因子(如风格选股能力CS、择时能力TSI)表现不稳定,需谨慎使用。
  4. 动态调整因子方向是提升因子稳定性的关键手段。IC调整和因子收益调整对多数因子均有显著提升效果,因子历史表现的时变性决定了任何简单的固定方向使用因子都面临较大风险,因子动态调整为策略持续超额收益提供保障。
  5. 风险因素主要包括模型失效、市场风格变化和数据误差,其中风格变化引发的因子有效性波动是最大挑战。因子调整机制是作者提出的主要缓解方法。
  6. 研究的实际意义在于为基金投资者建立量化筛选高胜率高收益基金组合提供了科学依据,重点在于利用多维度基金特征与持仓数据预测基金未来相对表现,较好地结合基金经理主动行为和基金业绩表现,推动公募基金量化定量分析发展。
  7. 图表与表格支持上述结论,例如波动率因子累计收益图证实周期性波动;持仓主动性因子收益波动图显示稳定超额收益期;多张表格数据精细呈现了各因子不同调整方式下的收益、风险及信息系数指标,充分体现量化因子分析的严谨性和细节深度。


---

总结



本报告通过详实的数据与严谨的回测框架,建立并验证了一套富有实际应用潜力的基金量化选基体系。基金净值因子中波动率和业绩基准相关指标,以及持仓因子中收益差距和主动性份额因子,成为预测基金未来表现的核心驱动力。因子稳定性不足的问题通过IC及因子收益调整得到一定缓解。风险提示和数据限制需投资者注意。该研究对于基金投资者尤其是量化基金经理和策略开发者,提供了有价值的参考框架和实施路径,推动了公募基金市场的科学投资和量化选基。

---

参考文献(部分)


  • Pástor, L., Stambaugh, R. F., & Taylor, L. A. (2015). Scale and skill in active management. Journal of Financial Economics, 116(1), 23-45.

- Carhart, M. M. (1997). On persistence in mutual fund performance. Journal of Finance, 52(1), 57-82.
  • Cremers, K. M., & Petajisto, A. (2009). How active is your fund manager? Review of Financial Studies, 22(9), 3329-3365.

- Kacperczyk, M., Sialm, C., & Zheng, L. (2008). Unobserved actions of mutual funds. Review of Financial Studies, 21(6), 2379-2416.
  • Amihud, Y. & Goyenko, R. Y. (2013). Mutual fund’s R2 as predictor of performance. Review of Financial Studies, 26(4), 667-694.


---

溯源标记


  • 全文具体参考页码见题注,如部分结论来自[page::1,2], 图表信息见[page::4,5,10,16], 风险提示[page::17,18], 详细因子表现见各具体表格页码区间[page::2-17]。


---

以上为报告的详尽分析解读,涵盖体系架构、数据方法、核心发现、图表深入剖析及风险评估,为读者全面理解西部证券《构建高收益高胜率基金组合:量化选基因子体系初探(上)》报告提供了坚实基础。

报告