`

选股因子系列研究(二十八)——一致预期质量分析

创建于 更新于

摘要

本报告比较分析了朝阳永续与WIND两大分析师预测数据供应商的一致预期数据质量及其选股有效性。研究发现,朝阳永续覆盖报告数量和股票比例较高,覆盖面更广,但极值数据出现较多,需数据清洗;WIND数据近年质量提升,极端误差少但覆盖不足。剔除异常值后,朝阳永续在净利润预测精度上表现更优。不同市值股票预测准确度显示大市值股票预测较优,且WIND近年改善明显。基于预期因子的多因子选股策略,朝阳永续因子表现及实战收益率均优于WIND。超预期因子分析显示,朝阳永续因子稳定性及因子溢价通过显著性检验,而WIND波动较大但中长期收益表现较好。综合来看,两者各有优势,投资者应根据策略需求选择数据源 [page::0][page::4][page::5][page::6][page::7][page::8][page::9][page::10][page::11][page::12][page::13]。

速读内容

  • 数据基础质量比较 [page::4][page::5]:


- 朝阳永续报告数量多于WIND,但差距从2014年开始缩小。
- 朝阳永续覆盖股票比例稳定在约80%,WIND约70%,差值约为10%。

  • 盈利预测偏差比较 [page::6][page::7][page::8]:

- 不剔除极值时,朝阳永续预测偏差显著大于WIND,极端误差高。
- 剔除偏差超过3倍极值后,两者差异缩小,朝阳永续在EPS和净利润预测准确度优于WIND。
- 市值加权后,两数据库预测偏差均显著下降,说明大市值股票预测准确性更高。

- WIND近年在大市值股票数据质量提升明显,朝阳永续数据结构较为稳定。
  • 预期因子选股效果对比 [page::9][page::10]:

| 因子 | WIND IC | WIND Rank IC | 朝阳永续 IC | 朝阳永续 Rank IC | 结论 |
|------------|---------|--------------|-------------|------------------|------------------------|
| 预期ROE | 0.104 | 0.120 | 0.105 | 0.122 | 两者IC相仿,朝阳永续略优|
| 预期PE | 0.102 | 0.119 | 0.104 | 0.121 | 两者IC相仿,朝阳永续略优|
| 预期净利润率| 0.102 | 0.118 | 0.104 | 0.120 | - |
| 预期净利润率同比|0.101 | 0.116 | 0.104 | 0.120 | - |
| 预期ROE同比| 0.103 | 0.118 | 0.100 | 0.117 | - |

- 构建多因子全市场选股策略,朝阳永续信息比率 2.27,年化超额收益42.78%,优于WIND的1.96和37.34%。
| 策略指标 | WIND | 朝阳永续 |
|--------------|---------|----------|
| 信息比 | 1.96 | 2.27 |
| 年化收益 | 60.52% | 65.96% |
| 基准年化收益 | 23.18% | 23.18% |
| 年化超额收益 | 37.34% | 42.78% |
| 收益风险比 | 1.59 | 1.75 |
  • 超预期因子策略表现 [page::10][page::11][page::12]:




- WIND的超预期组合ALPHA波动更大,近中期收益(持有2-3个月期)优于朝阳永续。
- 朝阳永续因子IC、Rank IC及多因子回归的因子溢价显著优于WIND,表现更稳定。
| 指标 | WIND | 朝阳永续 |
|------------|--------|---------|
| 因子IC均值 | 0.004 | 0.022 |
| 因子RankIC均值 | -0.006 | 0.025 |
| ICIR | 0.489 | 2.330 |
| Rank ICIR | -0.549 | 2.153 |
| 胜率 | 0.625 | 0.875 |
| 因子溢价均值| 0.005 | 0.022 |
| 溢价T值 | 0.524 | 2.045 |
  • 综合结论 [page::0][page::13]:

- 朝阳永续数据覆盖更广、结构稳定,但极端误差较多,需清洗。
- WIND数据质量逐步提升,极端误差低,覆盖度较低。
- 投资者应根据策略特征选择数据供应商,比如因子型策略可偏好朝阳永续,事件驱动策略倾向WIND。
  • 风险提示:系统性风险、流动性风险、模型失效风险 [page::13]。

深度阅读

深度分析报告:《选股因子系列研究(二十八)——一致预期质量分析》



---

一、元数据与报告概览


  • 标题:《选股因子系列研究(二十八)——一致预期质量分析》

- 作者/分析师:郑雅斌、罗蕾
  • 发布机构:海通证券研究所

- 发布时间:2017年10月18日左右(结合相关研究时间推断)
  • 主题:对两大分析师预测数据供应商——朝阳永续与WIND提供的一致预期数据质量及其选股有效性进行深入比较分析。

- 核心论点:报告通过全面对比两大数据厂商的基础数据(分析师报告量及股票覆盖比例)、数据准确性(盈利预测偏差)、以及基于这些数据构造的多因子选股效果和超预期因子的表现,呈现两者各自优势和不足,提示投资者根据自身策略需求选择数据源。
  • 评级及目标价:本报告为量化因子研究报告,不涉及股票评级或目标价。


报告的主要信息传达是,虽然朝阳永续在数据覆盖度和报告数量上占优,但其数据中极端预测偏差较多,需投资者进行数据清洗;而WIND虽覆盖稍逊,但数据整体更“干净”,且近年精度提升明显。在不同的投资需求(因子型策略 vs 事件驱动策略)下,选择不同数据源更为合适。[page::0,4-6,12-13]

---

二、逐章深度解读



1. 基础报告数据的完整性及覆盖度


  • 关键论点:

- 朝阳永续的分析师研究报告数量高度领先于WIND,尤其在2012-2014年差距达一倍,之后差距明显缩小,2017年趋近。
- 在股票覆盖比例上,朝阳永续稳定保持约80%,而WIND约为70%,两者差异较为稳定,朝阳永续覆盖更多中小盘和非主流股票。
  • 推理依据及数据:

- 以月度时间窗口统计报告数量和股票覆盖比例,如图1显示报告数量趋势,图2、图3展示了覆盖比例及差值。多覆盖股票意味着对市场的广泛信息获取。
  • 图表解读:

- 图1显示两家数据报告数量时间序列趋势,朝阳永续(更亮色线)整体高于WIND,但趋于收敛。
- 图2、图3直观展现覆盖股比例差异波动,以朝阳永续领先优势明显。
  • 分析意义:覆盖面和报告数量是数据代表性和丰富性的基础保障,也反映出朝阳永续数据结构较为稳定和广泛。[page::4-5]


2. 盈利预测数据准确性的分析



2.1 不考虑极值情况下的预测偏差


  • 论点:原始数据反映出朝阳永续存在较多极端预测导致整体偏差大(即预测值与真实财报偏差大),尤其在EPS、净利润数据上表现明显。

- 数据支持:表1显示2007-2016年期间朝阳永续无剔除极值预测偏差多次高于WIND,结合覆盖更多小盘股、分析师数量较少造成的预测偏差较大。
  • 逻辑解读:极端值严重影响一致预期的预测偏差,简单对比并不能说明准确性好坏,需进行极值剔除后分析。


2.2 考虑极值情况下的预测偏差


  • 论点:剔除预测偏差超过3倍的极值预测后,两家数据供应商的盈利预测差异显著减小,朝阳永续在EPS与净利润预测上优于WIND。

- 数据支持:表2,剔除极值后,朝阳永续的净利润与EPS偏差低于WIND,营业收入和净资产误差两家不显著差异。
  • 分析逻辑:数据清洗处理是关键,说明投资者若能合理剔除异常预测数据,朝阳永续数据预测质量更优。


2.3 不同市值股票的预测准确性分析


  • 论点:市值加权计算显示,预测误差主要集中于小盘股,分析师对大市值股票预测更准确。

- 数据分析:表3与图4展示了市值权重加权后,两个数据库偏差均大幅下降。
  • 图4解读:偏差减少幅度体现两家数据库数据结构不同,朝阳永续数据结构相对稳定,WIND近年大市值股票数据质量提升明显。

- 结论:大市值股票的一致预期预测较可依赖,且WIND在逐步缩小大市值股票预测质量差距。[page::6-8]

3. 预期因子的选股效果对比



3.1 因子 IC 对比


  • 论点:

- 预期ROE、预期PE表现较好,净利润率指标表现较差。
- 两大数据库的因子IC(信息系数)无明显本质差异,表明预期因子有效性相当。
  • 数据表现:表4与表9详细列出IC和Rank IC均值、ICIR(IC稳定性指标)和胜率,显示朝阳永续与WIND数据因子均表现稳定。

- 术语解释:
- IC是因子预测收益与实际收益的相关系数,衡量因子的有效性。
- RankIC为秩相关系数,适合非正态数据。
- ICIR是IC均值和标准差的比值,评估因子稳定性。
  • 实质意义:因子选股策略理论基础相当牢固,两个数据库均能产出较优预期因子信号。


3.2 因子预测效果对比


  • 论点: 虽因子IC相近,但从收益率预测角度看,朝阳永续带来的选股效果更好,可能因为其覆盖股票更多。

- 数据展示:表5和表6显示多因子选股策略收益,朝阳永续组合信息比和年化超额收益均优于WIND。
  • 应用意义:更全面的覆盖和数据处理提升了预测收益准确度,适合构建多因子量化选股策略。[page::8-10]


4. 超预期因子研究



4.1 超预期因子组合ALPHA分析


  • 定义说明:超预期因子基于公司公告后财报数据与之前预测的偏离程度构建,通常事件驱动型,反映市场对业绩超预期的反应。

- 发现:
- WIND数据库组合ALPHA波动较大,主要因其数据源和股票池的不断完善。
- 中长期(2个月、3个月)持有期内,WIND表现优于朝阳永续,后者受极端预测值影响较大。
  • 图表解读:图5-7分持有1、2、3个月期的多头组合ALPHA显示,WIND组合虽波动大但整体收益表现更优。

- 投资提示:超预期幅度较大股票虽潜力显著,但需处理极端预测风险。

4.2 超预期因子的IC及因子溢价分析


  • 核心论点:将超预期因子引入多因子模型后,朝阳永续的因子IC及因子溢价更显著且稳定,WIND表现较弱。

- 数据说明:表7显示各项统计指标(IC均值、ICIR、溢价显著性)朝阳永续明显领先。
  • 结论:超预期因子的因子效应在朝阳永续数据库中体现更佳,稳健度和显著性较高。[page::10-12]


5. 综合结论


  • 朝阳永续数据覆盖面和报告数量领先,优势在于长期稳定的数据结构和更全面的市场覆盖。

- WIND数据库近年数据质量提升明显,极端预测值较少,数据“更干净”,尤其大市值股票预测逐步逼近朝阳永续水平。
  • 预测准确性方面,极端值剔除后朝阳永续在利润类指标领先;市值加权后两家差异降低。

- 因子选股角度,两个数据库因子IC基本持平,但在实际收益预测和多因子组合,朝阳永续表现更好。
  • 超预期因子方面,虽然WIND有更优的中长期持有收益表现,朝阳永续因子IC和溢价显著性更高,各有侧重。

- 投资者应结合自身策略,因子型策略偏好朝阳永续,事件型策略及数据稳定性要求更高可考虑WIND。
  • 风险提示涵盖市场系统性风险、流动性风险及模型失效风险。[page::0,4-6,12-13]


---

三、图表深度解读



图1:朝阳永续与WIND收纳报告数量对比(页4)


  • 展示内容:2012年至2017年间,两家数据供应商每月收录分析师报告数量的月度时间序列。

- 数据趋势及意义:
- 朝阳永续始终保持较高的收录量,尤其在2012-2014年高出WIND一倍左右,2017年差距明显缩小。
- 体现朝阳永续数据源起步早且规模大,但WIND积极扩张,竞争力显著提升。

图2、图3:股票覆盖比例及差值(页5)


  • 内容说明:

- 图2展示两家数据商覆盖市场股票的比例,朝阳永续约80%,WIND约70%。
- 图3展示二者覆盖比例的差异,基本稳定在约10%。
  • 解读趋势:报告数量差距缩小,但覆盖差异更稳定,显示朝阳永续对较多股票保持覆盖,而WIND重点覆盖大市值或核心股票。


表1-3:盈利预测偏差定量分析(页6-8)


  • 表1:未剔除极值的预测误差,朝阳永续偏差较大,反映更多极端误差。

- 表2:剔除极端偏差后的预测误差,朝阳永续在EPS和净利润预测中相对优越。
  • 表3:市值加权后预测误差,两家数据库误差大幅下降,表明大盘股预测更准确。


图4:市值调整后预测偏差下降幅度(页8)


  • 图表内容:展示剔除极值、采用市值加权计算EPS和净利润偏差下降比例的时间序列。

- 趋势解读:朝阳永续前期偏差主要来自小盘股票,结构较稳定;WIND近年偏差下降幅度增加,表现出大市值预测改善。

表4-6:因子IC及预测效果分析(页9-10)


  • 表4:微观因子有效性指标数据,两个数据库IC无大差异。

- 表5-6:构建多因子选股组合的收益率预测和策略表现,朝阳永续因高覆盖率体现略优。

图5-7:超预期因子多头组合ALPHA(页11)


  • 图表解释:分别展示持有1、2、3个月期限的超预期多头组合相对基准的ALPHA变化趋势。

- 关键观察:WIND组合波动较大,但中长期表现优于朝阳永续,后者受极端预测值干扰。

表7:超预期因子IC及因子溢价对比(页12)


  • 内容总结:朝阳永续的超预期因子IC及溢价均显著优于WIND,反映其超预期因子效应稳健且能带来收益。


---

四、估值分析



本报告并未涉及具体个股估值方法或目标价,而聚焦于量化因子和数据源的质量对比,核心在于因子、预测准确性和选股策略效果的统计分析。

---

五、风险因素评估


  • 市场系统性风险:整体市场波动可能导致分析师预测数据和因子表现失效。

- 流动性风险:部分覆盖股票流动性低,影响因子表现及策略实施。
  • 模型失效风险:因子模型未来可能失效,预测结果和策略表现不及预期。


报告未对具体风险概率和缓解策略细化,风险提示属行业通用范畴。[page::0,13]

---

六、批判性视角与细微差别


  • 数据极端值问题明显:朝阳永续数据虽覆盖广,但极值较多,一定程度影响数据的“干净度”,投资者需具备数据清洗能力。

- WIND数据发展阶段:WIND数据近年来提升显著,但覆盖面和股票池相对较小,过于依赖少部分大盘股可能限制策略多样性。
  • 策略适用范围有限:报告多基于年报披露后一段时间的历史数据,事件驱动策略表现差异可能会随市场环境变化发生变化,需结合最新市场动态。

- 测算结果的稳定性:部分指标年际波动较大,提示因子稳定性仍需关注,尤其在不同市场周期。
  • 部分图表与数据解读依赖投资者专业判断:如极值剔除标准、因子构造方法投资者需理解细节,否则结果应用有一定误差风险。


---

七、结论性综合



本研究报告以朝阳永续和WIND两大数据供应商的分析师一致预期数据为样本,较为全面地评估了基础数据质量、盈利预测准确性、基于预测数据构造的多因子选股效果及超预期因子表现,得出如下综合见解:
  • 数据承载基础:朝阳永续在报告数量及股票覆盖面上呈领先优势,覆盖率约80%,相较WIND的70%更适合需要广覆盖的数据需求。

- 数据质量控制:剔除极端异常预测数据后,朝阳永续数据的盈利预测准确性显著优于WIND,尤其在EPS和净利润指标上;且朝阳永续数据结构更稳定,WIND则展现出近年来大市值股票预测准确性明显提升。
  • 因子投资表现:尽管两者因子IC表现相近,朝阳永续因覆盖面广,在多因子模型构建下选股收益更高,表现更为优异。

- 超预期因子差异:WIND数据库的超预期因子组合收益波动更大,中长期持有表现突出;而朝阳永续因子IC及溢价稳健显著,适合稳健型超预期因子策略。
  • 投资者建议:根据策略取向选择数据源——因子策略爱好者倾向朝阳永续,事件驱动及注重数据洁净度者建议关注WIND。

- 风险须知:伴随市场系统性风险、流动性风险及模型失效风险,投资者应结合多因素进行策略验证和风险控制。

整个报告通过丰富的时间序列数据、覆盖率对比、偏差分析、因子IC统计及策略回测多维度数据验证,使投资者获得对数据源选择及因子构建效率的深刻理解,并提供实证支持和投资决策参考。[page::0,4-13]

---

参考图表展示(部分示例)



图1 朝阳永续与WIND收纳报告数量对比


图2 股票覆盖比例对比


图4 调整加权方式后利润预测偏差下降幅度


图5 持有1个月多头组合ALPHA


---

以上为《选股因子系列研究(二十八)——一致预期质量分析》报告的详尽解析。

报告