`

选股因子系列研究(十九)——高频因子之股票收益分布特征

创建于 更新于

摘要

本报告基于股票1分钟及5分钟的高频价格数据,构建了高频收益方差、偏度和峰度因子,重点发现高频偏度因子在不同频率和计算方法下均展现出稳定且显著的选股能力,IC绝对值约0.05~0.06,月度胜率近80%。引入正交处理后,高频偏度因子依旧保有较强选股能力,特别是一分钟频率表现更佳。将高频偏度纳入多因子模型,经Fama-MacBeth回归及TOP100纯多头组合回测验证,因子能显著提升模型选股能力,尤其在年化收益和信息比率方面带来一定提升,且权重占比稳定在5%-10%之间。此外,报告强调市场系统性风险及政策风险对策略表现存在影响[page::0][page::4][page::5][page::6][page::7][page::9][page::10][page::11][page::12][page::13][page::14]。

速读内容

  • 高频收益方差因子表现弱,5分钟频率略优但组间收益单调性较差,1分钟频率无明显选股能力,故不进一步分析[page::5][page::6]。

  • 高频收益偏度因子表现稳健,分组收益呈明显下降趋势(月度多空收益近1.5%),IC绝对值0.05~0.06,ICIR大于2.5,月度胜率约80%;前期偏度越小股票未来收益越好[page::6][page::7]。

  • 高频收益峰度因子表现差异明显,1分钟频率无选股能力,5分钟频率有弱选股能力,表现不稳定暂不深挖[page::7][page::8]。

  • 高频偏度因子具有大市值、低换手率特征,与市值负相关、换手率正相关,与反转及特异度相关性不高[page::8][page::9]。

  • 正交处理后高频偏度因子依旧具有显著选股能力,1分钟频率IC绝对值约0.03左右,ICIR大于2,5分钟频率略逊但仍有作用[page::9]。

  • Fama-MacBeth回归检验显示高频偏度因子显著,1分钟频率系数和T统计量绝对值高于5分钟频率,实现显著选股效用[page::10]。


| 模型 | 新增因子系数均值 | 新增因子T统计量 |
|------------|--------------|------------|
| 方法11min | -0.0024 | -6.53 |
| 方法1
5min | -0.0014 | -2.71 |
| 方法21min | -0.0024 | -6.68 |
| 方法2
5min | -0.0015 | -3.19 |
| 方法35min | -0.0018 | -2.93 |
  • TOP100纯多头组合回测显示:加入1分钟偏度因子后年化收益率从59.0%提升至61.2%,最大回撤略有下降,收益回撤比及信息比率均有提升,反映策略风险调整后收益改善明显;而加入5分钟偏度因子提升较小[page::10][page::11]。


| 组合 | 总收益(%) | 年化收益(%) | 最大回撤(%) | 收益回撤比 | 信息比率 | 月胜率(%) | 次均换手率(%) |
|----------|----------|------------|-----------|----------|--------|---------|-------------|
| 原始模型 | 10.2 | 59.0 | 55.0 | 1.072 | 3.202 | 71.0 | 63.3 |
| 方法1
1min | 11.0 | 61.2 | 54.1 | 1.131 | 3.361 | 71.0 | 69.0 |
| 方法1_5min | 10.7 | 60.5 | 54.1 | 1.119 | 3.283 | 69.4 | 66.8 |
  • 高频偏度因子在多因子模型中权重稳定,1分钟偏度因子权重约为10%,5分钟偏度因子权重在5%-10%之间,具体计算方法差异对权重占比无明显影响[page::11][page::12][page::13]。





  • 风险提示:市场系统性风险、流动性风险及政策变动可能对策略表现产生较大影响[page::0][page::14]。

深度阅读

金融研究报告详尽分析


报告元数据与概览


  • 报告标题:选股因子系列研究(十九)——高频因子之股票收益分布特征

- 分析师:冯佳睿、袁林青
  • 发布机构:海通证券研究所

- 报告日期:不具体指出,数据范围主要涵盖至2017年3月底
  • 研究主题:针对股票市场中的高频选股因子,主要分析基于日内高频收益分布特征(方差、偏度、峰度)的股票因子在选股中的表现及应用,尤其关注高频偏度因子的表现及其在多因子模型中的作用。


核心论点与结论摘要
  • 传统使用日级别的选股因子挖掘空间趋近饱和,日内高频数据(分钟级)或能提供额外Alpha因子。

- 高频偏度因子在不同计算方法及不同频率(1分钟和5分钟)数据中均表现出稳定的选股能力,IC绝对值维持在0.05–0.06,ICIR普遍高于2.5,月度胜率接近80%。
  • 对高频偏度因子进行正交处理后,剔除行业、市值、换手等影响因子,选股能力虽减弱但依旧显著。

- 多因子模型中加入高频偏度因子后,模型选股能力得到显著增强,尤其1分钟偏度因子的影响更大,因子权重约占10%,5分钟偏度因子权重约5%-10%。
  • 风险提示关注市场系统性风险、流动性风险及政策变动风险的潜在影响。


整体来看,作者欲传达高频偏度因子在当前的选股模型中具有独立且稳定的Alpha价值,值得纳入多因子组合进行深化研究和实践应用。[page::0,4,14]

---

逐节深度解读



1. 从“低频”到“高频”(第4页)


  • 章节内容摘要

报告从传统日频因子研究已较深入,难以突破为前提,提出通过分钟级高频数据来挖掘日内形态特征提供新Alpha的理念。构建了基于1分钟和5分钟对数收益序列计算的高频收益分布特征指标:方差、偏度、峰度,使用过去一个月均值作为因子值。
  • 核心计算公式及方法

详述了三种计算方法,其中方法1为常规统计量定义(例如方差为收益平方和,偏度峰度基于方差归一化的三阶、四阶矩),方法2为基于收益减均值的三阶和四阶矩,方法3通过遍历不同时间段划分求平均以降低划分影响。
  • 推理与假设

采用多种数据频率和计算方法以保证因子稳定性和鲁棒性,强调日内不同时间段刻画信息的异质性。
  • 关键意义

这一部分奠定了整个报告研究的理论和方法基础。通过高频统计分布特征的描述,有望捕获传统低频因子无法考虑的市场微观动态。[page::4,5]

2. 单因子回测(第5至9页)



2.1 高频收益方差


  • 总结

高频方差因子分组收益表现不稳定,单调性较差,IC和ICIR指标显示1分钟方差因子无明显选股能力,5分钟方差因子仅有弱选股能力,但分组收益未显示理想单调趋势,因此暂不作为重点因子分析。
  • 数据点及分析

- 图1分组收益曲线显示收益在中间组较好,在最高和最低组反而较差,非单调。
- 表1数据显示10组分组收益波动,且极值组收益负向明显,表明极端方差因子分组选股效果不佳。
- 表2 rankIC在1分钟时约-0.03,5分钟时约-0.06(负值表明方差越大收益越差),ICIR较低,说明可靠性有限。
  • 推理

方差指标更多反映波动幅度,未必能稳定预测未来收益,且波动大可能带来风险溢价反向拖累收益。

2.2 高频收益偏度


  • 总结

高频偏度因子表现显著优异,分组收益明显,前期偏度越小(偏左尾越严重)股票未来表现越好,显示出逆向策略的有效性。
  • 具体表现

- 图2中不同计算方法和频率的偏度因子收益分组呈递减趋势,因子值大的股票后续收益较低。
- 表3多空组合月度收益达1.4%-1.6%,前几组收益均为正,末端组收益非常负,T值和统计显著性强。
- 表4显示rankIC绝对值约0.05-0.06,ICIR超过2.5,胜率接近80%。
  • 推理与假设

高频偏度反映日内收益分布的不对称性,可能与投资者行为偏差、市场微观结构有关。该因子可能捕获短期价格异常,携带额外选股信息。

2.3 高频收益峰度


  • 总结

峰度因子表现不稳定且候选组间表现差异大,1分钟峰度基本无选股能力,5分钟峰度略有选股信号但不够稳健,暂且不深入挖掘。
  • 数据与趋势

- 图3显示不同频率峰度因子分组收益缺乏一致趋势。
- 表5、6中峰度因子IC值极低且正负交错,无明显稳定性。

2.4 高频偏度因子分组特征


  • 观察

高频偏度因子的多头组一般对应大市值和低换手率股票,说明偏度因子与传统的市值和换手率因子存在相关性。
- 图4反映组别收益与市值负相关,与换手率正相关。
- 偏度与反转、特异度两因子相关性低,可能提供独立Alpha信息。

2.5 正交偏度因子


  • 目的与方法

为排除偏度因子与规模、市值、换手率等因子的相关性,进行了正交处理剔除相关影响,分析剔除后的因子表现。
  • 结论

- 图5显示正交后偏度因子组间收益仍具备分化能力。
- 表7显示IC绝对值有所降低(1分钟偏度约0.03,5分钟偏度约0.02),但ICIR及胜率依旧显著,证明偏度因子选股效力独立于传统因子。

2.6 本章小结


  • 高频偏度因子在多种计算参数与处理下维持稳定的选股能力;

- 正交处理后依然表现显著,显示其为高质量Alpha因子;
  • 相较方差和峰度因子,偏度因子更具投资价值。[page::5-9]


---

3. 多因子模型回测(第10至14页)



3.1 Fama-MacBeth回归检验


  • 方法论

采用2010-2017年间正交多因子模型,加入高频偏度因子,检验新增因子的回归系数及显著性(T值)。模型原因子包括市值、非线性市值、换手率、反转、特异度。
  • 核心发现

- 高频偏度因子在所有计算方法和频率下回归系数均显著非零,T值均显著(1分钟偏度T值绝对值高于5分钟偏度)。
- 回归系数负号表明偏度因子负相关于未来预期收益,符合单因子分析结论。

3.2 TOP 100纯多头组合构建


  • 构建方案

月度选股,剔除ST股及上市不足6个月股票,比较原始模型和添加高频偏度因子后的TOP100股票组合表现。
  • 表现对比(表9):

- 加入1分钟偏度因子的组合年化收益61.2%,较原始59.0%提升2.2个百分点;
- 5分钟偏度因子引入后效果较小或无明显提升;
- 风险调整效率指标——收益回撤比和信息比率均有适度提升;
- 换手率有所增加,表明模型调整强化了部分活跃性。

3.3 因子权重分配情况


  • 高频偏度因子在改进多因子模型中贡献明显:

- 1分钟偏度权重约10%,权重保持相对稳定;
- 5分钟偏度权重在5%至10%间波动,低于1分钟频率的偏度权重;
- 各种计算方法权重分配大致相同,显示因子表现稳定性。

3.4 本章小结


  • 高频偏度因子有效补充了多因子模型的Alpha来源;

- 虽然回归和多因子分析显示该因子增益显著,但对极端组合的贡献有限,提示该因子改善边际效用或受限于其他因子掩盖;
  • 1分钟频率的高频偏度因子效果更佳。


综述以上,多因子模型分析表明高频偏度因子作为扩展因子具备实际应用价值,尤其在细化和预警方面表现出优势。[page::10-14]

---

4. 总结(第13-14页)


  • 报告通过对高频价格数据的深入分析,重点挖掘了收益的高频方差、偏度、峰度三种分布属性。

- 其中偏度因子在多数据频率和不同计算方式下表现稳定,并且正交后仍保留明显选股能力。
  • 多因子模型验证表明其显著增强了模型选股能力,因子的权重体现出市场认可度。

- 风险方面强调市场系统性风险、流动性风险和政策因素对策略绩效的潜在影响。

报告结论明确表明高频偏度因子为补充传统低频因子研究的重要突破口,具备实际投资策略应用的可行性和有效性。[page::13-14]

---

5. 风险提示(第14页)


  • 市场系统性风险:整体经济波动对选股策略回报的影响;

- 资产流动性风险:高频因子可能受流动性限制影响策略执行;
  • 政策变动风险:监管和市场政策调整可能改变策略表现环境。


风险提示指向策略实施需要结合宏观微观环境,重视非系统性风险干扰。[page::14]

---

图表深度解读



图1 高频方差因子分组收益特征(第5页)


  • 展示不同计算方法(方法1至3)与数据频率(1分钟及5分钟)下,高频方差因子将市场全部股票分成10组后,下一个月各组超额收益的分布。

- 图形显示各组收益非单调分布,3~6组收益相对较好,极端低组和高组收益明显为负。
  • 说明方差因子不能有效区分股票表现,存在一定非线性且单调性差的缺陷。

- 结合表1统计,极端组收益的T统计量均不显著或者为负值,验证图形观察结果。

表1 高频方差因子分组收益统计(第6页)


  • 多计算方法和频率下第10组(最高方差)股票表现最差,分组收益均为负,且T值超过-2显示统计意义。

- 包含统计结果的多空组合收益率及T值均较低,支持方差因子预测力不足。

---

图2 高频偏度因子分组收益特征(第6页)


  • 超额收益呈现显著递减趋势,因子数值小组收益最高,随因子值增长收益显著下降,10组表现最弱。

- 不同频率和计算方式顺序变化不大,显示因子稳定性强。

表3 高频偏度因子分组收益统计(第7页)


  • 低偏度股票未来表现超额收益高达0.4%-0.5%,对应T值超3。

- 组合多空收益约1.4%至1.6%,且T统计量大于4,形象地证明选股能力。

表4 高频偏度因子rankIC统计(第7页)


  • rankIC绝对值稳定约0.05-0.06,ICIR大多超过2.5,月度胜率接近80%,表现稳定且有效。


---

图3 高频峰度因子分组收益特征(第7页)


  • 不同频率表现分化大,尤其1分钟峰度组合收益单调下降,5分钟峰度略呈上升趋势。

- 整体表现不稳定,缺乏预期的单向信号。

表5&6 高频峰度因子分组收益及rankIC统计(第8、9页)


  • 组间收益低且T值多不显著,rankIC极低,说明峰度因子无显著选股能力。


---

图4 高频偏度因子分组特征(第8页)


  • 色线表现市值与偏度负相关,换手率与偏度正相关,收益(右轴)随分组增大逐步下降,验证偏度因子特性。

- 反转、特异度无明显线性相关。

---

图5 正交高频偏度因子分组收益特征(第9页)


  • 多条线(原始与正交后)均呈现收益随着分组因子值下降的趋势,正交处理后选股能力有所衰减但保持显著性。


表7 正交偏度因子rankIC统计(第9页)


  • IC下降但仍在0.02-0.03范围,ICIR保持较高,说明效用独立且稳定。


---

表8 Fama-MacBeth回归检验(第10页)


  • 各高频偏度因子新增因子回归系数均负且T值大于2,显著且稳定。

- 1分钟因子系数绝对值和T值普遍高于5分钟因子,选股效力更强。

---

表9 TOP100组合历史表现(第11页)


  • 原始模型年化收益59.0%,方法1_1min因子年化收益提升至61.2%,回撤略降。

- 其他改进模型多空收益与风险调整指标均稍有增强。

---

图6~10 高频偏度因子权重占比情况(第11-13页)


  • 高频偏度因子权重稳定,1分钟频率约10%,5分钟频率5%-10%之间均衡分布。

- 不同计算方法间权重差异不大,反映因子贡献稳定性。

---

估值分析



报告主要偏重因子挖掘及多因子组合构建,未涉及具体公司估值分析。估值方法未详述。因子贡献以统计学指标和组合表现配置权重体现,无传统财务估值框架(DCF、PE)应用。[page::0-14]

---

风险因素评估


  • 市场系统性风险:整体市场波动及经济周期将直接影响选股策略表现和Alpha稳定性。

- 资产流动性风险:高频数据因流动性缺乏或成交不活跃导致信号噪音增加,执行难度加大。
  • 政策变动风险:政策变动可能影响市场结构和参与者行为,从而引发因子有效性波动。


报告仅点明风险但未细化风险管理策略,提醒策略应用时需结合宏观微观市场环境审慎评估。[page::0,14]

---

批判性视角与细微差别


  • 潜在偏见:报告强调高频偏度因子的正面表现,弱化或剔除了对峰度和方差因子的深入讨论,可能存在选择性展示结果的倾向。

- 数据和样本限制:样本周期至2017年3月,市场环境和微结构变化后因素表现可能不同,缺少对后续行情及稳健性的讨论。
  • 模型复杂度与实操影响:高频数据计算和正交处理技术难度较高,策略执行成本和滑点风险未充分讨论。

- 风险管理不足:虽然风险提示提出,但报告未给出具体的风险缓释措施,缺乏风险应对策略细节。
  • 因子边际效应的局限:多因子模型中,高频偏度因子对于极端(TOP100)组合提升有限,暗示其边际信息可能受限于其他因子的覆盖,需要进一步探索因子组合优化。

- 数据频率影响:1分钟频率因子表现普遍优于5分钟频率,背后可能涉及高频数据噪声与非同步采样的影响,报告对这一差异的根本原因探讨不足。

---

结论性综合



本报告深入分析了股票日内高频收益的统计特征——方差、偏度及峰度所构建的选股因子在A股市场的表现,验证了高频偏度因子作为选股因子的显著有效性。通过多种计算方法和频率检验,高频偏度因子表现出稳定且显著的负向选股信号,逆向捕捉收益异常。正交化处理确保了因子独立于市值、换手等传统因子,进一步强化了其作为多因子模型补充因子的合理性。

多因子回测和Fama-MacBeth回归验证了该因子对多因子模型的增益效果,尤其是1分钟频率的偏度因子贡献约占模型权重的10%。虽然对极端优胜组合的提升有限,意味着偏度因子可能更适合改善整体回报和风险调整表现而非极端筛选。

报告中的图表和表格全面支持了以上结论:
  • 图1、表1、表2表明高频方差因子预测能力弱,故未被重点采用;

- 图2、表3、表4强烈支持高频偏度因子优秀选股能力,IC指标显著且胜率高;
  • 图5、表7证明正交偏度因子依旧有效,确认其为独立Alpha;

- 表8Fama回归分析突出显示偏度因子统计学显著性;
  • 表9TOP100组合收益表现提升验证实际策略层面的贡献;

- 图6-10权重分配图展示偏度因子长期稳定的模型地位。

综上,海通证券研究所的本报告明确推荐重点关注基于分钟级数据的高频偏度因子,纳入多因子投资框架可有效丰富选股工具箱,提升量化投资策略的Alpha捕获能力。同时,策略用户须关注市场系统风险、流动性风险及政策风险,灵活调整策略应对环境变化。

该研究填补了传统低频因子研究瓶颈,展现了高频数据对量化选股的潜在注入效应,值得行业关注与后续探索。[page::0-14]

---

免责声明:本文分析扎根于报告内容,保持客观且信息密集,避免插入非报告来源的个人观点。引用的所有图表和数据均源自原文,确保分析的准确性和完整性。

报告