`

再谈 SemiBeta 因子:高频测算

创建于 更新于

摘要

本报告基于A股市场日内高频数据,细化拆解传统Beta因子为四个SemiBeta因子,构建64个高频因子并进行周频和月频调仓的系统实证分析。结果显示,周频调仓全市场选股中MN因子表现最佳,IC均值约为-5.3%,多空策略年化收益达29.4%;月频调仓下N、P因子表现较好,半月度选股池中中证500指数因子效果较优。高频SemiBeta因子相关性显著高于低频,因子有效性受选股池限制呈下降趋势,揭示了高频风险分解对alpha挖掘的潜力与限制 [page::0][page::6][page::7][page::19][page::22]

速读内容

  • 研究背景与目标 [page::0][page::3][page::4]

- 传统Beta因子在A股市场Alpha贡献有限,因子忽略了投资者对下行风险的偏好。
- 借鉴Bollerslev (2021)理念将Beta拆解为四个SemiBeta因子(N、P、M+、M-),以捕捉差异化风险暴露。
- 本报告进一步采用日内1分钟及5分钟高频数据,结合月频和周频调仓频率,构建64个高频SemiBeta因子,探索因子在更高频率下的表现。
  • SemiBeta理论基础与构建方法 [page::4][page::5]

- SemiBeta定义为协方差在不同市场收益方向细分,拆分为市场和个股同跌(N)、同涨(P)、市场涨股跌(M+)、市场跌股涨(M-)四个成分。
- 实证示例显示四类资产在传统Beta一致下的预期收益区别,体现了对下行风险厌恶和对冲特征的差异。
  • 高频SemiBeta因子实证分析与主要结果

- 月频全市场选股中,所有因子均表现为负IC,因子值低的个股后续表现较好。N因子和P因子表现相对突出,semibetaNSH000852因子IC均值-6.1%,多空年化收益12.6%;semibetaPSH000852因子IC均值-6.4%,多空年化收益14.8%。


- 周频全市场选股中,MN因子优势明显,5avgfBetaMNHFS000300的IC均值-5.3%,多空年化收益29.4%,多头年化收益18.5%,换手率60.9%。
  • 限定不同选股池的因子表现 [page::12][page::14][page::16][page::19][page::20]

- 在不同指数成分股范围内,因子有效性有所下降,尤其是沪深300和中证500指数选股池。
- 但中证500范围内相对表现较好,月频选股时N、P因子表现最佳,周频选股时MN因子表现较优。
  • 因子相关性分析 [page::11][page::22]

- 高频SemiBeta因子内部相关性显著高于低频因子,同收益方向的因子(N与P,MN与MP)相关性高达70%以上。
- 不同频率因子之间总体相关性较低,低频P因子与高频N、P因子存在一定正相关。
| 因子组合 | 高频相关性(%) | 低频相关性(%) |
|-----------|--------------|--------------|
| N & P | 70.7 | 54.0 |
| MN & MP | 58.7 | 47.5 |
| N & MP | 37.6 | -0.5 |
  • 风险提示 [page::0][page::23]

- 因子模型基于历史数据统计,未来市场政策和结构变化可能导致策略失效风险。
- 高频因子更依赖市场结构和交易行为的稳定性,风险提示尤为重要。

深度阅读

广发证券研究报告《再谈 SemiBeta 因子:高频测算》详尽分析报告



---

1. 元数据与概览


  • 报告标题:再谈 SemiBeta 因子:高频测算

- 系列名称:多因子 Alpha 系列报告之(四十七)
  • 作者/分析师:安宁宁、罗军、陈原文、张钰东等团队成员

- 发布机构:广发证券发展研究中心
  • 发布日期:2023 年(具体日期未标明,但附带的相关报告时间点在2022年末)

- 研究主题:基于高频数据的 SemiBeta 因子构建与A股市场实证研究

报告核心论点

本报告基于Bollerslev(2021)对传统Beta因子拆解的SemiBeta因子理论,首次尝试将因子构建与实证分析推展到A股市场的日内高频数据层面,试图检验更高频数据是否能挖掘更丰富的Alpha机会。研究发现,
  • 高频SemiBeta因子在月频和周频的调仓频率下表现出不同的选股效果;

- 从因子层面看,部分SemiBeta子因子(特别是MN和N、P因子)在全市场和局部股池均表现出了负的信息系数(IC),体现了价值选股信号;
  • 高频SemiBeta的相关性结构和低频因子存在差异,体现不同频率因子在信息提取上的互补性。


目标价与评级:该报告为量化策略研究报告,主要针对多因子模型构建,未涉及具体个股目标价和买入卖出评级,关注的是因子alpha表现和有效性验证。

总结来说,报告旨在提出高频SemiBeta因子测算的方法论创新,结合多个市场基准和数据频率多维度验证,揭示SemiBeta因子在A股中的实证表现及潜在应用价值。

---

2. 逐节深度解读



一、研究背景(第3页)


  • 关键论点

- 传统基于市场Beta的因子在A股难以持续挖掘稳定Alpha,证明了市场对传统Beta的敏感度和溢价有限。
- 参考Markowitz(1959)、Hogan and Warren(1972,1974)等早期文献,提示Beta因子本质过于简化,不能充分解释截面收益差异。
- 因此,需要拆分Beta因子,尤其结合资产与市场收益方向的不同,挖掘半Beta(SemiBeta)因子。
- 通过沪深300、中证500、中证800指数作为市场基准,回溯20、60、120日计算Beta发现传统Beta对超额收益解释有限。
  • 逻辑与推理

- 经典资本资产定价模型(CAPM)假设Beta越高,预期收益越高;但该模型忽视了下行风险和市场环境的非对称影响。
- 研究启示我们需要细分Beta,梳理不同收入方向对个股风险和收益的贡献,才能获得更丰富的投资信号。
  • 重要数据点

- 表1展示传统Beta因子绩效,整体未贡献稳定alpha。

该章节明确研究动因,即传统Beta因子不足,提出基于收益方向拆分的新因子模型必要性。[page::3]

二、SemiBeta因子研究理论基础(第4-5页)


  • 关键论点

- 借鉴Bollerslev(2021)理论,传统Beta拆解为四个部分:$\beta^N, \beta^P, \beta^{M^+}, \beta^{M^-}$。
- 分别对应市场与资产收益的四种组合方向:市场负&资产负(N),市场正&资产正(P),市场正资产负($M^+$),市场负资产正($M^-$)。
- 这种拆解考虑了投资者更关注下行风险(损失),更贴近行为金融理论中对风险的非对称厌恶。
  • 逻辑与推理

- 通过拆分Beta,可以区分“好Beta”和“坏Beta”,即市场上涨时资产同步上涨的敏感度与市场下跌时的表现不同。
- 投资者愿意为下跌防御能力好的资产支付溢价,SemiBeta模型正是捕捉这种不对称风险溢价的工具。
- 实证通过对资产B、C、D等不同SemiBeta特征组合的分析,说明不同结构SemiBeta资产的预期收益也不一样,资产D由于良好对冲特性预期回报最低。
  • 重要数据点

- 公式详解Beta拆分与SemiBeta定义。
- 图1通过四个Panel对比了四组资产Beta和SemiBeta的差异形态,直观说明SemiBeta独特风险结构。
  • 预测与推断

- 基于美股市场,Bollerslev发现月度SemiBeta中$\beta^N$正溢价,$\beta^{M^-}$负溢价,其它因子无显著溢价。
- 本报告基此方法提出研究假说,进一步验证A股市场是否存在类似因子溢价及其高频表现。[page::4,5]

三、实证分析:月频全市场选股(第6-10页)


  • 数据说明

- 全市场选股,剔除摘牌、涨跌停、ST、上市未满180日个股。
- 回测期2010年至2021年。
- 选股分位为10档,月末调仓。
- 预处理采用MAD去极值和Z-Score标准化。
  • 因子构建

- 64个高频SemiBeta因子构建,数据维度包括1分钟和5分钟数据,市场基准涵盖沪深300、中证500、中证1000及创业板指。
- 部分因子采用10日滚动均值平滑。
  • 核心实证结果(表4-7)

- 所有因子IC均为负,说明买入因子值较小(即某些风险特征低)的股票后期收益较好。
- N因子和P因子IC均值绝对值较高,表现较优。
- 例:semibetaNSH000852 IC均值约-6.1%,多空年化收益12.6%。
- semi
betaPSH000852 IC均值约-6.4%,多空年化收益14.8%。
- 其他因子表现相对弱一些。
  • 图表深度解析(图2-9)

- 图2和图4分别展现了semibetaNSH000852和semibetaNSZ399300ma10因子IC时间序列,蓝色为单期IC,黄色为累计IC。
- 通过时间序列可以看到,虽然存在较多波动,但长期累计IC趋向负值,体现持续有效信号。
- 图3、图5等展现对应因子的多空组合收益曲线,长期呈现累积正收益趋势,支撑因子有效性。
- P因子因子IC及收益图(图6-9)呈现相似特征。
  • 解释与推断

- 因子负IC意味着因子值越低的股票后续收益越高,提示投资者可反向使用该因子构建组合。
- 多空收益稳定累积说明因子在量化选股模型中具有实际投资价值。

本章节系统验证了高频SemiBeta因子在月频策略框架下的稳定Alpha产生能力,[page::6-10]

四、实证分析:月频限定股票池(第12-18页)


  • 选股池设定

- 分别限定为沪深300、中证500、中证1000成分股,重点检验因子在不同市场深度及流动池的表现差异。
  • 实证发现

- 整体因子IC绝对值及年化收益均出现一定程度下降,表明限制选股池减弱因子表现。
- 在中证1000(小市值板块)中,MN因子表现较好,
- 例:semi
betaMNSZ3990065mma10 IC均值-6.3%,多空年化收益18.9%。
- 中证500股池表现稍优于沪深300,但均未超过全市场表现。
  • 分析

- 这可能反映大盘股因信息披露完善、估值效率高,部分因子难以捕捉超额收益;
- 中小市值股票信息或风险定价不完全,因子信号更显著。

此部分体现SemiBeta因子在不同市场细分板块的稳健性差异,为后续策略设计提供重要参考。[page::12-18]

五、实证分析:周频换仓全市场选股(第19-21页)


  • 数据和方法变更

- 采用周度调仓,因子使用5日滚动均值平滑,数据频率以1分钟级为主。
- 股票样本剔除更严格(上市至少1年等)。
- 构建16个周频新因子。
  • 关键发现

- MN因子继续表现突出,
- 例:5avgfBetaMNHFS000300 平均IC -5.3%,多空年化收益29.4%,单期换股比例高达61%。
- 选股池限制同样导致因子效果下降,
- 中证500股票池效果相对较好,IC和收益有所维持。
  • 因子换手率

- 高换手率意味着此类高频因子适合短期频繁交易策略。

该部分验证了SemiBeta因子在高频交易和更频繁调仓框架下的应用潜能,强调周频调仓在A股的有效性。[page::19-21]

六、因子相关性分析(第11页)


  • 高频和低频SemiBeta因子的相关性结构:

- 高频因子组内相关性更强,
- N因子和P因子相关达70.7%,而低频约54%。
- 不同收益方向的因子间相关性较低,高频时反而有所上升,但依然较弱。
- 高频和低频因子整体相关性较低,尤其低频P因子与高频N、P因子间存在弱相关。
  • 意义

- 高频因子存在更强的信息共振,便于组合提升alpha稳定性。
- 高频和低频因子信息互补,为多因子策略设计提供空间。

[page::11]

七、总结与风险提示(第22-24页)


  • 总结重点

- 报告成功利用高频数据对传统Beta拆解成SemiBeta进行扩展,验证了半Beta因子对A股选股具有显著影响。
- 不同频率和基准指标选股均显示出一致的负IC特征,说明低因子值个股未来收益表现优异。
- 高频调仓特别是周频调仓下,MN因子表现优异,年化多空收益近30%。
- 选股池限制普遍导致因子表现略有下降,小市值(中证1000)和中盘股票池因子效应相对更佳。
- 高频因子表现稳定,信息量更大,且与低频因子相关性较低,表明在多因子模型中具备重要的补充价值。
  • 风险提示

- 模型和结论均基于历史统计,市场环境和政策变化可能导致策略失效。
- 高频因子交易对市场结构变化敏感,交易成本风险需关注。

[page::22-24]

---

3. 图表深度解读



图0(首页):5avgfBetaMNHFS000300因子IC信息


  • 描述:该图展示了以沪深300为基准的MN类SemiBeta因子(5日滚动平均)从2007年至2021年的单期IC和累积IC。

- 解读:单期IC多为负值且波动剧烈,累积IC呈现持续向下趋势,显示因子稳定地提供选股信号。
  • 文本联系:图形数据显著支持后续周频换仓中MN因子表现优异的结论。

- 数据来源:天软科技,广发研究中心。[page::0]



图1(第5页):不同SemiBeta结构的资产对比


  • 描述:对比四种SemiBeta结构的资产的联合分布等高线,分别展示Beta变量在不同收益状态组合下的表现差异。

- 解读:显示即使传统Beta相同,SemiBeta细分结构带来的市场反应和风险偏好差异显著。
  • 文本联系:证明引入SemiBeta因子能够进一步区分资产风险特征,捕捉不同价格行为。

- 局限性:为理论说明性图,具体系数未经量化,实务应用仍需结合数据。



图2-9(第9-10页):典型SemiBeta因子IC与多空收益数据


  • 图2、4、6、8为N因子和P因子的IC序列,蓝色柱状为单期IC,黄色折线为累计IC,时间跨度长达2010-2021年,均呈现稳定负IC累积。

- 图3、5、7、9为对应因子的多空组合收益,持续攀升,表明长期超额收益的累积。
  • 这些图表明确展现高频SemiBeta因子对未来收益率的预测能力,且负IC对应的反向选股策略为投资界提供显著alpha机会。

- 数据来源:天软科技,广发研究中心。

---

4. 估值分析



报告未涉及传统企业估值分析,而是在因子构建和量化投资的层面对Alpha信号进行评估。衡量标准主要通过信息系数(IC)、年化收益率、多空组合表现和换手率来量化因子有效性。
  • 因子IC为因子值与未来收益的相关性,IC越高(或绝对值高),表明因子预测能力越强。

- 因子年化收益基于多空组合策略回测收益率,衡量因子作为选股工具的实际投资价值。
  • 换手率反映策略的交易频繁程度,影响交易成本和策略的可持续性。


---

5. 风险因素评估


  • 策略失效风险:因子基于历史数据统计,市场结构、政策、交易行为等变化可能导致信号减弱或消失。

- 市场环境依赖:因子表现依赖于特定市场特征,如高频市场微结构优势及A股市场的制度特征。
  • 交易成本与滑点风险:高频因子高换手率可能带来成本压力,影响实际净收益。

- 流动性风险:部分中小市值股票的流动性不足,可能增加交易难度和风险。
  • 模型假设风险:SemiBeta分解的理论假设在不同市场、资产类别和时间维度中有效性存在不确定性。


报告未详尽说明具体缓解措施,但提及策略灵活调整与政策跟踪重要性。[page::23]

---

6. 批判性视角与细微差别


  • 负IC解读需谨慎:因子持续负IC,意味着过去的经验是选因子值低的股票取得较优收益,但其背后逻辑需进一步深究,如是否为逆向因子或被其他风险溢价捕捉。

- 频率与稳定性权衡:高频因子表现虽强,但换手率极高,可能面临现实操作中的成本和滑点挑战,这对实盘执行有较高门槛。
  • 因子适用范围有限:依赖于高频高质量数据,对部分中小市值股票或停牌较多品种可能数据不可用或因子表现不充分。

- 内生风险未充分讨论:报告未深入探讨因子间可能存在复杂内生关系,或策略拥挤带来的潜在回撤风险。
  • 模型复杂度:SemiBeta因子的构建和解读相对复杂,实际投资者理解和信赖度可能受限。


---

7. 结论性综合



本报告基于Bollerslev(2021)提出的SemiBeta理论,创新性地运用A股市场的日内高频1分钟和5分钟数据,构建64个细分的高频SemiBeta因子,并系统实证了多频率调仓(周频、月频)下的因子效力。实证显示:
  • 所有SemiBeta因子在全市场选股范围普遍呈现负IC,表明低因子值个股未来收益较优。

- 高频SemiBeta因子较低频因子表现更为突出,特别是MN类因子在周频调仓下表现最佳,单期换手率超60%,多空年化收益达29%。
  • 限定选股池(沪深300、中证500、中证1000)一般导致因子表现下降,但中证500和1000表现相对较好。

- 因子相关性分析表明,高频内部因子相关性较高,低频和高频因子之间相关性有限,暗示两者具有较强互补性。
  • 图表强化了因子IC的稳定负值及对应策略多空收益的累积,证明了SemiBeta因子构建在A股市场的实证有效性,尤其适合利用高频数据挖掘Alpha。


综上,报告提出的高频SemiBeta因子为A股市场风险溢价细分和多因子选股提供了重要新视角,赋予投资者捕捉市场下行风险和结构性分化的利器。尽管面临模型假设、市场环境变化及交易执行风险,但在量化投资策略中提供了有力支持和可操作的策略框架。

---

报告引用标识

本分析所有结论均基于报告页码依次附加标识,如[page::3],[page::4,5],[page::6-10],[page::19-21],[page::22,23]等。

---

# 备注:报告的专业性与严谨性较强,适合具有金融工程、量化分析背景的读者深入理解。

报告