`

【广发金工】2024精选深度报告系列之八:多维度解耦的94个大小单因子

创建于 更新于

摘要

本报告基于海量Level 2逐笔订单数据,提出多维度解耦的大小单因子构建方法,涵盖时间和订单双重维度的93个大小单占比因子。通过对2020-2023年A股市场的实证回测,精选大小单因子组合在全市场及多个板块均实现超过30%的年化多头收益率和高夏普比率,显著跑赢相关指数,反映了大小单因子在捕捉主力买卖行为及市场信息方面的有效性,为量化投资提供了新的因子挖掘思路和选股依据 [page::0][page::16][page::25]

速读内容

  • Level 2行情数据包含丰富的逐笔订单信息,远超Level 1快照数据,是因子挖掘的根源 [page::1][page::2]

- 大小单因子构建基于订单成交量的标准差方法,不采用固定金额阈值,更能适应不同市值股票;构建了基于均值加1.0、1.5、2.0倍标准差的大小单标准 [page::3]
  • 原始大小单因子表现优异,5日换仓时多头年化收益最高达33.15%,20日换仓时RankIC及夏普比率更高,表明因子稳定性较好 [page::3]

- 时间维度解耦大小单因子(如开盘后15分钟或30分钟)共24个因子,能够捕捉开盘后主力活跃买卖行为,解耦后因子最大回撤降低,收益平稳 [page::5][page::6][page::8]
  • 订单维度解耦,拆分买卖双方大小单属性,构建12个因子。其中买卖双为大单因子BigBuyBigSell1p0表现优异,5日换仓多空组合年化收益高达47.09%,最大回撤低于原始因子,提升多空对冲能力 [page::9][page::10][page::11]

- 多维度(时间+订单)解耦的48个大小单因子,兼顾时序特征与买卖双方大小单细分,表现进一步优化,部分区间多空夏普比率超过2.0,收益持续稳健 [page::11][page::12][page::13]
  • 精选大小单因子组合(共94个因子中优选)在20日换仓条件下,A股全市场200档多头组合年化收益达36.61%,最大回撤17.52%,夏普比率2.03,超额收益显著 [page::16]



  • 精选因子组合在沪深300(12.24%),中证500(22.55%),中证800(18.54%),中证1000(24.61%),创业板(36.20%)等主流板块均表现优异,同比指数均实现明显超额收益,夏普比率均超过0.75 [page::17][page::18][page::19][page::20][page::21][page::22][page::23][page::24]






  • 结合因子在各板块的累计收益曲线和RankIC表现,因子表现出较好的稳定性和持续选股能力 [page::16][page::18][page::19][page::21][page::22][page::24]

- 报告提醒因子策略存在政策、市场结构及行为变化的失效风险,建议结合市场环境审慎应用 [page::0][page::25]

深度阅读

【广发金工】2024精选深度报告系列之八:多维度解耦的94个大小单因子——全文详尽分析报告



---

1. 元数据与概览


  • 报告标题:多维度解耦的94个大小单因子——海量Level 2数据因子挖掘系列(一)

- 作者及发布机构:原创,广发金融工程研究团队
  • 发布时间:2024年9月11日

- 研究主题:利用A股市场Level 2逐笔订单数据,构建多维度解耦的大小单占比因子,以此挖掘股票市场中的有效交易信号,优化量化投资组合表现。
  • 核心论点与结论:传统Level 1行情数据频率与信息有限,难以充分反映市场实际交易行为。相比之下,Level 2逐笔订单数据丰富详尽,揭示了市场订单的细节结构和交易动态。报告基于该数据,创新性地从时间和订单多个维度解耦大小单因子,形成多达94个因子,其中精选因子组合在20日换仓的实证测试中表现出投资价值。具体表现包括多头年化收益率高达36.61%,最大回撤控制在17.52%,夏普比率为2.03,并相对基准指数贡献33.07%的超额收益,显示了因子模型较强的策略有效性和稳健性。


此外,报告提醒模型及策略存在周期性失效风险,尤其在市场结构、政策或交易行为显著变更时表现可能下降。全文为量化因子库持续更新系列的第一篇,后续将继续探索更深层的Level 2数据因子挖掘方法。page::0]

---

2. 逐节深度解读



2.1 Level 1与Level 2行情数据介绍



本节介绍股票市场常见的数据分类。其中Level 1数据为3秒快照频率,数据涵盖开高低收、成交量、盘口挂单深度(5档)等,信息有限且频率较低;Level 2数据则更细致,包含10档买卖挂单深度、委托、撤单及成交逐笔订单数据,包含精确到毫秒的订单时间、序号、买卖方向、价格、数量等详细信息。逐笔订单数据是行情数据的根源,所有快照数据均可由其聚合而来。

报告基于Level 2逐笔订单,重点分析订单的大小属性,避免Level 1行情数据的频率和信息限制,挖掘更丰富的市场行为信号,为因子的构建和投资组合设计提供基础。[page::1]

---

2.2 数据聚合与大小单因子构建


  • 2.2.1 数据聚合挑战与解决:

逐笔订单中买入订单号和卖出订单号非唯一,原始委托单可能拆成多笔成交。为反映真实原始挂单大小,需先将归属同一买入(卖出)订单号的逐笔成交聚合,恢复成委托订单级别数据。
  • 2.2.2 大小单界定的创新方法:

传统基于绝对金额阈值(如4万元、20万元、100万元)划分大小单,受股票市值影响较大,难以有效适用于不同规模股票。本文采用更相对的统计方法,假设订单成交量服从近似的高斯分布,通过均值加不同倍数标准差(1.0、1.5、2.0)设定大小单阈值,实现股票个性化大小单判定。对应生成了以BigBuy1p0、BigBuy1p5、BigBuy2p0为代表的大小单因子。
  • 2.2.3 因子定义和关系:

- 大买单占比因子 (BigBuy
xx):买单成交量超过阈值比例
- 大卖单占比因子 (BigSellxx):卖单成交量超过阈值比例
- 大买卖单占比因子 (BigBuySell
xx):买卖单占比因子合并
- 小单占比因子与大单呈线性负相关,可直接通过大单因子反映。
  • 2.2.4 因子回测表现(表2至表5总结):

以大买单占比因子BigBuy1p0为例,5日换仓策略表现优异,RankIC均值达5.4%,胜率63-64%,多头年化收益率超过30%,最大回撤13-14%,夏普比率1.6以上;20日换仓时RankIC提升至7.9%,胜率70%,最大回撤更低约9%,仍保持较好收益水平。平滑因子相比原始因子稍逊。整体体现出大小单占比因子作为选股因子具有系统性的预测能力和稳定性。[page::2, 3, 4]

---

2.3 多维度解耦大小单因子分析



2.3.1 时间维度解耦


  • 逻辑与方法

原始委托订单聚合后难以直接分时间段。报告在逐笔订单级别先进行大小单判定,再按典型市场行为分段(开盘后15/30分钟、收盘前15/30分钟)提取大小单占比因子,目的捕捉隔夜知情交易者开盘快速交易和收盘前市场波动行为。
  • 构建因子数量

3种大小单阈值 × 4时间段 × 买卖双向 → 共24个时间维度解耦大小单占比因子。
  • 回测表现(表6~9)

以BigBuy
1p009301000(开盘后30分钟大买单因子)为代表,5日换仓RankIC下降至3.3-4.0%,胜率61-66%,年化收益约29-30%,最大回撤约13%,夏普比率1.5-1.6;20日换仓RankIC提升至4.5-7.4%,最大回撤降低至6-9%。时间解耦因子表现略逊于未解耦因子,但更能控制风险,收益更稳定。
  • 分析

时间解耦后因子RankIC下降,主要系非多头相关性下降,但多头收益保持较强关联,说明大小单因子对多头信号贡献大,体现了高度针对性的策略效应。

2.3.2 订单维度解耦


  • 逻辑与方法:

同一笔成交订单同时有买入卖出两方面大小单属性,订单维度解耦分为四类:大买单大卖单、大买单小卖单、小买单大卖单、小买单小卖单。
  • 构建因子数量

3个大小单标准 × 4组合形态 = 12个订单维度解耦因子。
  • 回测表现(表10~13)

大买单大卖单占比因子BigBuy
BigSell1p0表现最优,5日换仓RankIC高达6.7-6.9%,胜率70%以上,年化多头收益约31%,多空收益高达47%,夏普比率超过1.6,多空组合表现尤为突出;20日换仓相关指标进一步提升,最大回撤控制较好。
  • 分析

订单维度解耦对多头收益影响有限,但多空组合收益显著提升,因为大买单代表多头力量,大卖单代表空头力量,两者结合可更全面捕获市场动态,提高多空策略的表现力,尤以更高大单阈值效应更明显。

2.3.3 时间与订单维度多维度解耦


  • 构建因子数量

3个大小单标准 × 4时间段 × 4订单形态 = 48个多维度解耦大小单因子。
  • 回测表现(表14~17)

以开盘后半小时大买单大卖单因子BigBuy
BigSell1p009301000为例,5日换仓RankIC约3.3-4.5%,胜率61-67%,多头收益约29-30%,最大回撤14%左右;20日换仓RankIC最高达7.4%,胜率71-75%,收益约26-29%。收盘前半小时因子表现略弱,但整体仍优于时间或订单单一维度解耦。
  • 分析

多维度解耦因子综合了时间和订单视角信息,提高了因子细分和精准度,有望提升策略的风险调整后收益和稳定性。

---

2.4 精选大小单因子组合实证表现


  • 组合构建

从93个大小单因子中筛选出最优者,构建精选大小单因子组合,采用20日换仓策略。
  • 全市场表现(图2~4,表18):

- 200档分档组合结果显示多头截面表现显著,年化收益36.61%,最大回撤17.52%,夏普比率2.03。
- 相较中证全指获得33.07%超额收益。
- 累计收益图展示出优异的持续超额收益能力,RankIC图形显示因子正相关的统计显著性和稳定性。
  • 主要板块分档表现(沪深300、中证500、中证800、中证1000、创业板,图5~19,表19~23):

- 各板块精选因子组合多头均表现突出,年化收益分别达到:
沪深300:12.24%,回撤14.51%,夏普0.75,超额13.40%;
中证500:22.55%,回撤9.08%,夏普1.12,超额18.67%;
中证800:18.54%,回撤7.22%,夏普1.14,超额18.95%;
中证1000:24.61%,回撤10.43%,夏普1.36,超额17.39%;
创业板:36.20%,回撤25.15%,夏普1.59,超额25.07%。
  • 总结

精选大小单因子组合不仅在全市场层面表现出稳健的超额收益,也在各细分板块展现不同风格下优秀的盈利与风险控制能力,尤其在中小市值和创业板板块表现更为突出,验证了因子对不同市场环境的适应性。[page::16~25]

---

3. 图表深度解读



3.1 关键图表解读


  • 图1(高斯分布示意):展示大小单划定基于成交量分布的统计学依据,解释了为何选择均值+N倍标准差作为阈值的合理性,符合量化筛选标准,避免绝对金额导致的个股市值偏差影响。[page::3]
  • 图2(精选大小单因子组合200档分档收益)

梯形条形图显示从Q1至Q197(200档)因子强弱排序的收益表现,左侧Q1档组合收益突出,右侧档次收益降低,说明因子具有较强的区分能力。收益分布平滑且向好。[page::16]
  • 图3(累计收益曲线,全市场)

精选因子组合(Q1线条)累计收益持续向上明显优于中证全指及超额收益线,长期趋势稳健,验证策略的实际有效性。[page::16]
  • 图4(RankIC时间序列)

RankIC作为因子预测能力的统计指标,蓝色柱状图随机波动围绕正向,累积曲线稳步上升,显示因子整体预测稳定可靠,具备持续选股能力。[page::16]
  • 图5-19(各板块分档、累计收益、RankIC)

各板块图表前后对应分档收益表现、净值累计走势和时序RankIC变迁,整体规律与全市场类似,验证了因子在不同市场环境中的稳健适用性。具体每个板块腐蚀大小单因子在其市场特征下表现差异,创业板尤其收益及波动较高,反映成长型市场中因子敏感度更强。[page::17~24]

---

4. 估值分析



本文并未直接涉及企业估值或股票具体估值模型,主要集中于量化因子构建与测试。因子的本质为行情微观结构信号,不涉及DCF、市盈率等传统公司估值方法。因此不存在传统估值相关的模型输入、折现率或敏感性分析模块,核心关注因子有效性及回测表现。

---

5. 风险因素评估


  • 模型失效风险:量化模型基于历史统计规律,伴随市场政策、环境变化可能导致因子失效,策略表现不佳。

- 市场结构变化风险:交易行为及市场机制变化可能使因子信息含量下降,影响策略收益。
  • 模型异同风险:其他量化模型可能因数据使用、构造方式差异,对市场预测可能存在分歧,本报告观点不必然覆盖或兼容所有量化视角。


报告未明确给出风险缓解策略,但通过多维度解耦及组合筛选提高因子普适性和稳定性,间接降低单一维度风险,提高策略鲁棒性。[page::0, 25]

---

6. 批判性视角与细微差别


  • 报告对大小单划定采用了统计学阈值优于绝对金额,但对成交量服从正态分布的假设存在简化,实际市场成交量可能呈偏态或多峰态,阈值设计仍有提升空间。

- 时间维度分段划分虽基于市场行为逻辑,但具体时段选择较为粗糙,未来可结合更加细粒度的市场流动性、成交密度等指标进一步细化。
  • 多空组合收益提升表明大小单因子分拆视角有效,但并未对冲击成本、交易成本等具体实现细节展开讨论,实际应用中的滑点影响可能较大。

- 等比分档组合表现虽优,但未进一步探讨因子间相关性及组合权重构造,策略多样化潜力未完全挖掘。
  • 报告侧重于量化验证,未加入宏观和政策因素对模型影响的动态调整机制,或对特殊市场事件下因子表现的异常情况分析。

- 风险披露公平合理,但对市场极端变化条件下可能造成的亏损或策略崩塌描述相对保守,建议后续研究加强压力测试。

---

7. 结论性综合



本报告围绕A股市场Level 2逐笔订单数据,从订单大小视角创新构建了多达94个大小单占比因子,综合采用时间维度解耦、订单维度解耦及两维多维度解耦方法,成功挖掘交易信号,丰富了量化因子库。经过系统化量化回测,精选大小单因子组合展现出在全市场及沪深300、中证500、800、1000和创业板各主要板块的稳健投资价值,尤其在中小市值及创业板表现亮眼,显示出强劲的多头收益能力、较低的最大回撤率和优异的夏普比率。

因子以成交量的统计学划分作为大小单判定依据,基于严谨的市场微观结构数据和分解方法,确保了因子物理经济意义与市场实际活动紧密相关。精选因子组合在长期稳定的RankIC、超额收益和收益风险比上均有良好表现,具备较高的实用价值。

图表数据充分佐证了文本论述,展现出大小单因子的分档收益梯度、累计收益曲线及RankIC走势均表明因子具备持续的预测能力与策略执行可操作性,是A股量化投资新兴且重要的一环。

报告同时诚实披露了模型的局限和潜在失效风险,强调策略需持续维护与优化,以适应市场动态变化。总体而言,本报告为量化投资者提供了一种基于海量Level 2订单信息的创新选股工具,具备显著的实践应用潜力和研究拓展价值。[page::0~26]

---

8. 重要图表索引



- 图2 精选大小单因子组合200档分档收益
- 图4 精选大小单因子组合RankIC(全市场)
  • (其他图表对应页码同上文描述)


---

综上,【广发金工】的本篇报告通过创新性地利用A股Level 2逐笔订单数据,提出并量化验证了多维度解耦的大小单因子体系,展现了显著的市场预测能力和策略实用价值。该研究方法和因子构建思路为我国市场微观结构研究与量化投资策略开发提供了宝贵的方向和实践依据。

以上为报告全文的详尽系统分析。

报告