`

选股因子系列研究(十一)——Level2 行情选股因子初探

创建于 更新于

摘要

本报告基于WIND提供的Level-2成交统计指标,构建了成交占比类与净买入比率类选股因子并进行了2010-2016年期间的回测。结果显示,成交占比类因子具备显著的中长期选股效果,年化收益超22%,部分因子夏普比率超过1.7,信息比率超2。净买入比率类因子表现较差。成交占比类因子多空收益受到市值、反转与换手率影响,剔除相关风险因子后依旧保持较好的选股能力,表明该类因子具有独立且有效的投资价值 [page::0][page::4][page::6][page::9][page::11][page::13]。

速读内容

  • Level-2行情数据详细介绍及其特征说明,涵盖从单笔成交金额与方向入手的多维度逐笔成交数据分析,为因子构建提供数据基础 [page::4]。

- 构建了两大类Level-2选股因子:
- 成交占比类:统计不同买卖单大小占比及成交方向比;
- 净买入比率类:计算买卖差额占成交金额比例 [page::4][page::5]。
  • 成交占比类因子分组收益表现明显:


- 连续竞价成交占比、中单、小单成交占比因子值越高,未来一个月收益越高;
- 特大单、大单成交占比因子值越低,未来收益越高;
- 成交占比类因子多头与空头收益较为均衡,表现强劲且稳定 [page::6]。
  • 成交占比类因子多空组合净值表现强劲,年化收益超过22%,部分因子达27%,夏普比率1.7以上,月度胜率超70%:


- 表5数据展示了各因子详细绩效指标,支持上述结论 [page::7]。
  • 净买入比率类因子表现较弱:



- 分组收益无明显单调性;
- 年化收益基本低于6%,尾盘净买入比率因子表现稍优,约10%;
- 夏普比率及信息比率均较低,投资价值有限 [page::8][page::9]。
  • 成交占比类因子风险特征分析:

- 市值特征表现出不同因子组间显著的市值单调关系,成交占比类因子多头组合偏小市值,空头组合偏大市值;

- 反转效应明显,成交占比因子多头组合股票前期涨幅较低,空头组合股票前期涨幅较高;

- 换手率分析显示成交占比因子中连续竞价占比因子多头组合股票换手率低,体现关注度较低的股票特征;
[page::10][page::11]
  • 风险因子剔除后因子表现:

- 通过截面回归剔除市值、反转及换手率影响,剔除后因子选股效果依旧明显,组间收益单调性保留,年化收益下降约10%;

- 表9、表10显示剔除前后多空收益对比,除大单成交占比外其余成交占比类因子多空收益仅小幅下滑;
- 相关性检验结果表明剔除效果较好,除部分因子外与风险因子相关性下降明显 [page::11][page::12][page::13]。
  • 总结:

- 成交占比类因子表现优秀,具有稳定的中长期选股能力;
- 净买入比率类因子表现较差,不建议单独使用;
- 风险调整后成交占比类因子仍保持良好收益,体现其独立有效性 [page::13]。

深度阅读

报告详尽分析 — 《选股因子系列研究(十一)——Level2 行情选股因子初探》



---

一、元数据与概览


  • 报告标题: 选股因子系列研究(十一)——Level2 行情选股因子初探

- 作者: 高道德、袁林青
  • 发布机构: 海通证券研究所

- 发布日期: 2016年
  • 研究主题: 基于 Level2 行情数据构建的选股因子研究,重点为成交占比类因子和净买入比率类因子,及其在A股市场的中长期选股效果回测。


此次报告核心诉求在于填补业界对于基于Level2行情数据的中长期选股因子挖掘不足,重点探讨通过Level2逐笔成交数据构建选股因子的有效性,尤其针对成交占比类因子的表现进行深入分析。报告以回测数据为基础,旨在为资金管理者与量化投资者提供基于高频次市场成交信息的选股新思路。报告结论指出,成交占比类因子展示了较好的选股鉴别能力,净买入比率类因子表现则较为一般。[page::0,4]

---

二、逐节深度解读



1. Level 2 类行情数据介绍


  • 关键内容与论点:

Level2行情数据在Level1基础上提供了更为详尽的买卖报价及逐笔成交信息,包括买卖委托价位、成交方向(主动买入/主动卖出)、单笔成交金额分类(特大单>100万、大单20万~100万、中单4万~20万、小单≤4万)等更细化内容。该类数据从信息维度丰富了投资决策基础。表1详细列出了Level2相较于Level1的新增数据点。
  • 支撑逻辑与假设:

由于Level1行情对买卖侧出价与成交的统计较粗糙,难以捕捉买卖力量的细节变化,Level2的分笔成交结构能量化主动与被动成交及单笔金额上的动向,因此潜藏着复杂且丰富的市场微观结构信号。
  • 重点数据点与指标:

重点基于WIND提供的Level2统计指标(详见表2)构建两个主要类因子:成交占比类(各类别买卖单占当日成交金额比率)和净买入比率类(买卖主动成交差额比例)。
  • 概念解析:

- 主动买入/卖出辨识机制:基于委托单时间优先和成交价格与最优报价的关系判定主动买卖方。
- 单笔成交级别区分:重要在于研究不同资金量级参与者的交易行为。
此部分内容为因子构建与后续分析打下坚实基础。[page::4,5]

---

2. Level 2 类选股因子构建


  • 关键内容:

详细介绍了因子设计原则,包括采用统一算法与数据源保证结果可复制性,利用买卖单绝对额与成交方向来定义因子。从买卖单大小和方向维度入手形成若干因子统计指标。
  • 逻辑依据:

由于Level2指标计算复杂且多算法版本共存,报告使用WIND标准算法输出,避免因技术差异导致的结果分歧,利于后续量化回测。
  • 因子分类:

① 成交占比类因子,反映不同成交单类别占股票当日成交额的比例。
② 净买入比率类因子,反映各单笔买卖成交主动买入减主动卖出占比,衡量买卖力量对比。

重点在于不同维度提取成交信息,为后续回测提供多角度因子群。[page::5]

---

3. 选股因子回测


  • 回测背景与规则:

回测覆盖2010年1月至2016年3月,样本覆盖全A股,月初调仓,交易成本双边千分之三,按照因子值十等分排序,涨跌停及停牌条件限制调仓。

3.1 成交占比类因子表现


  • 核心发现:

- 除特大单和大单成交占比外,因子值越高其预示股票后1个月收益越好(连续竞价、中单、小单成交占比);而特大单、大单呈反向关系,因子值越低后续收益越高。
- 因子表现出明显单调收益特征,表明具有较强的选股区分度。
- 多空组合年化收益基本超过22%,其中连续竞价成交占比、超大单成交占比年化收益超27%,夏普比率高于1.7,信息比率高于2,月度胜率达70%以上。
- 多空组合收益来源较为均衡,区别于一般因子“空头收益占多数”的现象。
  • 技术解读:

图1展现不同因子分组对应不同月度收益率,红色(连续竞价成交占比)、绿色(超大单)和黄色(中单)线均呈现明显非线性趋势。IC值统计显示因子月度预测能力显著。净值图(图2)进一步确认了因子长期上涨趋势及部分时间回撤,回撤与小市值股暴露风险相关。
  • 重要数字:

年化收益率22~27%,夏普比率>1.7,信息比率>2,月度胜率>70% 说明因子具有良好的风险调整收益表现和持续稳定性。
  • 结论: 成交占比因子为中长期有效选股因子,尤其是连续竞价和超大单成交占比表现最优。[page::5,6,7]


3.2 净买入比率类因子表现


  • 核心发现:

此类因子的组间收益单调性差,分组收益区分度弱,表现不如成交占比类因子。
- 年化收益低于6%,仅尾盘净买入比率偶有10%表现。
- 夏普比率普遍低于0.5,信息比率基本低于1,表明风险调整后收益不理想。
- 多空组合净值走势表现疲弱,且整体呈现弱势。
  • 解读:

反映市场主动买卖力量净差比例的简单因子未能有效预测后续收益,可能因该指标噪声大、信息利用不足或被市场迅速消化。
  • 图表说明: 图3显示分组收益无明确等级趋势,图4显示多空组合净值表现平缓至弱势。
  • 结论: 净买入比率类因子在当前模型和数据框架下未表现出显著选股价值。[page::7,8,9]


3.3 小结


  • 成交占比类因子整体表现优异,包含显著预测能力和回测收益。

- 净买入比率类因子表现一般,不建议作为核心选股因子。

---

4. 选股因子的风险特征分析



4.1 市值特征


  • 数据解读:

图5显示不同因子分组股票市值显著不同。
- 超大单、大单成交占比因子,高组别对应高市值股票。
- 连续竞价、中单、小单成交占比因子,高组别对应低市值股票。
  • 逻辑联系:

因此多头组合(高因子值)多为小市值或大市值股票依因子类别不同,因子收益与市值效应相关,小市值股票往往在A股跑赢大市值,推动因子收益。

4.2 反转特征


  • 图6显示各因子组股票过去1个月涨幅存在显著分布差异。

- 超大单、大单成交占比高组别股票前期涨幅偏高。
- 连续竞价、中单、小单成交占比高组对应前期涨幅偏低。
  • 说明因子组间存在反转特性,多头组合股票往往是前期表现较弱、具备反转潜力的股票,反转效应为因子收益贡献之一。


4.3 换手率特征


  • 图7显示除连续竞价成交占比外,大部分因子组换手率呈“两边低中间高”形态。

- 连续竞价成交占比因子组别越高,换手率越低,且该组伴随小市值股票特征。
  • 结合市值与换手率经验看,连续竞价成交占比因子选出的股票为低换手小市值组合,可能反映投资者关注度较低,触发未来表现机遇。


4.4 风险因子剔除


  • 模型采用截面回归剔除市值、反转(前1个月涨幅)、换手率后因子的残差作为新因子值。

- 剔除后因子收益单调性降低但仍存在,表现略降但未消失。
  • 表9、表10显示,多空收益及年化收益降幅在0.4%-0.6%,年化收益下降约10%。

- 说明成交占比类因子选股性能部分依赖于上述风险因子,但仍具备独立选股能力。

4.5 相关性检验


  • 表11表明剔除市值效应后,成交占比类因子与市值仍存在较强显著正相关(>0.6)。

- 反转和换手率剔除效果较好,相关性明显减弱且显著性不强。
  • 结果表明市值因素对因子解释力最强,但反转和换手影响较小或可控。


---

三、图表深度解读



图1 成交占比类选股因子分组收益情况


  • 展示了不同因子值分组的月度超额收益,线条色彩指不同单笔成交类别占比因子。

- 连续竞价、中单、小单成交占比因子收益随因子值升高单调增加,表明高成交占比预示未来回报正向。
  • 超大单、大单成交占比因子表现相反,因子值越低,未来收益越好。

- 说明不同规模换手行为对未来收益信号差异显著。

图2 成交占比类因子多空组合净值表现


  • 各因子对应的多空组合净值走势,年化收益与波动表现明显。

- 连续竞价成交占比和超大单成交占比表现最好,净值线走势稳健上升。
  • 2014年末出现回撤,提示小市值风险暴露。


图3-4 净买入比率类因子表现图


  • 分组收益和多空组合净值无显著单调趋势或盈利趋势,验证其较弱的预测性能。


图5-7 风险因子特征图(市值、反转、换手率)


  • 各因子组内股票特征差异明显。市值与成交占比类因子高度关联,反转特征对收益解释有重要作用,换手率表现复杂,连续竞价因子对应低换手小市值股。


图8 剔除风险因子后成交占比类因子分组收益


  • 维持明显的组间收益单调性,说明因子核心信息仍在剔除风险后保留,支持因子的独立性及有效性。


---

四、估值分析



本报告聚焦因子构建与回测分析,未对具体上市公司或行业进行估值测算,因此无DCF、PE等估值方法论述。

---

五、风险因素评估


  • 政策变动风险: 政策导向及监管变化可能影响市场结构及因子有效性。

- 流动性缺失风险: 特别是小市值股票的流动性问题,可能放大回撤或影响实际交易执行。
  • 市场系统性风险: 宏观经济及整体市场波动可能压制因子选股效果。


报告虽然披露了主要风险提示,但未对风险概率和缓解策略进行系统展开,属于常规声明范畴。[page::0,13]

---

六、批判性视角与细微差别


  • 报告整体结构严谨,方法清晰,结论与数据深度匹配。

- 该研究充分考虑了市场惯性及因子共性风险,通过多因子剔除提升因子纯净度,提升研究可信度。
  • 但仍存在几点需审慎:


- 剔除风险因子后因子与市值仍显著相关,说明因子独立性受限,可能导致收益解释权部分依赖市值效应。
- 净买入比率类因子表现不佳,报告未进一步探讨其潜在原因或是否需更复杂模型挖掘,相比成交占比因子相关讨论不足。
- 回测期间跨越了多轮牛熊市,报告未明确分市行情的因子表现差异,缺乏对因子时变性的深入分析。
- 尽管披露了政策及流动性风险,但未提出具体应对建议或模型调整策略。
  • 总体来说,报告注重因子验证但对应用限制及潜在过拟合风险强调不足。


---

七、结论性综合



本报告基于细粒度Level2行情数据,从逐笔成交的成交占比和净买入比率两个角度构建了选股因子。通过对2010年至2016年A股市场的回测,得出以下核心结论:
  • 成交占比类因子表现优异,具有明显正向的月度预测能力。 成交占比因子组别与未来收益呈强单调相关性,组合净值稳步上升,年化收益超过22%且夏普比率和信息比率均表现卓越,表明因子不仅收益高且波动调整效果良好。多空收益均衡,区别于常见反转类因子多依赖空头收益的表现。
  • 净买入比率类因子表现较弱,选择价值有限。 该类因子未能展示有效的收益区分能力,多空组合表现不佳,提示基于净买卖动向净差的直接信号信息含量不足。
  • 风险特征分析显示,成交占比类因子与市值、反转及换手率显著相关。 其中市值效应最为突出,小市值股票对应的因子组别偏高,且反转效应为因子收益提供部分解释。通过截面回归剔除市值、反转、换手率风险因素后,因子依然保持了较强的选股能力,说明因子含有独立的有效信号。
  • 回测图表视觉呈现了因子收益随因子值变化的稳定且强烈的趋势,强化了文字论述的可信度。 特别是成交占比类因子的多空组合净值持续上升,且统计指标支持其收益的稳健性。
  • 风险提示中强调了政策、流动性和市场系统性风险对因子表现可能产生的影响。 研究者提醒投资者应关注外部风险环境的变化对策略的冲击。


综上,报告系统地揭示了基于Level2逐笔成交数据的选股因子的投资价值,特别是成交占比类因子在A股市场展现了显著的中长期选股能力。该因子有助于投资者构建更精准的多因子模型,拓展基于市场微观结构数据的研究和应用边界。

---

附录 —— 关键图表



图1 成交占比类选股因子分组收益情况




图2 成交占比类因子多空组合净值表现




图3 净买入比率类选股因子分组收益情况




图4 净买入比率类因子多空组合净值表现




图5 成交占比类因子市值分布特征




图6 成交占比类因子前1个月涨跌幅分布特征




图7 成交占比类因子换手率分布特征




图8 剔除风险因子后成交占比类选股因子分组收益情况




---

【全文结束】[page::0,1,2,3,4,5,6,7,8,9,10,11,12,13]

报告