`

选股因子系列研究(四十六)——日内分时成交中的玄机

创建于 更新于

摘要

本报告基于日内1分钟成交笔数数据构建了多种分时成交因子,重点提出平均单笔流出金额占比因子选股效果显著,正相关于未来收益,而大单资金净流入率及大单驱动涨幅等因子则呈现负相关的反转特征。引入这些因子后,多因子模型的选股效果和年化收益率均有所提高,显示了日内分时成交信息的独特价值[page::0][page::5][page::15][page::16]。

速读内容

  • 平均单笔成交金额类因子表现概述 [page::6][page::7]


- 原始平均单笔成交金额IC均值偏弱(-1.6%),选股效果较差。
- 正交后IC提升至2.7%,多空组合月均收益差达1.08%,显示控制市值等因子后的有效信息。
- 因子与市值高度正相关,需注意市值影响。


  • 平均单笔流出金额占比因子表现优异 [page::7][page::8]



- 因子IC和rank IC均值分别达5.8%和7.4%,IC-IR为2.76,多空组合月均收益差1.65%。
- 正交后仍显著,IC均值3.2%,月均收益超过1%。
- 双重分组法验证其独立的选股能力,Fama-Macbeth回归结果显示月均溢价0.31%,统计显著。


  • 大单资金流向因子定义及表现 [page::11][page::12][page::13]

- 以平均单笔成交金额排名前20%-30%的分钟K线定义大单样本,计算大单资金净流入率和大单驱动涨幅。
- 大单资金净流入率因子与未来收益显著负相关,rank IC约-5.6%,多空组合月均收益差-1.56%。

- 大单驱动涨幅因子同样负相关,rank IC约-8.2%,月均收益差-2.23%。

  • 大单资金流向因子双重分组及Fama-Macbeth回归结果表明其负向显著性 [page::12][page::13]

| 因子名称 | 月均收益差(多空组合) | rank IC | rank IC-IR | 回归溢价(%) | t值 |
|------------------|----------------------|---------|------------|-------------|--------|
| 大单资金净流入率 | -1.56% | -5.6% | -2.77 | -0.26 | -8.98 |
| 大单驱动涨幅 | -2.23% | -8.2% | -4.12 | -0.30 | -10.93 |
- 因子在不同参数下表现稳健,具有一定的抗风险能力。
  • 因子间相关性与多因子模型提升分析 [page::14][page::15]



- 三类因子相关度较高,最终挑选平均单笔流出金额占比、大单资金净流入及大单驱动涨幅因子。
- 同时回归中大单资金净流入因子显著性降低,显示其信息被部分覆盖。
- 加入分时成交因子后改进模型IC、IR、胜率均提升,年化收益率由33.10%升至34.93%。
  • 日内分时成交因子反转特征及主力操纵现象分析 [page::10]



- 大单买卖行为前往往伴随挂单量异常跳升,表面活跃下实际为主力“对倒”操纵行为,诱使散户跟进。
- 该行为导致因子呈现明显的反转走势,可能源于市场的风险补偿需求。
  • 风险提示 [page::0][page::16]

- 因子失效风险及流动性风险需关注。

深度阅读

报告详尽分析报告



---

一、元数据与概览


  • 报告标题:《选股因子系列研究(四十六)——日内分时成交中的玄机》

- 分析师:冯佳睿、姚石
  • 发布机构:海通证券研究所

- 联系方式:部分电话、邮箱详见正文
  • 报告时间:未明确日期,数据回测区间为2010年1月至2019年3月

- 研究主题:面向股票市场,基于“日内分时成交笔数”的高频数据,构建并研究多种选股因子,探索其对股票收益率的预测价值以及其在多因子模型中的改进作用。

核心论点与目标



本报告继承前期《高频量价因子在股票与期货中的表现》的研究基础,引入了成交笔数作为新的基础数据,构建了多个日内分时成交因子,包括“平均单笔成交金额类因子”和“大单资金流向因子”,进而分析这些因子的选股能力及在多因子模型中的增益效果,最后提出风险提示。

主要发现包括:
  • 平均单笔流出金额占比和大单资金相关因子表现出明显的选股能力,尤其是前者表现更稳健且具有统计显著性。

- 大单资金流向因子与股票的未来收益呈负相关,暗示大单资金流入可能带来短期的价格压力或波动。
  • 将这些日内分时成交因子引入现有多因子模型后,模型预测能力(IC、IR)和投资组合表现均有所提升。

- 风险提示主要聚焦因子可能失效及流动性风险。

本报告旨在为投资者提供基于高频分时数据的选股新视角和增强的量化策略因子。[page::0,5]

---

二、章节深度解读



1. 回测参数设置


  • 数据区间:2010年1月至2019年3月,充分涵盖不同市场周期。

- 样本筛选:剔除ST股票、停牌、涨跌停以及上市时间不足6个月和退市前一个月内股票,保证样本质量。
  • 价格取值:成交价采用次日开盘后半小时的VWAP(成交量加权均价)。

- 交易成本:双边千分之三。
  • 其他细节:剔除集合竞价时期的成交数据,剔除当日价格大部分时间无波动的交易日(超过25%时长价格未变),排除异常样本。


此外,报告区分了原始因子和正交因子,后者通过横截面回归剔除已知风格因子(行业、市值、反转等),以减少多重共线性和提升因子纯净度。[page::5]

---

2. 平均单笔成交金额类因子



2.1 因子定义


  • 利用股票𝑖每日分钟级的收益率 $\boldsymbol{r}{ij}$ 、成交金额 $Amt{ij}$ 和成交笔数 $TrdNum{ij}$ 构建:

- 平均单笔成交金额: $\displaystyle AmtPerTrd
i = \frac{\sum{j=1}^N Amt{ij}}{\sum{j=1}^N TrdNum{ij}}$
- 平均单笔流入金额:成交为正收益时的平均成交额
- 平均单笔流出金额:成交为负收益时的平均成交额
- 将单笔流入流出金额占总成交金额的比率作为标准化指标,剔除市值效应。

通过案例分析(股票A和股票B,2019年1月31日),展现异常大单买入/卖出如何驱动成交金额占比较高。

2.2 平均单笔成交金额选股效果较弱


  • 原始因子IC均值为负(-1.6%),多空组合月均收益差仅0.29%,主要因该指标与市值高度正相关(大市值股票往往成交金额较大)。

- 通过因子正交剔除市值及其他风格影响后,因子表现反转,IC和rank IC均为正(2.7%、3.8%),且多空组合月均收益差提高到1.08%,表明调整后平均单笔成交金额较小的股票收益相对较好。
  • 相关性分析显示因子与市值呈强正相关,同时与换手率、反转等因子呈一定负相关。


图表详解:


  • 图3(平均单笔成交金额分组收益):展示因子分组由1至10,绝对收益呈下降趋势(大单笔成交股票表现较差),超额收益不明显。

- 图4(相关性分析):市值呈现快速上升趋势,表明强相关。
  • 图5(正交因子分组收益):收益序列明显上升趋势,说明去除市值等影响后,分组收益改善。

- 图6(因子IC时间序列):累积IC逐年改善,显示因子稳定增强。

2.3 平均单笔流出金额占比因子表现优异


  • 原始因子IC和rank IC均值分别为5.8%和7.4%,IC-IR达到2.76,说明该因子具有明显的预测能力。

- 多空组合月均收益差1.65%,正向占比高达80%,统计显著。
  • 该因子与非流动性呈正相关,与换手率、市值、PB负相关,显示其独立性较好。


图表详解:


  • 图7-8(分组收益和多空净值):收益稳步上升,多空组合净值持续攀升,表现稳定。

- 图9(IC时间序列):整个时间区间IC均为正,累计IC有明显递增趋势。
  • 图10(相关性):清晰体现该因子与其他主流因子低相关,有利于模型增益。

- 图11-12(正交因子成果):剔除多重因子影响后,效果仍明显,IC-IR超过4,多空收益差逾1%。

双重分组分析与Fama-Macbeth回归(表2、3)


  • 双重分组控制5个常见因子,因子分组收益依然单调上升,首尾组合月均收益差均超过1%。

- Fama-Macbeth截面回归结果显示,因子月均溢价达到0.31%,t值高达11.97,统计显著。[page::6,7,8]

2.4 - 2.5 平均单笔流入金额占比及流入流出比


  • 平均单笔流入金额占比因子表现弱且负相关未来收益,IC均值约为-2%,多空组合月均收益差0.86%。

- 平均单笔流入流出金额之比因子亦为反向因子,rank IC均值-3%左右,多空组合收益差超1%。

相应图表(13-20页)显示了因子表现、相关性、正交后情况,均体现出该类因子的预测能力相对较弱且负向。

2.6 小结


  • 平均单笔流出金额占比因子作为最优表现因子与股票未来收益呈正相关。

- 反转性质明显,解释原因包括市场对日内大幅波动的风险补偿,以及大单交易可能包含主力对倒操纵行为。
  • 通过盘口挂单数据观察交易行为,验证了主力预设大单并通过委托量引诱散户跟风的市场微结构假设。

- 图21、图22展现典型“对倒”委托量突增现象,佐证逻辑。[page::9,10]

---

3. 大单资金流向类因子



3.1 因子定义


  • 以日内1分钟频率计算平均单笔成交金额,取该指标排名前N%的分钟k线作为“大单成交”样本,常用N为10%、20%、30%。

- 针对大单成交样本,定义:
- 大单资金净流入金额:所有“涨”分钟成交金额减去“跌”分钟成交金额。
- 大单资金净流入率:净流入金额占当日全部成交金额比率。
- 大单驱动涨幅(Mom_bigOrder):大单样本分钟收益1+收益的乘积。

计算方法注重动态筛选高成交金额分钟,区别于静态划分有更灵活的适应性。

3.2 大单资金净流入率


  • 对N=20%样本,因子rank IC均为负(原始约-5.6%,正交后-2.2%),多空组合月均收益差均显著为负,约-1.56%及-0.97%。

- 表明大单资金净流入反向预测收益,可能指示短期价格承压。

图23-26直观反映了分组收益递减、负相关性及IC持续为负的趋势。

3.3 大单驱动涨幅


  • N=30%样本表现更明显,rank IC达到-8.2%,负向占比高达92%。

- 多空组合月均收益差更大,最大幅度约-2.23%,统计显著。

图27-30体现了明显的反转信号,大盘需警惕该因子代表短期反转风险。

3.4 参数敏感性分析


  • 表8、9展示因子在不同N值和参数设定下均保持选股效果,表现稳健且敏感度较低。


3.5 小结


  • 大单资金流向因子为反转类因子,动态筛选方法区别于Wind水平2数据的静态分类,可能导致因子表现差异。

- 因子预测未来收益为负,对于理解市场短期大单行为提供有力工具。[page::11-14]

---

4. 日内分时成交因子对现有模型的改进



4.1 因子相关性分析


  • 图31-34相关矩阵显示日内分时成交相关因子之间相关性较高,精选代表性因子:

- 平均单笔流出金额占比
- 大单资金净流入率(N=20%)
- 大单驱动涨幅(N=30%)

回归分析表10显示,在三个因子共同回归情况下,大单资金净流入因子不显著,平均单笔流出金额占比和大单驱动涨幅持续显著,表明后两者更高效信息集中。

4.2 多因子模型改进效果


  • 基准模型9因子(市值、反转、换手等)基础上,逐步加入成交因子,形成3个改进模型。


表11重要指标比较:

| 模型 | rank IC | rank IC-IR | 预期收益最高的100只股票年化收益率 |
|----------------|-------|----------|-----------------------------|
| 基准9因子 | 13.21% | 4.08 | 33.10% |
| 加入平均单笔流出金额占比 | 13.35% | 4.13 | 33.98% |
| 加入大单驱动涨幅 | 13.35% | 4.13 | 34.32% |
| 两因子同时加入 | 13.64% | 4.26 | 34.93% |
  • 日内分时成交因子提升模型信号纯度和投资组合收益表现。

- 预示该类新因子具备实际应用价值,拓展了交易信号来源。

---

5. 总结


  • 使用分钟级数据构建的多种日内分时成交因子中,平均单笔流出金额占比表现最佳,选股能力强且稳定。

- 大单资金流向类因子作为反转指标能有效捕捉短期价格异常和主力操纵可能性。
  • 交易行为及盘口差异揭示了主力利用盘口“对倒”诱导散户的可能路径,提供了市场微观结构视角的补充。

- 因子组合加入现有经典多因子模型,提升模型IC、IR及组合收益率,具有推广使用价值。
  • 报告整体强调日内高频数据作为量化分析的丰富源泉,在捕捉短期风险和机会上潜力巨大。


---

6. 风险提示


  • 因子失效风险:市场结构、行情变化可能导致因子效果减弱或失效。

- 流动性风险:部分因子可能依赖于较高流动性股票,流动性不足时效果降低。
  • 以上风险须警惕在实际模型应用和交易执行中可能产生的负面影响。[page::0,16]


---

三、重要图表深度解读



图1与图2:股票A与B的日内分时走势(20190131)


  • 分时图反映特定分钟的异常成交波动,股票A在9:43有显著放量大单买入,股票B在14:14有大单卖出。

- 该现象验证成交笔数与成交额共同构造因子的合理性,且指标响应具备代表性。

表1:股票A逐笔成交明细


  • 多笔连续买入的成交明细证实了分时成交数据的异常集中,买卖委托序列一致增强对“对倒行为”的猜测。


图3-6、图7-12:(平均单笔成交金额及流出金额占比因子相关图)


  • 收益分组图表显示,分组方法有效区分未来表现,涨幅与因子分组呈明显单调关系。

- IC时间序列展现因子稳定性,累积IC持续正向并有上升趋势印证其长期有效性。
  • 相关分析图呈现因子低相关性,增强与模型中其他因子共存的可能。


表2与表3:双重分组和Fama-Macbeth检验


  • 双重分组显著控制了市值、换手率等因子后,仍保留了因子解释能力,验证因子稳健。

- Fama-Macbeth回归统计指标(高t值及月均溢价)体现因子统计学显著性。

图21与图22:盘口委托量急剧变化


  • 大单买入前委卖量突增,大单卖出前委买量骤升,形成成交前的“诱导”效应,验证主力操纵推测,体现高频市场的复杂微结构。


图23-30:大单资金净流入率与大单驱动涨幅因子表现


  • 多空组合收益及IC曲线均负向,表明资金净流入并非利好信号,可能解释为短期获利回吐或操纵成本。

- 相关性图再次展示因子与核心风格因子的低一致性,因子具备独特信息量。

图31-34:因子相关性矩阵


  • 相关因子高度相关,提示因子间的共线性强,在模型构建时需挑选最具代表性的因子以保证模型稳定性。


---

四、批判性视角与细微差别


  • 因子构建依赖于分钟级别高频数据,数据质量和处理的细节对因子有效性影响较大,该点报告未详述,留给读者一定理解空间。

- 大单资金流入与未来收益的负相关特征与多数直觉和其他研究略有不同,报告归因于动态划分与市场环境,但仍需在不同市场周期或样本验证。
  • 报告强调主力操纵“对倒”行为,但实际结构尚需结合监管、市场行为学进一步验证。

- 选股因子虽对多因子模型有所提升,但IC增益幅度有限,投资实操中还需考虑其他风险管理和组合构建问题。
  • 报告中部分正交后的因子表现变异较大,侧面说明市场风格因素交叉复杂,需要持续动态监控因子有效性。


---

五、结论性综合



本报告系统地构建并验证了基于日内分钟级成交笔数与成交金额交叉的多维度选股因子。主要贡献与洞察如下:
  • 因子创新:将“成交笔数”引入因子框架,创新性地构造了平均单笔成交金额相关因子及基于大单成交样本的资金流向因子。

- 选股能力:平均单笔流出金额占比因子作为表现最佳的指标,表现出持续且显著的正向选股能力,且通过多种统计检验确认其稳健性。
  • 反转特征发现:大单资金净流入率和大单驱动涨幅因子作为反向因子揭示了市场中短期反转趋势,提示潜在操纵风险与价格波动。

- 价格行为与市场微结构分析:从盘口挂单变化、逐笔成交细节观察,报告揭示了主力可能采用的诱导“对倒”策略,丰富了量化因子背后的市场行为解释。
  • 模型增益:将日内分时成交因子嵌入常规模型,提升IC值和投资收益率,验证实战潜力。

- 风险与局限:因子失效及流动性风险需重点关注,数据质量和市场变化对因子有效性的影响不可忽视。

总的来看,本报告结合高频数据深入挖掘市场微观结构信号,为量化选股和多因子模型优化提供了有效工具和理论支持,具有较高的研究价值和实践指导意义。[page::0-16]

---

参考主要图表精选



图1 股票A日内分时走势

图7 平均单笔流出金额占比因子分组收益

图23 大单资金净流入率因子分组收益

图27 大单驱动涨幅因子分组收益

图31 原始因子值相关性

---

附注



为保证内容完整,本文严格按照报告结构逐章节梳理所有因子定义、研究方法、回测结果及理论解释,涵盖所有主要表格、图表及回归分析,确保细节详尽且紧贴报告原意,便于读者全面理解本研究成果及其应用价值。[page::0-16]

报告