选股因子系列研究(五十七)——基于主动买入行为的选股因子
创建于 更新于
摘要
本报告基于逐笔成交数据的BS标志,构建主买占比和主买强度两类量化因子,刻画投资者主动买入行为。回测显示,在剔除常规低频因子后,部分因子依旧展现显著的月度选股能力,尤其在沪深300指数内表现更佳且多头效应明显。日内主买强度因子选股能力最强,日间相关因子也具备一定能力但较弱。因子与低频技术因子存在相关性,风险主要来自市场系统性风险及流动性风险 [page::0][page::4][page::5][page::15][page::19]
速读内容
- 因子构建方法基于逐笔成交数据中“主动买入”(B)与“主动卖出”(S)标志,降频合成分钟级主动买入金额及主动卖出金额,构建两类因子:主买占比因子(占全天或同时段成交金额比例)及主买强度因子(均值与标准差相关指标),计算分时间段(日内全天、开盘后、盘中、收盘前)因子值 [page::4][page::5]。
- 主买占比类因子正交后表现突出,盘中主买占比因子年化多空收益最高达14.1%,全天、开盘后、盘中主买占比均为明显动量因子,收盘前因子表现为反转效应。因子分10组超额收益明显且回归法检验月均溢价达0.2%-0.3%。



- 日内主买强度类因子选股能力显著,日内净主买强度因子与未来收益正相关,年化多空收益达约11.7%-14.8%,表现稳定且正交后收益单调性提升,回归测算月均溢价且累计净值持续上涨。



- 日间主买强度及主买占比强度因子选股能力相对日内因子较弱,但仍具一定水平。日间主买强度因子正交后表现最佳时段为开盘后及盘中,年化多空收益约9%左右,主买占比强度因子开盘后表现最优,年化多空收益超10%。相关因子的多空组合累计净值呈稳步增长趋势。



- 因子相关性分析显示:主买占比因子主要与股票前期涨幅正相关,部分与换手率、波动率相关;日内主买强度因子与市值、换手率、波动率相关性强;日间主买强度因子相关性弱,但净主买强度因子与涨幅相关性较强。
- 选股范围上,因子在沪深300指数内表现最佳,多头效应更明显。例如全天主买占比因子在沪深300的月度多空收益达1.45%,显著高于全市场及中证500表现。日内主买强度因子及日间主买占比强度因子同样在沪深300内展现较强选股能力。[page::15][page::16][page::17][page::18]
- 调仓频率影响显示,从月度调仓调整为半月调仓,大部分因子多空年化收益提升,进一步缩短调仓周期未显著提高收益,且日间因子因计算窗限制未充分测试半月及周度调仓表现 [page::19].
- 风险提示包括市场系统性风险、资产流动性风险及政策变动风险对策略表现的潜在影响。[page::0][page::19]
深度阅读
《选股因子系列研究(五十七)——基于主动买入行为的选股因子》报告详尽分析
---
1. 元数据与概览
- 报告标题:《选股因子系列研究(五十七)——基于主动买入行为的选股因子》
- 作者及联系方式:冯佳睿(fengjr@htsec.com)、袁林青(ylq9619@htsec.com)
- 发布机构:海通证券研究所
- 发布日期:2020年1月左右(报告中不同数据区间为2013年1月至2019年12月31日)
- 研究主题:基于逐笔成交数据中的主动买入行为构建选股因子,利用高频数据提炼投资者买卖行为特征,探讨其选股能力和投资价值。
核心论点:
报告基于“BS标志”(逐笔成交数据中体现买卖主动方)的高频交易信息,通过构建主买占比和主买强度两类选股因子,重点分析了它们的月度选股能力,及其在不同市场范围、调仓频率下的表现。同时剔除常规低频因子的影响后,发现这些因子依然表现出一定的显著选股能力,特别是在沪深300指数内更为有效,呈现较强的多头表现。风险提示主要包括系统性风险、流动性风险和政策风险等。
---
2. 逐节深度解读
2.1 研究背景与因子构建(第1章)
报告通过分析逐笔成交数据中的“BS标志”,将成交单分成主动买入(B)与主动卖出(S),用于准确捕捉投资者主动买卖行为。然后将逐笔成交金额降频合成至分钟级,具体计算了“主买占比”与“主买强度”两类因子:
- 主买占比:某时间段内主动买入金额占该时间段总成交金额比例,分为“占全天成交”与“占同时段成交”两种量度。
- 主买强度:基于主动买入金额的均值及标准差计算日内买入强度,以及净买入金额(主动买入减主动卖出)的均值与标准差计算净主买强度。
其中,针对涨跌停板特殊成交情况(涨停时买方先挂单,卖方主动成交等),相应分钟内的主动买入与主动卖出金额被剔除,以避免数据歧义。
因子被计算在不同时间段:全天交易时段(9:30–14:56)、开盘后(9:30–9:59)、盘中时段(10:00–14:26)、收盘前(14:27–14:56),后续以窗口期均值处理(例如月度因子即为20日均值)[page::4][page::5]。
---
2.2 因子选股能力分析(第2章)
2.2.1 主买占比类因子
- 正交前后选股能力差异:
- 原始主买占比因子表现较弱;
- 剔除市值等常规低频因子后(正交处理),全天、开盘后、盘中及收盘前主买占比因子均表现出显著的选股能力,月均IC值约0.02~0.03,年化ICIR介于2.0~2.5间。
- 收盘前主买占比与未来1个月收益呈负相关,表现出反转效应;而其他时间段则表现为动量效应。
- 年化多空收益:
- 盘中主买占比因子表现最佳,多空年化收益达到14.1%;
- 收盘前主买占比次之,为12.4%;
- 全天与开盘后分别为8.8%和9.5%。
- 年度多空收益(表3)显示自2016年以来表现更为突出,2019年全天和盘中主买占比因子多空收益均超20%。
- 多元回归检验(图4、表4):因子月均溢价在0.2%-0.3%,盘中主买占比因子胜率高达80%[page::5][page::6][page::7]。
2.2.2 日内主买强度类因子
- 正交前: 基本呈现显著选股能力,但因与市值相关度较高(0.40),该因子与股票未来收益呈负相关;而日内净主买强度因子(买入减卖出金额均值与波动的标准化指标)则与未来收益呈正相关,但原始选股能力较弱。
- 正交后: 日内主买强度因子负相关关系弱化,但多空收益降低;日内净主买强度因子表现出较为稳定的选股能力,月均IC大多维持在0.03-0.04,年化ICIR及月度胜率均较高。
- 多空收益年化: 全天与盘中日内净主买强度均约11.7%,开盘后最高达14.8%。
- 年度表现(表6)及回归法累计净值(图8、表7)确认日内净主买强度因子具有稳定选股能力[page::8][page::9][page::10]。
2.2.3 日间主买强度类因子
- 通过使用日度总成交数据计算,方便投资者使用。
- 原始因子与未来收益正相关,但只有部分因子在剔除低频因子后依旧有效,主要是开盘后与盘中时段的日间净主买强度。
- 其累计净值及分年度表现实证了其一定的选股能力,但弱于日内主买强度类因子[page::10][page::11][page::12]。
2.2.4 日间主买占比强度类因子
- 使用主买占比分布降低成交额波动影响。
- 在剔除常规因子后,上述因子普遍呈现较为显著的截面选股能力,月IC达到0.02~0.03,年化ICIR约1.5~2.5。
- 多空收益稳健,开盘后日间净主买占比强度年化收益超过10%。
- 尽管如此,整体选股能力仍弱于日内主买强度类因子。
- 回归检验累计净值亦表明这一趋势[page::12][page::13][page::14][page::15].
---
2.3 相关性分析(第3章)
- 日内主买强度因子相关性较强:
- 与市值相关性最高,超0.40;
- 其次与换手率、波动率正相关;
- 日间主买强度因子与低频因子相关较弱,净主买强度因子与前期涨幅呈正相关。
---
2.4 不同选股范围与调仓频率影响(第4章)
2.4.1 不同选股范围内因子表现
- 因子在沪深300指数内表现出更强选股能力和多头收益,多空分化更清晰。
- 以主买占比类因子为例,全天因子在全市场月度多空收益为0.73%,中证500为0.42%,沪深300高达1.45%,其多头收益达0.75%。
- 日内主买强度和日间主买强度类因子也呈现类似趋势,沪深300指数内因子选股效果最好,且多头效果显著提升。例如全天日内净主买强度因子:全市场多空收益0.95%,多头收益仅0.16%,沪深300多空收益0.96%,多头收益达0.69%。
- 日间主买占比强度类因子同样在沪深300指数中表现较好,明显胜于中证500指数[page::17][page::18].
2.4.2 不同调仓频率影响
- 调仓频率分别为每月、半月及每周;
- 总体观察,调仓从月度提升至半月,多数因子多空年化收益提升明显,但从半月提升至每周并无明显进一步增益。
- 部分日间因子由于计算所需数据周期较长,未公开半月及周度回测结果。
- 说明调仓频率与因子计算窗口存在一定优化空间,值得进一步研究[page::19].
---
2.5 结论与风险提示(第5章和第6章)
- 本文首次系统构建基于逐笔成交主动买入的高频因子,利用分钟级及日频数据提炼主买占比与主买强度两大类因子。
- 回测数据显示,该类因子在剔除常规低频因子后仍拥有显著的月度选股能力,且这类因子在沪深300成份股中的表现更为优异,呈现强多头特征。
- 风险方面,作者重点提示系统性市场风险、资产流动性风险及政策风险,这些因素可能导致策略表现波动或失效。
- 报告充分识别并消除了涨跌停板期间数据异常,设计科学,回测时长覆盖7年,覆盖了多个市场环境,增强其稳健性和可信度[page::19].
---
3. 图表深度解读
3.1 图表解读示例
图1和图2(页6)
- 解读:
- 正交前图中,超额收益分组曲线较为混乱,部分因子在低分组收益表现好,整体信噪比较弱,显示因子原始信号被常规因子部分掩盖。
- 正交后,分组收益曲线走势显著趋于单调递增,表明剔除常规因子后,因子的价值更纯粹,选股效力更加明显。
图3(页6)
- 趋势:
- 盘中主买占比表现最佳,累计超过2.5倍净值增长;
- 收盘前因子净值增长略低,动量与反转效应差异明显。
- 可看出因子长期表现稳定,多空组合具有良好的分化效果。
图4(页7)
- 解读:所有主买占比因子累计净值均呈上升趋势,验证了因子的独立有效性。
---
3.2 日内主买强度类因子图解(图5至图8,页8-9)
- 图5和图6分别展示因子分十组超额收益的正交前后情况,正交后线条更为规整,收益增强。
- 图7多空组合净值从1.0上涨至2.7左右,表现强劲稳定。
- 图8回归测算的净值同样表现优秀,验证了日内净主买强度因子的选股能力。
---
3.3 日间主买强度及主买占比强度类因子图示(页11-14)
- 图9到图12及图13到图16分别展示日间主买强度类及主买占比强度类因子的分组收益、净值走势。
- 这些日间因子表现相较日内因子更弱,净值增长幅度较小,但整体依然保持稳定上升趋势。
- 图15和图16突出开盘后日间净主买占比强度因子的突出表现,年化多空收益超过10%。
---
3.4 表格综合分析
- 表2/5/8/11呈现不同因子正交前后IC、月度多空收益对比,整体揭示剔除日常低频因子后高频因子选股能力明显提升。
- 表3/6/9/13分别报告因子年度表现,多数因子2016年后特别优秀,体现因子在稳健回测区间多阶段具备持续稳定性。
- 表15至18通过截面相关性研究,揭示部分因子与传统因子(如市值、换手率、波动率)存在相关性但不完全重合,有助于因子多样化组合。
- 表19至22覆盖不同选股范围,因子在大市值及沪深300内表现最优,提示策略适用范围及市场分层精细化管理价值。
- 表23展示调仓频率影响,半月调仓时多空收益最大,提供实际投资组合调仓参考依据。
---
4. 估值分析
报告核心内容为因子构造与选股能力回测,无明确估值分析部分,未涉及公司估值模型、估值倍数或DCF预测。
---
5. 风险因素评估
2. 资产流动性风险:在流动性紧张时,选股因子可能无法顺利转化成交易利润。
报告未具体量化风险出现概率或提供缓解策略,仅提醒投资者注意[page::0][page::19]。
---
6. 批判性视角与细节
- 因子与传统低频因子部分相关性(如日内主买强度与市值0.4),可能存在因子重叠及信息重复,策略组合需加以注意避免过度拟合或冗余。
- 收盘前主买占比的反转效应暗示因子维度有细分差异,对于不同时间段买卖行为的解释需更深入探讨。
- 调仓频率与因子计算窗口的关联存在优化空间,当前分析在半月及周度调仓方面较为粗放,实际应用应进行更细致参数调优。
- 统计指标(IC、ICIR等)偏低(多于0.02-0.04之间)但稳定,提示因子预测能力虽显著但仍存在边际效益限制。
- 因子来源数据为逐笔成交数据,具有较高的计算与数据支撑门槛,实际运用受限于数据获取与处理成本。
总体而言,报告较为全面,结构清晰,但在因子经济解释力方面尚有进一步拓展空间。
---
7. 结论性综合
海通证券研究团队基于逐笔成交数据主动买入方向,构建了“主买占比”和“主买强度”两类高频选股因子。大量回测及多元回归分析表明:
- 这些因子在剔除传统低频因子影响后依旧具备显著月度选股能力;
- 其中,盘中时间段的主买占比类因子与日内净主买强度类因子表现最佳;
- 选股效果在沪深300成分股内显著增强,且多空收益差分更明显,表现出强劲多头效应;
- 日间因子相较日内因子选股能力略弱,但计算复杂度较低,适合广泛应用;
- 调仓频率对因子表现影响显著,半月调仓较月度调仓提升了收益表现,但更频繁调仓未必带来进一步增益。
报告以详实数据支持,丰富的图表和表格辅佐论述,为量化选股因子研究提供了宝贵参考,尤其是在高频主动买入行为与选股能力的结合上具创新意义。投资者在运用类似高频因子时应关注流动性和系统性风险,以及调仓机制优化[page::0~19].
---
图表示例
正交后主买占比类因子分10组超额收益(图2)、及其多空净值增长走势(图3):


日内净主买强度类因子正交后分组超额收益(图6)及多空净值(图7):


---
(全文引用页码均已注释)