选股因子系列研究(五十八)——知情交易与主买主卖
创建于 更新于
摘要
本报告基于逐笔级交易数据引入知情交易概率模型,筛选过滤投资者主买主卖行为,构建知情主卖占比、知情主买占比及知情净主买占比三大因子。回测显示,知情主卖占比因子反映投资者负面预期,月度选股能力显著,年化多空收益达8%以上;收盘前知情主买占比表现出较强的逆向选股能力,月度胜率超80%;开盘后知情净主买占比因子也具有积极的表现。因子的选股能力在中证800及中证500指数内依旧稳定,体现了较好的普适性和实用性。风险方面,市场系统性风险、流动性风险及政策变动风险仍需关注 [page::0][page::4][page::5][page::16]。
速读内容
- 研究背景与模型框架 [page::0][page::4]:
- 基于逐笔成交数据的主买成交金额及主卖成交金额构建选股因子。
- 引入知情交易概率模型过滤“噪音”交易,得到知情主买与知情主卖。
- 利用日内收益回归剔除星期效应、时段效应及短期动量效应,识别预期外收益,定义相关因子。
- 知情主卖占比因子表现及特征 [page::5][page::6][page::7][page::8]

- 知情主卖占比与未来收益呈显著负相关,投资者知情主卖越强股票未来表现越差。
- 因子月度IC绝对值约为0.03-0.05,正交后下降但依旧稳健;ICIR超过2。
- 开盘后知情主卖占比(占同时段成交额)选股能力显著,月均IC接近0.03,ICIR达3.5,月度多空收益0.94%,多头收益0.57%。
- 年化多空收益约8%-12.3%(开盘后时段),月度胜率约86%。



- 收盘前知情主买占比因子表现分析 [page::8][page::9][page::10]


- 因子月均IC绝对值0.02-0.04,ICIR约1.8-3.0,负相关关系较为反直觉。
- 仅收盘前知情主买占比(占全天成交额)呈现显著选股能力,月度多空收益1.28%,多头收益0.56%,月度胜率超80%。
- 年化多空收益16.1%,月均溢价-0.38%,月度胜率81%。


- 开盘后知情净主买占比因子表现 [page::11][page::12][page::13]



- 正交后开盘后知情净主买占比月均IC约0.02,ICIR在2.8到3.0之间,月度胜率超80%。
- 因子与股票未来收益正相关,反映信息优势投资者买入预期。
- 年化多空收益9%-10%,月均溢价约0.2%。
- 不同指数范围内因子表现 [page::14][page::15][page::16]
- 知情主卖占比因子全天及开盘后时段在中证800与中证500指数范围内依旧有效,但在沪深300表现不显著。
- 收盘前知情主买占比因子在中证800指数中仅收盘前占全天成交额因子维持选股能力。
- 知情净主买占比因子在中证800指数内表现依旧稳健,但选股范围缩小后选股能力逐渐减弱。
- 相关性分析 [page::13][page::14]
- 因子与传统低频因子截面相关性不高,分别与市值、换手率、波动率及前期涨幅等因素存在弱相关性,显示新增因子具有较强信息增量。
- 风险提示 [page::0][page::16]
- 市场系统性风险、资产流动性风险及政策变动风险是影响因子策略表现的主要不确定因素。
深度阅读
金融研究报告详尽分析与解读
报告名称:《选股因子系列研究(五十八)——知情交易与主买主卖》
分析师:冯佳睿、袁林青
发布机构:海通证券研究所
发布日期:2020年2月6日
研究主题:基于知情交易概率模型,研究投资者的主买主卖行为,构建新型选股因子,验证其选股能力。
---
一、元数据与概览(引言与报告概览)
该报告系海通证券研究所资深分析师团队针对公募基金重仓股行业行为展开的系列研究中的第58期,紧接“基于主动买入行为的选股因子”研究(五十七)的讨论,进一步引入知情交易概率模型来过滤投资者的主买、主卖成交行为,从“知情主买”和“知情主卖”的角度创新构建多项选股因子。目的在于验证经过信息筛除的“真实”知情交易行为对股票未来收益表现的预测能力。
核心论点如下:
- 通过知情交易概率模型过滤主买主卖行为,可构建出更有效的选股因子,避开市场“噪声”交易。
- 分析显示全天及开盘后知情主卖占比因子对选股有稳健的负向预测能力,即知情主卖占比越高,股票未来表现越差。
- 收盘前知情主买占比因子表现出显著的负向选股能力,反映投资者收盘时可能的过度反应行为。
- 开盘后知情净主买占比因子表现出正向选股能力,指示持有信息优势投资者集中买入时,股票未来表现较好。
- 因子效果在不同股票指数范围(沪深300、中证500、中证800)有所差异,选股能力随选股范围缩小有所衰减。
- 最后,强调市场系统风险、流动性风险及政策变动风险会显著影响策略表现。
报告旨在推动绝对收益投资策略深化,提升量化选股因子的实用性和有效性[page::0][page::4].
---
二、逐节深度解读
2.1 知情交易与主买主卖(第1章)
本部分结合主买主卖的逐笔成交数据,通过搭建日内分钟回归模型区分“知情交易”行为。回归模型剔除了周效应、时段效应及短期动量,利用股票过去一个月内20个交易日的分钟收益序列,计算残差收益序列(预期外收益)。在此基础上:
- 当残差收益为正时,主动卖出视为“知情主卖”;
- 残差收益为负时,主动买入视为“知情主买”。
该模型借鉴了金融学经典文献中的PIN模型,并结合Chang等人2014年的改进,通过引入回归残差动态识别时间段内的“知情交易”行为,有效过滤掉噪声交易,更精准地捕捉投资者的信息优势行为。该公式($R_{i,T,j}$)详见第4页,说明了日内收益按周和时间段虚拟变量回归,控制动量滞后项[page::4].
因子构建分为三类:
- 知情主卖占比,
- 知情主买占比,
- 知情净主买占比(主买减去主卖),涵盖全天、开盘后、盘中及收盘前不同时段的成交量比例,具体计算方法见表1[page::5]。
---
2.2 因子月度选股能力分析(第2章)
本章使用2013年至2020年1月的分钟级交易数据(剔除ST股、新股及停牌股),回测上述因子在全市场的月度选股表现。考虑因子正交处理(剔除市值、估值、换手率、反转等低频因子影响)后因子的独立选股能力。
知情主卖占比因子(2.1节)
- 整体表现与逻辑高度匹配:知情主卖占比与未来股票收益负相关,知情主卖越多,股票后续表现越弱。
- IC值(信息系数)绝对值在0.02到0.05之间,说明具有稳健统计意义的预测能力。
- 正交后IC虽下降,但ICIR提升,表明剔除传统因子影响后该因子纯粹性更强。
- 日内各时段中,全天及开盘后知情主卖占比因子表现最佳,开盘后知情主卖占比(占同期成交额)月均IC绝对值接近0.03,ICIR达3.5,月度多空收益0.94%,多头收益0.57%(表2、图1-4)。
- 多空组合累计净值稳定上升,年化多空收益8%-12.3%(图5-6,表3-4)。
- 回归测试确认因子溢价稳定,胜率高达86%(表4)。
结论是知情主卖因子可信度与实用性较高,体现出专业投资者预期的负面信息[page::5][page::6][page::7][page::8].
知情主买占比因子(2.2节)
- 令人意外的是,知情主买占比与未来收益负相关,即知情主买越强股票表现越差,但这一负相关性仅在收盘前时段显著。
- 收盘前知情主买占比的月均IC绝对值在0.02~0.04,ICIR在1.8~3之间,月度多空收益高达1.28%,多头月均收益0.56%,胜率超80%(表5,图7-10)。
- 结合前期结论,收盘前投资者往往具有情绪和过度反应倾向,此行为表现为反向因子。
- 回归结果中,月均因子溢价为负值(-0.38%),显示该因子可用作短期反转信号。
本节强调了投资者行为学的影响,表明知识主买因子并非一直正向,其表现依赖于时间段及行为心理[page::8][page::9][page::10].
知情净主买占比因子(2.3节)
- 正交前因子未显示明显选股能力,但正交后,开盘后时段知情净主买占比分别相对于全天成交额和同期成交额与未来收益正相关。
- 月均IC为0.02,ICIR在2.8~3.0之间,月度胜率超80%,年化多空收益约为9%~10%(表8-10,图11-14)。
- 该因子逻辑较为直观:知情净主买越高,代表金融信息优势投资者买入意愿强,股票未来表现优异。
- 近两年表现略弱,提示策略需动态调整以适应市场变化。
因子估计具备较强的实用性,支持投资者信息优势的选股能力验证[page::11][page::12][page::13].
---
2.3 因子与传统因子相关性分析(第3章)
报告进一步计算了三个因子与传统低频因子的截面相关性,发现:
- 知情主卖占比因子与市值、换手率、波动率存在一定关联,且全天及盘中时段表现尤甚(表11);
- 知情主买占比因子与市值、换手率、前期涨幅相关(表12);
- 知情净主买占比因子与前期涨幅关系较强(表13)。
该分析揭示因子并非完全独立于市场已知特征,正交操作必不可少以控制共线性影响,保证因子纯度和独立选股能力[page::13][page::14].
---
2.4 因子在不同指数范围内的选股能力(第4章)
通过区分沪深300、中证500、中证800等不同指数样本,分析因子选股能力的范围限制:
- 知情主卖占比因子在中证800和中证500指数中保持选股能力,但在沪深300中表现不显著(表14)。
- 知情主买占比因子中,唯有收盘前知情主买占比在中证800中依然有效(表15)。
- 知情净主买占比因子进驻中证800后仍有效,但总的选股能力随着样本范围缩小逐渐减弱(表16)。
报告强调,样本限制和指数环境对因子性能有影响,策略需灵活适配特定市场或指数空间[page::14][page::15].
---
2.5 总结与风险提示(第5章及第6章)
总结如下:
- 采用知情交易概率模型提升主买卖行为因子可信度,从而打造了知情主卖占比、知情主买占比及净主买占比三类因子。
- 知情主卖占比因子选股效力较强,持续体现投资者信息优势与市场表现的负相关性。
- 收盘前知情主买占比因子表现异于预期,凸显了投资者情绪影响。
- 知情净主买占比因子在开盘后时段展现正向选股能力,支持信息优势投资者行为假说。
- 因子表现受回归模型识别精度影响,报告鼓励投资者根据自身需求调整模型。
- 明确风险包括市场系统风险、流动性风险和政策变动风险,这些因素对策略表现具有较大不确定性。
以上体现了作者对因子研究的敬慎态度及务实风格[page::16].
---
三、图表深度解读
3.1 主要图表说明与解读
- 图1-4(第6-7页)全天及开盘后知情主卖占比分10组超额收益
三条线代表不同计算口径:占全天成交额、占同时段成交额、占同段主卖金额。所有图形呈现明显的组间收益单调递减趋势(高因子值对应低后期超额收益),印证了知情主卖占比的反向选股效力;正交前后均保持此模式,但正交后曲线幅度收敛,表明去除共因子影响后因子依旧稳定成立。此视觉现象极具说服力,给出多空收益差异的直观验证。
- 图5-6(第7-8页)知情主卖占比因子多空相对强弱走势及累计净值
因子表现整体呈持续上升趋势,线型平滑且未出现大幅波动,体现因子长期稳定盈利能力。累计净值图清晰显示年化收益水平(8%-12%区间),数据支持因子实际投资潜能。
- 图7-10(第9-10页)收盘前知情主买占比分10组超额收益与累计净值
同样分10组显示超额收益,呈现负相关趋势(高知情主买因子对应低未来收益),且正交前后趋势稳定,说明模型构建的正确性。累计净值图形展现因子年化多空收益16%以上,显示即使是意外的负相关,因子仍然具备实际考察价值。
- 图11-14(第12-13页)开盘后知情净主买占比分10组超额收益及累计净值
数据线显示正相关趋势(高因子值对应高后续超额收益),累计净值平稳增长,支持因子为有效的正向选股信号。
3.2 表格分析举例
- 表1(第5页)指标计算方法
详细阐述用成交额及时间窗口定义因子,保障研究的透明度和可复现性。
- 表2-4(第6-8页)知情主卖占比因子月度IC、多空收益及溢价数据
以数值明确展现因子的统计显著性与收益水平,量化分析支撑文本论断。
- 表5-7(第9-10页)知情主买占比因子相应指标数据
清晰揭示收盘前知情主买占比为核心因子,差异化地表明投资者行为和市场表现的联系。
- 表8-10(第11-13页)知情净主买占比月度选股能力及多空收益
数据聚焦开盘后时段,展示因子效应的时间依赖性。
- 表11-13(第13-14页)因子与传统低频因子截面相关系数
揭示因子彼此及与传统指标的相关性,指引因子筛选和组合优化方向。
- 表14-16(第14-15页)不同指数范围内因子选股能力情况
显示策略在分样本的适用性,多维度验证因子鲁棒性。
图表充分结合文字,形成系统严谨的研究体系,具有高信息量和操作指导意义。
---
四、估值分析
本报告集中于因子构建和回测验证,未具体涉及传统股票估值模型(如DCF、市盈率等)部分,因此无估值细节可解读。研究的重点在行为因子及其对股价收益的预测能力,属于量化选股模型构建范畴。
---
五、风险因素评估
报告指出以下主要风险变量:
- 市场系统性风险:整体市场波动影响因子收益表现,如2020年新冠疫情等黑天鹅事件可能导致因子失效。
- 资产流动性风险:低流动性股票投资及成交限制会制约因子策略的实际执行和盈利能力。
- 政策变动风险:监管政策变化直接影响市场行为,因而对因子的有效性有不确定影响。
虽然风险识别明确,但报告未给出具体缓解方案,提醒投资者须谨慎考虑风险敞口与仓位管理[page::0][page::16].
---
六、批判性视角与细微差别
- 报告对“知情交易概率模型”的依赖较重,且回归模型仅剔除了有限的周效应、时间段效应和短期动量。实际市场复杂,存在更多影响因素(如行业轮动、宏观事件)可能导致模型识别误差,影响因子精确度。
- 报告反复提及对传统低频因子的正交处理以验证因子纯度,但相关性分析显示因子与市值、换手率等传统指标仍有不小相关,说明完全独立性有限。
- 收盘前知情主买占比与未来收益负相关的发现,需结合行为金融学深度解读,报告在解释时偏向归因于“投资者过度反应”,但未充分探讨其他可能机制。
- 不同指数范围内因子表现衰退,提示因子稳定性受样本选择和市场结构复杂影响,报告对此仅作表面披露,缺乏深入讨论。
- 未公布因子可能的交易成本、滑点等现实市场障碍,因而对策略真实可操作性缺少评估。
综上,报告虽系统详实,但仍存在对模型局限和市场复杂性的谨慎待解局限。
---
七、结论性综合
本报告在系统论述知情交易概率模型构建基础上,成功将市场中所谓“有信息优势投资者”的主买主卖行为切分过滤,创新推出了三大选股因子:知情主卖占比、收盘前知情主买占比、和开盘后知情净主买占比。深入分析表明:
- 知情主卖占比因子在多数市场条件和时间段展现稳健、显著的负向预测能力,符合投资理论预期,是三因子中最强的。
- 收盘前知情主买占比因子展现出负相关,提示投资者可能的过度反应行为及市场非理性。但该时段因子表现优于其他时间段,具备独特策略价值。
- 开盘后知情净主买占比因子体现正相关,代表投资者真实的买入兴趣及预期,需要结合市场行情动态使用。
- 三因子均在剔除传统低频因子的正交测试中保有选股有效性,同时在沪深300、中证500及中证800等指数中差异均体现出因子适用的边界。
- 统计指标(IC、ICIR、多空收益、胜率)均表明投资者可以借助这些因子提高绝对收益策略表现。
- 研究视角严谨且结合了经济理论与实证数据,图表内容丰富,清晰展现因子表现和趋势。
- 风险警示清晰,提醒策略受制市场系统性风险、流动性约束和监管环境变化。
总体而言,报告创新性地利用知情交易概率模型筛选主买主卖信息,增强了选股因子的预测能力和市场适应性,为量化策略的研发提供了有力理论与实证支持,极具参考和推广价值[page::0][page::4-16].
---
(注:以上所有关键论断与数据皆注明了对应原文页码,确保内容溯源清晰。)