基于高频快照数据的行为追踪因子另辟蹊径系列之一
创建于 更新于
摘要
本文基于高频快照数据,构建了高低价格区间成交笔数因子、成交量因子和平均每笔成交量因子,反映价格区间内的成交聚集度、成交活跃度和资金参与程度。经日频和周频回测,因子表现稳定且具显著预测能力。三类因子按权重合成行为追踪因子,表现优于单因子,形成的周频换仓策略实现年化收益10.13%,年化超额收益7.34%,信息比率1.54,展现良好投资价值[page::0][page::3][page::7][page::17][page::23].
速读内容
- 高频数据分为快照数据和逐笔数据,快照数据包含tick级量价及盘口挂单信息,刻画股票日内价格波动及买卖意愿,逐笔数据记录成交和委托细节,反映资金流动[page::3][page::5]

- 构建三类基于高低价格区间的快照因子:
- 成交笔数占比因子,反映价格区间成交聚集度。
- 成交量占比因子,体现价格区间内资金活跃度。
- 平均每笔成交量因子,衡量价格区间大资金参与度[page::7]
- 日频因子测试以中证500为标的,2016-2021年:
- 高价格区间成交笔数因子IC为负,低价格区间因子呈正相关,表明高价区成交活跃可能暗示短期卖压
- 分组超额收益率显示高价区Top组合显著超额收益,Bottom组合明显跑输市场,因子具有单调性和预测力


- 高低价格区间成交量占比因子与成交笔数因子表现类似,IC统计显示高价格区间因子负相关,低价格区间因子正相关[page::10]


- 平均每笔成交量因子显示高价格区间因子负相关,低价格区间因子正相关,Top组合年化超额收益率显著优于Bottom组合,夏普比率超过5,最大回撤低[page::12-13]


- 高频因子低频化处理:
- 移动平均与加权移动平均两种方法应用于因子,为适应周频换仓,增强稳定性[page::13-14]
- 周频换仓回测显示,加权平均处理后因子表现更佳,低价格区间平均每笔成交量因子表现最佳,年化收益达20.73%,夏普率2.63[page::14]

- 因子合成行为追踪因子:
- 三因子标准化后按权重(0.25,0.25,0.5)合成
- 日频测试IC绝对值3.99%,ICIR 0.45,多空收益50.01%,优于单因子表现[page::17]

- 行为追踪因子周频测试:
- IC绝对值达5.12%,多空收益25.86%,最大回撤8.08%
- 明显优于单因子周频表现,显示优异的稳健性和预测力[page::19]

- 基于行为追踪因子构建周频换仓策略:
- 中证500股票池,持仓100只,行业权重调整,交易成本千分之一
- 2016年7月至2021年8月回测,实现年化收益10.13%,年化超额收益7.34%,信息比率1.54,收益曲线稳步上升且回撤较小[page::20-21]


- 策略分年度表现:
- 除2019年外,其他年份均实现正超额收益,2018年超额收益达14.29%
- 体现良好的市场适应性和抗周期能力[page::22]


深度阅读
报告深度分析:《基于高频快照数据的行为追踪因子另辟蹊径系列之一》
---
一、元数据与概览
报告标题:《基于高频快照数据的行为追踪因子另辟蹊径系列之一》
作者:高智威,东兴证券研究所金融工程首席分析师
联系方式:电话0755-82832012,邮箱gaozhw@dxzq.net.cn
发布日期:未明确提及(内容中回测数据范围截至2021年8月)
主题:高频快照数据构建市场行为追踪因子,探索股票日内微观结构及其对未来收益的预测能力。
报告核心论点及评级:
- 传统多因子模型依赖基本面及低频量价因子,换仓频率较低且现表现一般。
- 私募与量化领域正逐步重视基于高频数据的短线策略,尤其部分由tick快照数据衍生的新因子具备有效的选股能力。
- 本文构建高低价格区间成交笔数因子、成交量因子和平均每笔成交量因子,三因子基于不同权重合成为行为追踪因子,经回测表现优异,在日频和周频换仓均实现显著超额收益,且风控指标较优。
- 基于该因子构建的周频换仓投资策略自2016年7月至2021年8月获得10.13%的年化收益率,信息比率1.54,超额收益明显。
- 风险提示:模型基于历史数据构建,未来面对政策和市场环境变化存在失效风险。
总体立场积极,主张采用高频快照数据挖掘微观行为信息,对传统因子模型进行有益补充,推荐关注该高频行为追踪因子策略。[page::0,23]
---
二、逐节深度解读
1. 高频数据介绍(第1章)
- 高频数据分两大类:快照数据和逐笔数据。快照数据(tick行情数据)每3秒更新一次,包含tick级量价数据(高开低收、成交量额、成交笔数)和盘口委托挂单数据(10档深度的挂单量价及买卖意愿)。逐笔数据包括逐笔成交和逐笔委托,能够详细披露每笔交易和委托的具体信息,有助分析资金流向和撮合结构。图1清晰展示两类数据的分类结构。
- 研究聚焦于快照数据,利用其高频的价格和成交行为信息,构建短期的选股因子。[page::3-5]
2. 基于快照数据因子构建(第2章)
- 股票日内价格波动划分成高价区间和低价区间,利用高频快照数据对价格序列精细划分高低价格区间,避免传统线性区间划分过于粗糙。
- 构建三类因子:
1. 高低价格区间成交笔数占比因子:区间成交笔数占全天成交笔数的比重,反映价格区间的成交聚集度。
2. 高低价格区间成交量占比因子:区间成交量占全天成交量比率,体现资金活跃度。
3. 高低价格区间平均每笔成交量因子:区间内平均每笔成交量与全天水平的比值,用以衡量大资金活跃度。
- 这些因子以经济学逻辑解释,低价区间大资金活跃暗示机构投资者对后市信心,预示未来上涨;高价区间过度活跃可能反映短期追高,后市风险增加。[page::6-7]
3. 因子测试(第3章)
- 选取中证500作为股票池,测试周期2016年7月至2021年8月,以开盘价日频换仓回测。分为5个分组,Top组因子值最高。
3.1 高频因子日频测试(3.1节)
- 成交笔数占比因子:
- 高价区间因子与未来收益显著负相关(IC约-3.01%),意味着高价大量成交笔数可能预示价格过热。
- 低价区间成交笔数因子呈正相关(IC约2.43%)。
- 分组收益率显示Top组(低成交笔数于高价区间)表现突出,年化多空收益达到31.89%,夏普率3.36,最大回撤13.36%。(图2~6,表7~8)
- 成交量占比因子:
- 高价区间因子呈负相关(IC约-3.87%),低价区间呈正相关(IC约3.25%),分组收益呈明显规律但非严格单调,Top组年化超额收益18.22%,多空收益46.5%,夏普5.02,最大回撤11.59%。(图7~9,表9~10)
- 平均每笔成交量因子:
- 高价区间因子呈负相关(IC约-2.96%),低价区间正相关(IC约2.81%)。
- 分组收益同样呈单调递减趋势,Top组多空组合年化收益33%,夏普率5.36,最大回撤仅5.64%。(图10~14,表11~12)
- 因子回测均显示较高稳定性和阿尔法潜力,但部分因子针对低价区间体现优势更明显。[page::8-13]
3.2 高频因子低频化处理(3.2节)
- 为提高因子稳定性和降低交易频率,实现低频换仓,采用移动平均和加权移动平均对日频因子进行平滑处理(窗口T=5,10天),权重对近期数据加大。
3.3 高频数据因子周频换仓测试(3.3节)
- 基于低频处理的因子在中证500周频回测中表现更为优异。
- 低价区间平均每笔成交量因子5日加权平均后表现最佳,多空组合年化收益20.73%,夏普率2.63,显示高频因子经平滑处理同样具备良好的选股能力和稳定性。
- 多数因子IC和多空收益均较此前日频结果有所提升,说明因子降频处理有助消除短期噪声,强化信号。[page::14-17]
4. 行为追踪因子构建与策略设计(第4章)
- 三类因子相关性分析显示高价格区间成交笔数因子和成交量因子高度相关,低价格区间平均每笔成交量因子相对独立。
- 综合权重为:(0.25, 0.25, 0.5)三因子合成行为追踪因子。
- 日频行为追踪因子表现:
- IC绝对值3.99%,ICIR 0.45
- 多空收益50.01%,高于任一单因子
- 周频行为追踪因子表现(低频化处理后结合):
- IC绝对值5.12%,多空收益达25.86%,最大回撤仅8.08%
- 基于周频行为追踪因子设计实盘策略,采用中证500股票池,持仓100只,行业权重依据市场结构动态调整,考虑交易成本(单边0.1%),周初开盘调仓。
- 投资策略回测结果显示:
- 多头净值明显超越等权市场指数,超额净值稳步增长
- 年化收益10.13%(基准等权2.36%),超额收益7.34%
- 夏普率0.50,信息比率1.54,策略整体风险可控且收益稳健
- 分年度收益显示大部分年份策略稳定超额赢过基准,尤其2018年超额收益达14.29%。
该策略可行性强,收益稳定性好,实用价值显著。[page::17-22]
5. 总结与风险提示(第5-6章)
- 明确了高低价格区间成交笔数、成交量和平均每笔成交量三种因子的定义、经济学逻辑及预测作用,实证测试均有效。
- 三因子合成行为追踪因子优于单因子,且适应于不同换仓频率。
- 基于该因子制定的周频换仓策略具备良好收益风险特征,且显著跑赢市场等权基准。
- 风险提示点明,模型基于历史数据,未来政策和市场环境变化可能导致因子失效,投资需谨慎。
---
三、图表深度解读
(以下重点选取关键图表)
图1 高频数据分类(page 3)
- 描述快照数据(tick量价、盘口委托挂单)和逐笔数据(逐笔成交、逐笔委托)两大类高频数据结构,清晰梳理研究数据源,奠定研究基础。
表7 高低价格区间成交笔数占比因子 IC 统计(page 8)
- 显示高价区间成交笔数因子IC呈显著负值,低价区间为正,验证价格区间不同投资者行为对收益的负面或正面作用。
图2-6 成交笔数占比因子分组超额收益率及多空组合净值(pages 8-10)
- 分析Top组至Bottom组年化超额收益率递减且区分明显,Top-Bottom多空组合回报超过30%,夏普率优秀,回撤合理,支撑因子有效性。
表9和图7-9 高低价格区间成交量占比因子(pages 10-11)
- 与成交笔数因子表现类似但多空多头收益更高,信息量丰富。
表11和图10-14 平均每笔成交量因子(pages 11-13)
- 进一步揭示大资金活跃度与未来收益正相关性,且低价区间因子表现最佳。
表13和图15-17 高频因子低频周频测试(pages 14-16)
- 加权移动平均平滑处理显著提升因子稳定性和后来周频回测表现,多空收益率和仪器均获进步。
表18-21 行为追踪因子的日频与周频IC、多空收益对比(pages 17-19)
- 多因子合成行为追踪因子优于单因子,分组年化超额收益和夏普率均显著提高。
图22-23 行为追踪策略多头净值和超额净值(page 20-21)
- 策略净值遥遥领先基准,超额收益平稳增长且回撤有限,展示策略强劲的风险调整后表现。
图24-25 策略分年度收益与超额收益(page 22)
- 年度表现大部分年份均显著跑赢市场,尤其策略在2018年实现14.29%超额收益,验证策略的持续竞争力。
表22 策略收益风险指标(page 21)
- 明确数值说明策略具备良好风险回报特性,信息比率达1.54,属同类策略中较优表现。
---
四、估值分析
报告未涉及个股或公司层面的估值分析,因聚焦于因子构建和策略表现,未使用DCF、P/E或企业价值相关估值方法。核心旨在验证因子有效性及策略盈利性。
---
五、风险因素评估
- 报告唯一明确风险提示是基于历史数据构建,面对未来政策、市场环境出现变化,因子及模型存在失效风险。未细化具体风险缓释措施。投资者应关注模型在不同市场环境下的适应性及潜在稳健性。
---
六、批判性视角与细微差别
- 报告逻辑严密,数据详实,是基于详尽数据回测和明晰经济逻辑的多条线验证。
- 然而,因高频数据采集和处理复杂,短期内可能面临数据噪声及结构性变化的挑战,报告虽通过平滑平频处理提高稳定性,但未来市场变局时模型鲁棒性仍需进一步验证。
- 分组收益虽呈现单调但部分因子低价区间存在非线性表现,报告对非线性模型未深入,潜在改进空间。
- 基于中证500样本,策略在其他市场环境或更大股票池内有效性需额外验证。
- 卷入滚动换仓频率及交易成本考量,日因子未直接用于策略,显示现实应用存在摩擦成本挑战。
- 报告完全基于量化测试,缺少实证金融市场的行为模式验证,投资者需结合市场实际结合使用。
---
七、结论性综合
本报告由东兴证券高智威团队撰写,首次系统挖掘利用高频快照数据,围绕股票日内价格的高低区间交易行为构建了三类关键因子:成交笔数占比因子、成交量占比因子与平均每笔成交量因子。基于经济学逻辑,这些因子分别量化了成交聚集度、资金活跃度及大资金参与度,对未来股票收益具有显著预测能力。
深度回测显示,三个因子在日频与周频场景均展示优秀的IC表现和多空收益率,经过加权平滑处理后,因子信号更稳定。继而通过加权合成为行为追踪因子,综合信号强度显著提升,日频IC绝对值达3.99%,周频IC达5.12%,分别带来了超过50%和25.86%的多空收益,且最大回撤低于9%。
基于周频行为追踪因子,构建的实盘策略(中证500,持仓100只,行业匹配,涵盖交易成本)年化收益率10.13%,较等权基准多出7.34%,信息比率1.54,策略表现出较强的稳定性和风险控制能力,且年度超额收益稳健,尤其2018年超额收益达14.29%。
图表如图6、9、14、19、21、22和23展示了因子分组多空收益率及策略净值稳健攀升趋势,验证因子在实操的有效性。综合来看,本报告在高频微观结构领域创新性强,为短线策略研究提供了新思路,同时为机构和量化投资者提供实战指导。
风险提示方面,模型依赖历史行情,未来政策及市场环境变化可能削弱因子效力,投资者应注意动态调整及风险防控。
总体看,报告科学系统,数据详实,论据充分,提出的行为追踪因子及其结合策略值得关注,具有较高应用价值及推广潜力,是高频量价数据挖掘选股因子的典型范例。[page::0-25]
---
参考图表示例(部分)
- 图1:高频数据分类

- 图6:高价格区间成交笔数因子(20%)分位数组合与多空组合净值

- 图9:高价格区间成交量因子(20%)分位数组合与多空组合净值

- 图19:行为追踪因子分位数组合与多空组合净值-日频测试

- 图22:行为追踪策略多头净值-周频测试

- 图23:行为追踪策略超额净值-周频测试

---
综上,该报告对高频快照数据的深入研究、因子构建与验证过程清晰,结果具备相当的说服力及实际投资参考价值,值得量化研究及策略设计者重点关注。