`

选股因子系列研究(十八)——价格形态选股因子

创建于 更新于

摘要

本报告通过引入股票开盘价、最高价、最低价及成交均价,构建价格形态类选股因子(开盘冲高、盘低回升、均价偏离),对其单因子及多因子模型表现进行深入分析。研究发现该类因子具有稳定的选股能力,特别是在半个月窗口计算下更为显著,且因子回归系数均显著。引入因子二阶项后,多因子模型年化收益率提高约2%-3%,因子在权重分配中均有10%以上比重。风险提示包括市场系统性风险及政策风险等 [page::0][page::4][page::5][page::6][page::8][page::9][page::10][page::11]

速读内容

  • 价格形态因子构建逻辑及指标定义 [page::4]


- 引入开盘冲高(log(盘高/开盘价))、盘低回升(log(收盘价/盘低))和均价偏离(log(均价/收盘价))3个因子。
- 计算窗口设为半个月和一个月,因子值为过去时间窗口内指标均值。
  • 单因子表现与分组收益分析 [page::5][page::6]




| 时间窗口 | 因子 | IC | ICIR | rankIC | rankICIR |
|----------|----------|------|-------|--------|----------|
| 半个月 | 开盘冲高 | -0.06| -1.58 | -0.07 | -1.72 |
| 半个月 | 盘低回升 | -0.07| -1.78 | -0.07 | -1.80 |
| 半个月 | 均价偏离 | 0.04 | 1.96 | 0.05 | 1.80 |
| 一个月 | 开盘冲高 | -0.05| -1.39 | -0.07 | -1.59 |
| 一个月 | 盘低回升 | -0.06| -1.55 | -0.07 | -1.62 |
| 一个月 | 均价偏离 | 0.04 | 2.14 | 0.05 | 1.80 |

- 半个月窗口的开盘冲高和盘低回升IC绝对值较高,但整体以空头效应为主,选股表现呈现非线性。
- 均价偏离因子表现相对稳定,ICIR较高。
  • 正交因子验证与分组收益分析 [page::6][page::7]




| 时间窗口 | 因子 | IC | ICIR |
|----------|----------|------|-------|
| 半个月 | 开盘冲高 | -0.02| -1.07 |
| 半个月 | 盘低回升 | -0.03| -1.76 |
| 半个月 | 均价偏离 | 0.04 | 2.95 |
| 一个月 | 开盘冲高 | 0.00 | -0.27 |
| 一个月 | 盘低回升 | -0.02| -0.82 |
| 一个月 | 均价偏离 | 0.03 | 2.88 |

- 正交后半个月窗口的盘低回升与均价偏离因子仍保留良好的选股能力。
- 非线性特征依旧明显,支持引入二阶项。
  • 多因子模型回归检验与因子二阶项分析 [page::8]


| 添加变量 | T统计量(一阶项) | T统计量(二阶项) |
|---------------------|-----------------|-----------------|
| 开盘冲高2W | -3.22 | -2.60 |
| 盘低回升2W | -4.81 | -2.10 |
| 均价偏离2W | 6.59 | -2.94 |
| 均价偏离1M | 7.40 | -1.26 |

- 所有因子一阶项均显著,二阶项半个月窗口因子显著,1个月均价偏离因子二阶项不显著。
  • 多头组合表现提升及风险提示 [page::8][page::11]


| 组合 | 年化收益率(%) | 最大回撤(%) | Calmar比率 | 信息比率 |
|---------------|--------------|-------------|------------|----------|
| 原始模型 | 58.3 | 54 | 1.07 | 3.55 |
| +开盘冲高2W | 60.2 | 54 | 1.12 | 3.73 |
| +开盘冲高2W^2 | 61.3 | 54 | 1.14 | 3.76 |
| +盘低回升2W | 59.6 | 53 | 1.13 | 3.73 |
| +盘低回升2W^2 | 60.8 | 53 | 1.15 | 3.75 |
| +均价偏离2W | 58.4 | 53 | 1.10 | 3.61 |
| +均价偏离2W^2 | 59.4 | 53 | 1.12 | 3.67 |
| +均价偏离1M | 59.2 | 53 | 1.12 | 3.65 |
| +均价偏离1M^2 | 58.3 | 54 | 1.07 | 3.55 |

- 加入价格形态因子后,多头组合年化收益率提升约2%-3%,且收益回撤比和信息比率也有所提升。
- 风险因素包括市场系统性风险、资产流动性风险及政策变动风险。
  • 因子权重分布 [page::9][page::10]





- 半个月窗口计算的开盘冲高、盘低回升和均价偏离因子及其二阶项均获得10%-20%的权重分配。
- 权重稳健且反映因子具有较强选股能力。

深度阅读

报告详尽分析:《选股因子系列研究(十八)——价格形态选股因子》



---

1. 元数据与概览


  • 报告标题: 《选股因子系列研究(十八)——价格形态选股因子》

- 分析师: 冯佳睿、袁林青
  • 发布机构: 海通证券股份有限公司研究所

- 发布日期: 2017年1月16日至3月2日期间(基于持续研究数据)
  • 主题: 选股因子研究,聚焦于价格形态因子的构建及其在多因子选股模型中的应用与表现分析。


核心论点与目标



本报告旨在突破传统技术选股因子仅基于收盘价的局限,首次引入每日开盘价、最高价、最低价及成交均价构建价格形态因子,并系统验证其选股能力。主要论点包括:
  • 价格形态因子(开盘冲高、盘低回升、均价偏离)具备显著的选股能力,尤其在较短的时间窗口(半个月)下表现更优;

- 通过与传统因子正交,验证价格形态因子具有独立额外的选股信息;
  • 价格形态因子二阶项体现出非线性效应,值得引入多因子模型;

- 多因子回测及回归分析均显示,这些因子的加入能提升组合的年化收益率、信息比率及收益回撤比;
  • 价格形态因子被赋予较高模型权重,显示其选股贡献度的认可;

- 风险提示涵盖市场系统性风险、流动性风险及政策风险。

总体,报告传达价格形态因子为多因子选股模型的优质扩展,可带来2%-3%的年化收益提升,且具有稳健的实证支撑[page::0,4,5,6,7,8,9,10,11]。

---

2. 逐章深度解读



2.1 引言与因子构建介绍(章节1)


  • 关键论点: 传统技术因子多基于收盘价,无法全面体现股票日内走势。价格形态因子通过引入开盘价、最高价、最低价和成交均价,力图捕捉日内价格非对称信息。

- 因子定义:
- 开盘冲高因子 = 过去K天内 log(最高价/开盘价) 均值,表征盘中冲高幅度;
- 盘低回升因子 = 过去K天内 log(收盘价/最低价) 均值,体现盘中低点回升幅度;
- 均价偏离因子 = 过去K天内 log(成交均价/收盘价) 均值,描述成交均价相较于收盘价的偏离。

K取半个月或1个月,停牌日处理为剔除,停牌时间过长视为缺失因子值[page::4]。

2.2 单因子回测(章节2)


  • 研究设计:

- 数据区间:2009年1月至2017年2月;
- 按月末计算因子值,截面标准化;
- 涉及交易规则包括涨跌停板限制、双边千五交易费、去除ST以及新上市股票;
  • IC/ICIR指标: 因子信息系数及其稳健性指标显示半个月窗口内,开盘冲高和盘低回升选股能力显著(IC绝对值约0.07,ICIR超过1.5),均价偏离虽IC略低但ICIR较好,说明稳定性强。一个月窗口下,开盘冲高和盘低回升选股能力稍弱,均价偏离持平或略优[page::5]。

- 分组收益图解(图1、图2):
- 开盘冲高与盘低回升因子:组别之间未来收益表现呈明显非线性特征,中间组别收益更高,两边组均较低,且整体空头效应突出——因子值极高或极低的股票收益反而较低,这提示因子存在非线性效应;
- 均价偏离因子表现则较为线性且与未来收益正相关,因子值越高未来收益越好。
  • 分组收益统计(表2)补充说明了各组的收益与统计显著性,进一步支持非线性和空头效应显著。

- 按年度多空收益(表3): 各因子在不同时期表现波动,中长期总体呈正收益趋势,胜率多在50%-75%之间。对比发现半个月窗口因子普遍较优,尤其开盘冲高和盘低回升因子在牛市年份表现抢眼[page::5,6]。
  • 正交处理及单因子表现去杠杆(章节续):

与行业、市值、反转、换手等六个传统因子进行正交后,部分因子仍保留选股能力:
- 半个月窗口:开盘冲高选股能力明显下降,但盘低回升和均价偏离保持有效;
- 一个月窗口:开盘冲高和盘低回升选股能力消失,均价偏离仍显著。

图3、图4分组收益图显示正交因子仍有明显的非线性趋势,强调非线性因子的纳入必要性[page::6,7]。

2.3 多因子模型回测(章节3)


  • 模型构成: 原始多因子模型包括市值、反转(1个月)、换手率(1个月)、特异度(1个月)及非线性市值,因子均正交,权重最大化单期IC。

- 因子加入: 分别加入价格形态因子(开盘冲高2周、盘低回升2周、均价偏离2周及均价偏离1个月)及其二阶项,观察改进效果。
  • 回归检验(Fama-MacBeth,表5、表6):

- 新加入的一阶项因子系数显著,T统计量均超过3,表明对未来收益有附加解释力;
- 二阶项非线性表现同样显著,除均价偏离1月的二阶项不显著外,其余因子二阶项均有统计显著性,证明因子的非线性特征在回归上有助于改善模型。
  • 组合实证(表7):

- TOP100多头组合收益显示,当加入价格形态一阶项后,年化收益率、收益/回撤比(Calmar)和信息比率均提升;
- 纳入二阶项进一步改善回撤比和年化收益,但均价偏离1个月二阶项无显著益处;
- 整体年化收益提升约2%-3%;
  • 因子权重分配(图5至图8):

- 三个价格形态因子及其二阶项均能获得10%-20%的模型权重,说明因子选股效果强,得到模型认可;
- 时间序列来看,自2012年4月起权重明显上升,反映因子随着时间获得更多信任;
- 二阶项近期权重有所下降,可能因市场变化对非线性调整的需求波动[page::7,8,9,10]。

2.4 总结与风险提示(章节4、5)


  • 主要结论:

- 价格形态因子作为传统收盘价技术因子的有效补充,能捕捉更多日内走势信息;
- 具备独立且显著的选股能力,尤其是半个月窗口的因子效果更强;
- 引入因子二阶项捕获非线性关系进一步强化模型表现;
- 多因子组合控制下,加入价格形态因子带来稳健的年化收益提升和风险调整后业绩改善;
- 风险方面强调市场系统性风险、资产流动性风险及政策变动风险对策略表现可能产生较大影响。

报告客观呈现了价格因子改进的价值及其在实际投资组合中的贯穿应用[page::10,11]。

---

3. 图表深度解读



3.1 表1(因子IC/ICIR统计)


  • 描述:统计开盘冲高、盘低回升和均价偏离三因子的IC及ICIR指标,窗口分为半个月和一个月。

- 解读:
- 半个月窗口,开盘冲高和盘低回升因子IC的绝对值较高(约0.06-0.07),ICIR在1.5以上,显示因子信息有效且稳定;均价偏离IC较小但ICIR接近2,说明稳定性极佳;
- 一个月窗口开盘冲高和盘低回升IC值均有所下降,均价偏离保持稳定并略有提升ICIR。
  • 联系文本:支持早期论断半个月窗口下因子表现更优,特别是开盘冲高和盘低回升因子[page::5]。


3.2 图1和图2(因子分组收益表现)


  • 描述:半个月和一个月窗口内,不同因子分10组的超额收益率对比。

- 解读:
- 三因子股价收益具备明显非线性特征,表现为中间组收益高,两端组收益低,同时开盘冲高和盘低回升因子的空头特征明显;
- 均价偏离因子表现相对线性,因子值高组表现最好;
- 说明应考虑因子二阶项纳入模型。
  • 联系文本:推动后续加入二阶项的分析设计[page::5]。


3.3 表2(单因子分组收益一览)


  • 描述:详细分组预期超额收益和T值统计,涵盖不同因子及不同回测跨度。

- 解读:显著性高的中间组加权平均超额收益支持因子有效性;空头收益较强,分组收益曲线非线性验证分组图观察结果;
  • 联系文本:强调净空头选股效应及非线性,证实现象一致性[page::6]。


3.4 表4(正交因子IC/ICIR)


  • 描述:价格形态因子剔除传统因子影响后IC及ICIR变化。

- 解读:半个月窗口内均价偏离因子ICIR高达2.95,选股能力稳定;开盘冲高因子跌幅明显;
  • 联系文本:彰显因子独立价值,聚焦后续模型加入的因子选择[page::6]。


3.5 图3、图4(正交因子分组收益)


  • 分析说明正交因子分组依旧呈现非线性表现,开盘冲高因子表现弱化,支持对因子结构复杂性的认知,也验证要加入二阶项深化建模[page::7]。


3.6 表5、表6(Fama-MacBeth回归结果)


  • 描述:回归检验价格形态因子一阶和二阶项对组合收益解释力及统计显著性。

- 结论:所有因子回归系数显著,一阶项T值均超过3分界线;二阶项也大多显著,除1个月均价偏离二阶项,说明非线性成分带来增量选股能力[page::8]。

3.7 表7(TOP100组合历史表现)


  • 描述:原始与改进模型回测至2017年2月的年度表现对比。

- 解读:加入任意价格形态因子均获得年化收益和信息比率提升,最大回撤稳定,收益风险比改善明显,且二阶项更进一步增强模型性能[page::8]。

3.8 图5-图8(因子权重分配)


  • 描述:逐步正交+最大化单期IC模型中,价格形态因子权重变化。

- 结论:
- 开盘冲高因子权重及其平方项约10%;
- 盘低回升因子与平方项权重合计约10-15%;
- 均价偏离因子及平方项权重最高,达15%-20%;
- 一个月均价偏离因子权重仅约10%;
- 权重体现因子重要性局部波动,证实选股因子贡献度与稳定性[page::9,10]。

---

4. 估值分析



本报告未包含传统公司估值或证券价格估值模型,主要侧重于选股因子的研发与测试,并通过Fama-MacBeth回归及组合回测验证因子表现。权重分配模型采用“逐步正交+最大化单期IC”,为多因子模型优选因子权重,提升组合收益稳定性。

---

5. 风险因素评估


  • 市场系统性风险: 可能导致因子表现整体下降,影响多因子模型有效性;

- 资产流动性风险: 流动性不足限制因子策略的实际执行及交易成本;
  • 政策变动风险: 政策干预可能突然改变市场结构,因子表现被动受挫。


报告未见具体缓解策略,但提示了重要的风险潜在影响,强调投资需谨慎[page::0,11]。

---

6. 批判性视角与细微差别


  • 报告虽然系统验证价格形态因子有效性,但整体因子IC指标较传统强势因子偏低,提示这些因子不可完全替代强势因子,应视为有效补充。

- 非线性表现明显,但引入二阶项的方法风险在于过拟合,尤其在均价偏离1月因子二阶项中统计不显著,是提示此项风险的警示。
  • 权重分配模型以最大化单期IC为目标,较重视短期选股能力,可能忽略长期持久性。

- 由于研究截止于2017年初,尚缺后期市场验证,需持续跟踪价格形态因子稳定性与有效性。
  • 组合构建基于TOP100,一定程度忽视了中小市值或特殊市况,限制策略普遍适用性。


---

7. 结论性综合



本篇报告全面系统地提出并验证了基于日内价格形态的三个新选股因子:开盘冲高、盘低回升及均价偏离。通过跨时间窗口(半个月与一个月),从单因子测试、因子正交、非线性二阶项引入,到多因子模型回归和组合实证,报告多角度确认了价格形态因子对传统技术因子的有效补充价值。

关键发现包括:
  • 价格形态因子具有稳定的选股能力,尤其半个月窗口计算效果明显优于一个月窗口;

- 因子选股效果表现出清晰的非线性特征,引入二阶项显著提升模型的解释力与组合表现;
  • 这些因子在“逐步正交+最大化单期IC”的多因子模型中能够获得10%以上的权重份额,显示其选股信号价值得到系统认可;

- 实证表明,引入价格形态因子和二阶项后,多头TOP100组合的年化收益率提升约2%-3%,信息比率与收益回撤比均有所优化;
  • 风险层面指出了市场系统风险、流动性风险和政策风险对因子表现的潜在冲击。


本文为多因子量化体系中价格形态因子构建与应用提供了详实的理论思路和数据支持,具备扩展性与实用价值,其提出的非线性处理建议尤为重要,值得投资实务和后续学术研究深入挖掘。

总的来看,报告传递的是价格形态因子作为技术指标的创新延展,为多因子模型的绩效提升带来增量动力的明确信号,具有重要的理论与实操指导意义[page::0-11]。

---

附:关键图表示例



图1:半个月时间窗口下,开盘冲高、盘低回升及均价偏离因子分组收益表现



图7:改进模型因子权重分配(均价偏离-半个月)



---

以上分析确保涵盖报告所有核心章节内容与主要表格、图示,全面剖析了价格形态因子构建逻辑、实证效能、模型贡献及风险点,呈现了深刻的技术与投资洞见。

报告