`

基于动量Transformer模型的日内和隔夜交易策略

创建于 更新于

摘要

本报告基于改进的动量Transformer模型,构建了日内与隔夜交易的时序交易策略,主要应用于A股宽基指数及对应ETF。策略通过多头注意力机制捕获多时间尺度动量特征,改损失函数为信息比率并丰富技术指标,有效提升了模型稳定性和收益表现。在考虑真实交易费率后,ETF时序策略实现显著超额收益,且与传统截面策略的收益来源低相关,具备良好互补性和风险分散价值。同时策略对成交时间段不敏感,具有较强的实操可行性。[page::0][page::16][page::17]

速读内容


策略背景与核心模型介绍 [page::0][page::3][page::4]

  • 传统截面策略因因子饱和及极端行情失效,推动时序策略的发展。

- 动量Transformer模型基于Decoder-only多头注意力机制,输出资产仓位,损失函数改为夏普比率以提升风险收益表现。
  • 美国期货组合回测显示该模型夏普比率高达2.54,优于多项动量策略。


A股市场中的模型改进与特征增强 [page::5]

  • 损失函数调整为基于信息比率,包含对平均仓位的惩罚以防止长期低仓位趋势。

- 增加均线、波动率、动量及成交量类技术指标,扩充模型输入特征。
  • 训练-验证集划分改为随机抽样以增强模型泛化能力,特征摒弃原始价格相关指标,采用滚动训练验证机制。


日内交易策略基础测试及费用影响 [page::1][page::2][page::3]

  • 利用时间段特征,设计简单的“13:30-14:00空仓,14:30-15:00满仓”策略,相比50%买入持有策略获取稳定超额收益。

- 交易费用对策略收益影响显著,万1费率下策略年化收益率趋近或弱于基准。

ETF实际策略回测与多方案比较 [page::6-13]

  • 构建五种不同时序策略方案,含非负约束和多空结构,日内调仓1-3次,隔夜调仓1次。

- 时序策略5(日内两次调仓+隔夜一次调仓,单边万1费率)实现年化7.15%-9.35%超额收益率,最大回撤小于基准,夏普比率显著提升。
  • ETF 策略年化收益率在万0.5费率下可达约9.5%,信息比率提升至1.11。

- 交易价格敏感性测试表明,策略收益对成交时间点的滑点敏感度较低,适应实际交易环境。

策略风险表现与收益结构分析 [page::14][page::15]

  • 策略上涨弹性较大(上涨beta>1),下跌时防御能力强(下跌beta<1,隔夜只做多略降低防御性)。

- 胜率约50%,盈亏比1.0-1.3,单次调仓收益有限但累计复利显著。
  • 策略收益与传统截面策略日度超额收益相关性仅12.18%,在截面策略表现不佳时,时序策略往往获取正超额收益,有良好风险分散和互补价值。




总结与未来展望 [page::17]

  • 报告明确时序策略在极端行情下的稳定性和实操可行性。

- 未来可丰富特征工程引入高频及情绪等多维数据,探索交易频率和组合方式优化,拓展至个股、期货等更多资产类别。
  • 风险提示包含模型失效风险、数据测算误差风险及市场风格变迁风险。

深度阅读

《基于动量Transformer模型的日内和隔夜交易策略》深度分析报告



---

1. 元数据与概览


  • 报告标题:《基于动量Transformer模型的日内和隔夜交易策略——人工智能和机器学习系列研究(4)》

- 发布机构:西部证券研究发展中心
  • 发布日期:2025年06月09日

- 作者与联系人:冯佳睿(分析师),联系人张逸飞
  • 报告主题:本报告聚焦于利用动量Transformer模型构建A股宽基指数及其对应ETF的日内和隔夜时序交易策略,探讨模型构建、改进、回测与实盘测试的全过程,重点分析策略收益特征及其与传统截面策略的互补性。


核心论点总结
报告针对传统截面策略(横向因子排序)在极端市场环境中的失效问题,提出基于动量Transformer的时序交易策略,通过多头注意力机制和直接以夏普比率或信息比率为目标优化资产仓位,形成日内+隔夜仓位调节方案。经过系统回测验证,该策略在A股指数及ETF层面均展现了显著的超额收益和较强的抗风险能力,且与传统截面策略相关性低,可有效实现收益分散及风险对冲。报告最终强调该策略的稳健性、可执行性和未来扩展空间[page::0,1,17,18]。

---

2. 逐节深度解读



2.1 引言与背景分析



报告开篇强调近年来截面策略(Cross-Sectional Strategy)在因子饱和和市场因子共振失效的双重压力下,表现受到挤压,特别是在2024年9-10月市场剧烈波动期间,多因子策略出现集体回撤。流动性与风格切换强化了对截面策略的挑战[page::1]。

针对上述困境,报告引入时序策略(Time-Series Strategy),该策略通过动态调整个别资产的仓位来抓取趋势信号,不依赖资产之间的相对排名,从而具备更好的极端环境适应性。研究锁定宽基指数,先进行指数层面反复测试,再将结果迁移至ETF层面进行实操验证,形成完整的策略体系[page::1]。

---

2.2 日内市场行为特征发现



报告通过对沪深300和中证1000分时段收益行为的累计净值分析(图1、图2),发现13:30-14:00时段指数表现持续低迷,14:30-15:00时段则上涨概率显著,且趋势稳定。这种日内非对称收益分布为构建日内调仓策略提供了定量基础[page::1]。

2.3 利用日内特征的简单交易策略



基于上述时段效应,首先设计简单的日内仓位调整策略:13:30-14:00空仓,14:30-15:00满仓,其他时间50%仓位。回测结果显示该策略在沪深300和中证1000指数均实现了正向超额收益(图3、图4,表1)。尽管无交易成本时效果显著,但实盘交易费率影响巨大,特别是单边万1费率水平下,策略收益优势消失(图5)[page::2,3]。

报告由此得出结论,简单满仓或空仓的规则不足以在实盘环境下展现优势,需要更精细和灵活的仓位调整模型。

---

2.4 动量Transformer模型介绍



为克服传统动量策略和LSTM模型的不足,报告介绍了动量Transformer模型,该模型基于Decoder-only Transformer架构,采用多头自注意力(multi-head attention)机制,能够并行捕捉不同时间尺度上的趋势信号。其最大创新点是直接以夏普比率为损失函数,优化风险调整后的收益,输出资产仓位([-1,1]区间,多空策略),避免传统MSE回归的局限[page::3,4]。

模型结构详见图6,包含LSTM编码器、门控线性单元(GLU)、变量选择网络(GRN)、多头注意力层,最终通过tanh函数输出仓位。此结构结合了序列建模与注意力机制的优点,强化了对趋势与转折的感知能力[page::4]。

---

2.5 动量Transformer模型国际市场验证



引用原文(Kieran Wood等)在美国期货市场上应用动量Transformer模型的实证研究,涵盖1995至2020年25年数据(表2)。结果显示该模型在多数收益风险指标(包括夏普比率2.54)上优于传统动量策略和基线买入持有,具备较强盈利能力和风险控制能力。该国际验证为模型在A股应用奠定理论基础[page::4]。

---

2.6 A股市场上的模型适应性问题及改进



报告测试模型直套A股市场效果不佳,进行了针对性三点改进:
  • 改损失函数为信息比率:由于A股波动性大且趋势性弱,原夏普比率损失函数无法有效激励模型持仓,导致仓位偏低。引入了以基准收益替代无风险利率的改良信息比率损失函数,并加入低仓位罚则,鼓励市场参与度[page::5]。
  • 丰富输入特征类别:由仅基于MACD指标扩展至多种技术指标(均线、波动率、成交量等),以提升对复杂市场信号的捕获能力[page::5]。
  • 重设训练-验证划分机制:由按时间顺序划分改为随机抽样,避免模型过拟合特定时间段,提升泛化能力。为防止未来信息泄露,限制输入变量仅为滑动窗口计算的标准化指标[page::5]。


以上改进使模型在A股市场表现稳定性显著提升,克服了原模型迁移应用中的核心问题。

---

2.7 模型回测设置与不同交易情境设计



报告专注于宽基指数组合(沪深300、中证500、创业板等),数据频率为5分钟K线,基于多时间尺度特征构建,采用资金等权分配(表3),训练采用滚动更新,训练+验证占5年,测试1年,交易时间点按小时级别选定(每日10、11、14、15点)[page::6]。

两大情境设计:
  • 情境1:不做空

由于A股现货无法做空,模型输出仓位限制在非负区间[0,1],每日交易4次,测试模型抗风险能力及收益表现[page::6]。
  • 情境2:允许做空但持有底仓

为模拟多空结构,假设持有固定50%底仓日内调仓2次,隔夜调仓1次,模型输出仓位加偏置调整为[0,2],允许部分超配,同时保持风险可控[page::9,10]。

---

2.8 日内不同交易时点信号的有效性分析



图7和图8展示了不同交易时点信号与基准的超额净值,发现10:00信号表现较弱且为负收益。通过分析资金流和波动率(图9、图10),10:00对应的9:30-10:00为市场定价密集时段,波动大且噪音多,导致信号不稳定,建议剔除该时点策略输入[page::7]。

---

2.9 时序策略1和2回测结果及仓位动态


  • 时序策略1(非杠杆)

2018年以来无成本年化超额收益12.48%,最大回撤22.15%,风险明显低于基准48.22%(表4)。但因资金等权,无法充分发挥上涨行情的弹性,导致涨市年份收益不及基准,且实际费用后表现受压(表5)[page::8]。
  • 时序策略2(允许仓位倍数最高2)

通过扩大模型输出仓位至[0,2],实现对部分资产的超配,年化收益上升至14.17%,2020年成功实现正超额收益,但仍难超越2019年基准表现(表6)。最大回撤维持在20.77%,显著优于基准,大致保持防御性[page::9]。

图12显示策略仓位在市场下跌年份降低至20%左右,市场上涨年份升至约60%,体现策略自动调节仓位应对市场环境,能有效规避下跌风险,但回避上行弹性有限[page::9]。

---

2.10 时序策略3-5多空结构回测表现


  • 时序策略3(多空,持50%底仓,日内调仓2次,15:00回归底仓)

单边万1交易费率后年化超额收益5.00%(表7)。虽然收益率下降,但策略表现稳定,且在多数年份胜过基准,体现多空模式的实际应用潜力[page::10]。
  • 时序策略4(隔夜独立调仓一次,持50%底仓,15:00交易,次日11:00回到底仓)

交易频率低,交易成本影响降低,万1费率超额收益6.15%(表8)。年化波动和最大回撤高于日内策略,说明隔夜持仓增加波动性[page::10]。
  • 时序策略5(日内2次调仓+隔夜1次调仓,收盘仅做多)

有效融合日内和隔夜信号,单边万1费率超额收益9.35%,年化波动17.26%,夏普比率高达0.27(表9),风险调整后收益显著改善,且各年份表现均优于基准[page::11]。

---

2.11 ETF层面的策略测试与交易约束



报告将指数策略信号映射到对应流动性最优ETF(表10),模拟真实交易环境,增加反向卖出约束及成交价格敏感性:
  • 日内策略ETF实测

单边万1费率下年化超额收益4.53%,风险指标适中,夏普比率0.23-0.31(表11、12),体现策略的实盘可行性[page::12]。
  • 隔夜策略ETF实测

年化超额收益4.55%,波动及最大回撤有所增加,但整体风险收益比优于基准(表13、14)[page::13]。
  • 日内+隔夜综合策略ETF层面

费率万0.5与万1对应年化超额收益分别为8.41%和7.15%,波动度提升但夏普与Calmar比率大幅改善,显示综合策略在实际ETF交易中优于单独策略(表15、16)[page::13,14]。
  • 成交价格敏感性测试

以VWAP成交价进行前后5/10分钟的模拟,年化超额收益仅下降7-38bp,说明策略对成交时点相对稳健,具备一定滑点容忍度[page::14]。

---

2.12 策略的弹性分析及风险特征



ETF日内、隔夜及综合策略均体现“上涨β>1,下跌β<1”特征(表18),展现强劲的上涨弹性与较强的下跌防御能力。融合策略虽因隔夜仅做多设限导致防御略弱,但上涨β依旧高达1.59,弹性良好[page::14]。

胜率与盈亏比较平衡,日内、隔夜及综合策略单次调仓和日度胜率均在50%附近,盈亏比介于1.0-1.3,单次收益率虽有限,但连乘积累带来整体正向表现(表19)[page::14,15]。

---

2.13 策略与传统截面策略的互补性



图13展示两类策略日度超额收益率散点图,形成一定的“微笑曲线”形态:当截面策略为负收益时,时序策略往往表现较好,尤其截面策略日收益低于-30bp时,时序策略的超额收益率明显偏正。统计显示两策略相关性仅12.18%,表明收益来源差异显著[page::16]。

图14进一步验证,在截面策略表现最差的10个交易日里,时序策略中有9个日表现更优,平均超额收益率为正,成功弥补截面策略在极端行情下的缺口[page::16]。

---

2.14 报告总结与风险提示



报告总结强调,动量Transformer模型通过先进的深度学习架构和风险调整目标函数,成功构建出适应A股市场的日内+隔夜时序策略,帮助弥补了截面策略的短板,实现收益稳定提升和风险分散。策略在ETF上具有较好的实际可行性和交易执行稳定性,成本影响可控,滑点容忍度良好[page::17]。

风险方面,模型失效风险、数据测算误差风险及市场风格变化风险被明确提出,提示用户警惕可能的策略失效或适用性下降[page::1,17,18]。

未来方向指出可引入更丰富的高频数据、市场情绪指标和基本面因素,探索更低频次交易、策略组合融合及扩展至其他资产类别,提升策略适用性与性能[page::17]。

---

3. 关键图表深度解读



3.1 图1与图2:沪深300和中证1000分时段收益累计净值


  • 显示13:30-14:00时段指数收益呈持续下行趋势(红色曲线),而14:30至15:00时段呈明显上行趋势(金色曲线)。

- 全时段收益(灰色曲线)波动较大,但14:30-15:00时段表现稳定,提示该段交易具有持续性和可预测性。
  • 该时序规律为后续日内调仓策略提供了实证基础。


图1:沪深300分时段及全天累计净值(2018.01-2025.05)

图2:中证1000分时段及全天累计净值(2018.01-2025.05)

---

3.2 图3和图4:日内简单调仓策略表现


  • 通过调仓期望规避收益低迷阶段,放大收益强势时段。

- 调仓策略累计净值(红色)明显跑赢50%买入持有基准(棕色)。
  • 灰色区域显示超额收益,增厚效果稳定且显著。


图3:沪深300日内策略VS. 50% 买入持有

图4:中证1000日内策略VS. 50% 买入持有

---

3.3 图5:交易费率对日内策略年化收益率的影响


  • 收益率随交易费率线性下降,约从0.7%滑落至负收益。

- 说明高频调仓带来的成本压力显著,策略设计必须兼顾交易成本。

图5:沪深300日内策略不同交易费率下的年化收益率

---

3.4 图6:动量Transformer模型结构图


  • 图示模型由静态编码器、LSTM编码器、变量选择层、多头自注意力层及门控线性单元构成。

- 以夏普比率为损失函数,直接优化风险调整后的收益。
  • 模型设计兼顾长短期记忆和时间依赖性自适应挖掘,适用于复杂动量信号捕捉。


图6:动量Transformer模型结构示意

---

3.5 图7与图8:不同交易时点超额净值走势


  • 10:00信号表现最弱,累计净值低于基准,甚至为负。

- 11:00、14:00、15:00信号表现良好,累计净值稳步增长。
  • 提示早盘首个半小时的行情噪音较大,需谨慎使用。


图7:日内不同交易时点的超额净值

图8:剔除10:00后的交易时点超额净值

---

3.6 图9与图10:早盘成交量与波动率特征


  • 9:30-10:00成交量占比最高,约27%,显示集中竞价阶段流动性密集。

- 收益波动率亦最高,表明价格的噪声级信号多,导致该时段信号有效性低。

图9:个股30分钟成交量占比

图10:个股30分钟收益率波动

---

3.7 图11和图12:策略1的累计净值及平均仓位走势


  • 策略累计净值长期稳健上升,明显跑赢等权基准。

- 平均仓位年度波动较大,下行年份仓位降低至20%左右,风险控制明显。

图11:时序策略1累计净值

图12:时序策略1年度平均仓位

---

3.8 图13与图14:截面策略与时序策略超额收益的关系


  • 散点图显示两策略收益序列相关性低(12.18%),且呈现负相关“微笑形”,截面策略负超额时,时序策略多表现为正收益。

- 极端负收益日中,时序策略9/10天均跑赢截面,且多次实现正收益,为组合带来稳定性和防御力。

图13:截面策略与时序策略日超额收益率散点图

图14:截面策略超额收益率最低的10个交易日与对应的时序策略超额收益率

---

4. 估值分析



报告未涉及传统意义上的公司估值分析,因其核心为量化策略模型构建与回测验证,估值部分主要表现为模型绩效的风险调整收益指标,包括:
  • 收益指标:年化收益率、超额收益率

- 风险指标:年化波动率、最大回撤(MDD)
  • 风险调整指标:夏普比率、Calmar比率、Sortino比率、信息比率


通过引入夏普比率和信息比率作为模型训练的损失函数,直接优化风险调整后的长期表现,实现策略的稳定与优越[page::3-5,17]。

---

5. 风险因素评估



报告明确披露以下风险因素:
  • 模型失效风险:基于历史数据回测,未来市场可能出现结构性变化导致模型性能下降或失效。

- 市场风格变化风险:市场情绪和风格的转换可能影响策略因子的有效性及表现。
  • 数据测算误差风险:数据采集、处理及模型搭建过程中可能存在偏差,影响结果准确性。


报告未针对这些风险额外提供具体缓解措施,但通过模型结构调整、随机抽样训练、风险目标函数设计等手段,已着重提升策略稳定性和泛化能力[page::1,17,18]。

---

6. 批判性视角与细微差别


  • 报告在A股市场引入动量Transformer模型并进行结构修改,充分考虑本土市场特征,体现了方法论上的谨慎和创新。

- 然而,策略对于交易成本和滑点的敏感性虽被检测,但实际高频交易执行难度及冲击成本仍为一隐患,尤其在大规模资金运作中。
  • 拓展策略向多资产类别涵盖方向未有实证支持,未来需系统测试其泛化效果。

- 费率假设独立于市场流动性冲击存在理想化倾向,可能高估策略费后回报。
  • 报告较少披露模型训练细节中的过拟合风险控制和超参数调优情况,模型稳定性及再现性有待外部验证。


---

7. 结论性综合



本报告系统揭示了基于改进动量Transformer模型的时序交易策略在A股宽基指数及对应ETF上的应用价值,主要结论包括:
  • 通过精细的日内和隔夜仓位调节,策略在剔除高噪声时段后,成功捕捉了市场短时段非对称涨跌特征,实现了显著的超额收益。

- 模型创新性地采用多头自注意力机制并以夏普比率和信息比率为损失函数,克服了传统动量指标及LSTM模型的短板,增强了对跨周期趋势和风险的敏感度。
  • 经过针对A股高波动性市场的三大改进(损失函数调整、多重特征扩充、训练集随机划分),模型表现稳定、收益提升明显。

- 以多空多次调仓的时序策略,结合底仓机制限制,策略在无交易成本情况下多能跑赢基准,费后超额收益在5%-15%上下,波动率及最大回撤均能够合理控制。
  • ETF实测验证了策略的实际可行性和流动性容忍度,交易价格敏感性测试显示策略对成交时点选择较为稳健。

- 与传统截面因子策略收益相关性极低,且在截面策略明显亏损时,时序策略往往实现正收益,证明二者存在良好的协同分散化效应。
  • 报告提出未来改进方向,包括引入更多高频和情绪数据、降低调仓频率、策略融合和跨资产扩展,指明了后续研发重点。


综上,基于动量Transformer的日内和隔夜时序交易策略为量化投资领域提供了具有较强市场适应性和风险收益优势的新思路,是对传统因子策略有效补充。其潜在价值体现在凸显差异化的收益来源、提升极端市场中的抗压性及增强收益的稳定性上,值得进一步推广与深入开发[page::0-18]。

---

参考文献及资料来源


  • 《Trading with the Momentum Transformer: An Intelligent and Interpretable Architecture》

- Wind,米筐数据
  • 西部证券研发中心内部回测与研究资料


---

备注:本分析根据报告原文详细条目逐页溯源提炼,确保对关键论述、数据和图表均进行了系统且深入的解读。文章遵循原文逻辑顺序,专业严谨,文字清晰易懂,符合高级金融分析师报告撰写标准。

报告