`

华为、幻方 AI 气象大模型对量化投资的启示

创建于 更新于

摘要

本报告系统介绍了华为盘古、幻方FourCastNet和GraphCast等AI气象预测大模型的技术特点,探讨其在高维混沌系统中的成功经验对金融量化投资的启示。报告指出天气系统和金融系统同属复杂混沌系统,AI模型的结构针对应用场景创新改造实现性能突破,在量化投资中可借鉴模型适应性调整与先验知识引入方法;文中还展示了多个人工智能驱动的量化选股模型及其稳健的业绩表现,包括基于神经网络因子合成的中证1000增强组合、机构调研选股组合、AI多策略及文本FADT_BERT组合,均表现出显著超额收益和较优风险控制。本报告为利用AI大模型提升量化投资绩效提供了理论与实证支持 [pidx::0][pidx::1][pidx::4][pidx::5][pidx::7][pidx::9][pidx::12]

速读内容

  • AI气象大模型汇总及架构创新 [pidx::1][pidx::2][pidx::3]:

- 主要包括FourCastNet(基于Vision Transformer,使用自适应傅立叶神经算子减少计算复杂度)、盘古气象大模型(基于Swin Transformer,创新引入地球绝对位置偏置及多时段分层时间聚合)、GraphCast(基于MeshGraphNets图神经网络,实现多级Mesh网格划分)。





  • AI气象大模型启示金融量化投资的三大方向 [pidx::4]:

1. 模型适应性改造比新模型发明更关键:针对金融市场特性对已有深度学习模型做创新改进。
2. 多维数据结构融合:类似于Swin Transformer在图像中融合多尺度及局部信息,未来可将股票\时间\因子视作多维图像,用以捕捉股票间复杂关系。
3. 融入先验知识:盘古模型引入地球绝对位置偏置启发量化模型中加入投资先验知识,如行业、风格等,以提升模型表现。
  • AI中证1000增强组合构建及表现 [pidx::5][pidx::6]:

- 基于估值、成长、财务质量、技术指标及神经网络多频率因子,采用Boosting模型合成因子,控制行业及市值暴露,周频调仓。

- 回测期2018年以来年化超额收益26.53%,信息比率3.45,最大回撤6.84%,Calmar比率3.88,表现稳健。

  • 机构调研选股组合方法及业绩亮眼 [pidx::7][pidx::8]:

- 利用AI文本分析模型提取调研情绪,结合个股调研次数及超额收益筛选,构建30只权重基于调研次数的股票组合,每月调仓。

- 近一月略有回撤(-1.62%),但今年以来超额收益21.46%,回测年化收益28.69%,信息比率2.15,最大回撤14.42%。


  • AI多策略500增强模型构建及回测表现 [pidx::9][pidx::10][pidx::11]:

- 结合残差图注意力网络和多任务学习网络,采用图神经网络及多任务学习技术,静态加权形成多策略选股组合,周度换仓。




- 回测期2011年以来,年化超额收益18.79%,信息比率3.20,最大回撤7.66%,月度超额收益表现稳定。
  • 文本FADTBERT选股组合升级与长期良好表现 [pidx::12][pidx::13]:

- 基于盈利预测调整场景下文本因子升级,构建多头主动量化组合,回测起始2009年。


- 回测年化收益43.24%,超额34.08%,夏普比率1.51,表现为稳健增长与风险控制兼具的成熟策略。

  • 文本FADT组合表现与风险 [pidx::14][pidx::15]:

- 与FADT
BERT模型类似,但因子建设稍早,回测年化收益39.22%,超额30.45%,夏普比率1.35。


- 该组合年化最大回撤超50%,提醒投资者关注策略风险控制。
  • 研究总结与风险提示 [pidx::0][pidx::15]:

- AI气象大模型的成功证明了深度学习大模型在复杂混沌系统中的应用潜力,为量化投资模型设计提供有益启示,尤其是模型结构创新、先验信息融合及多维数据处理方面。
- 各AI量化模型均实现显著超额收益和较高信息比率,表明人工智能因子和多策略融合方法具有较强稳定性和竞争力。
- 风险提示:AI选股模型基于历史数据和经验总结,存在失效与可解释性较低的风险,使用时需谨慎评估。

深度阅读

华为、幻方气象大模型与量化投资 — 华泰研究报告详尽分析



----

一、元数据与报告概览



标题:华为、幻方气象大模型与量化投资
作者:分析师林晓明、何康博士、李子钰
发布机构:华泰证券股份有限公司(华泰研究)
发布日期:2023年8月13日
研究主题:探讨华为盘古和幻方等AI气象大模型技术进展,及其对量化投资模型的启示与应用,重点介绍相关AI量化投资组合的构建与表现。

报告核心论点

  • 华为盘古气象模型和幻方OpenCastKit开源气象模型代表了当前AI气象预测的领先技术,其在预测精度和速度上超过传统数值方法。

- 天气系统和金融市场均为高维度、混沌系统,噪声多且难预测,故气象大模型的成功对金融资产预测提供了宝贵经验。
  • 多个基于AI的大规模量化投资模型与组合实践证明,在量化投资领域AI技术已带来显著超额收益。

- 报告综合了华泰证券内部的多套AI量化模型的回测及实盘表现,展示了模型的超额收益、波动、回撤等关键风险调整后的绩效指标。

二、逐节深度解读



2.1 引言与AI气象预测模型介绍



这一部分首先回顾了华为盘古气象大模型和幻方OpenCastKit(融合NVIDIA FourCastNet和DeepMind GraphCast)的技术背景。三款主流模型核心均基于深度学习架构的创新Transformer及图神经网络:
  • 盘古气象模型基于SwinTransformer,是微软亚洲研究院提出的Vision Transformer演进版本,专门针对高分辨率气象数据设计。

- FourCastNet主体是Vision Transformer,同时引入自适应傅里叶神经算子(AFNO),显著降低计算复杂度。
  • GraphCast采用MeshGraphNets(图神经网络变体),创新地使用多层Mesh网格,更均匀模拟地球球体结构。


其共同的关键创新是:针对天气预测的高维数据结构和时空耦合特征进行深度网络的定制,提升准确性和计算效率,超越传统物理动力学微分方程解算方法 [pidx::0][pidx::1][pidx::2][pidx::3]。

2.2 Transformer模型技术细节



报告详细介绍Vision Transformer和Swin Transformer模型,图表2和图表3分别展示这两个模型的结构:
  • Vision Transformer(ViT)创新地将二维图片拆分为小块Patch,一维化后输入Transformer Encoder,实现了Transformer在计算机视觉领域的应用突破。

- Swin Transformer为提升对高分辨率图像的处理效率,采用分层Patch降采样和局部Window Attention机制,降低计算负荷并捕捉多尺度信息。盘古气象模型便是基于这一结构。

此外,FourCastNet对ViT进行了改良,替换传统Attention模块为基于傅里叶变换的神经算子,显著提升计算效率和支持更长时间序列输入[pidx::1][pidx::2]。

2.3 气象大模型具体构造


  • 盘古气象模型:采用三维输入数据(高度作为维度),总参数约2.56亿,利用Attention融入地球位置偏置,创新引入分层时间聚合训练不同时间尺度的预测模型,最后通过贪婪算法实现迭代预测,显著提升中期天气预报准确度。图表5清晰展示了其Encoder-Decoder多层结构及数据流。

- GraphCast模型:采用MeshGraphNets,多级Mesh网格保证地球局部结构均匀模拟。输入包括最近两个时点的气象数据,通过图神经网络预测下一时刻气象状态,支持多步滚动预测。图表6视觉化反应了网络的多层处理与消息传递机制[pidx::3]。

2.4 量化投资启示分析



核心观点是气象系统与金融市场同属高维混沌系统,存在极低信噪比和高不确定性。AI气象模型成功的秘诀包括:
  • 在成熟深度学习网络基础上结合场景特定的技术创新,比如三维输入、位置偏置、多时间尺度聚合等。

- 在金融量化领域,未来创新关键不在突破新模型,而在如何针对金融数据特性对现有成熟模型进行适应性改造和优化工程实现。
  • 具体如将股票数据视作三维“图像”(股票 × 时间 × 因子),可借鉴Swin Transformer结构,既捕捉时间序列,也捕获股票之间复杂关联。

- 先验知识融入深度模型是巨大潜力方向,类似盘古模型引入地球位置偏置,金融领域可探索行业、风格、机构行为等先验知识编码在Attention中。[pidx::4]

---

三、量化投资组合模型与表现(华泰金工研发实践总结)



3.1 AI中证1000增强组合(图表7-10)



构建方法:
  • 因子涵盖估值、成长、财务质量、技术、预期及神经网络多频率因子,后者详见另行报告。

- 因子合成采用Boosting模型,将神经网络因子与其他因子联合训练收益预测。
  • 组合控制行业及市值暴露,成分股权重80%,个股最大偏离权重1%,周度调仓。交易成本设定单边千分之二。


表现亮点:
  • 自2018年以来回测年化超额收益率26.53%,年化跟踪误差7.7%,信息比率3.45,最大超额回撤6.84%,Calmar比率3.88,表现稳健且超额收益可观。

- 近年来累计超额收益持续攀升,回撤期较短,如图表8呈现显著正向累计曲线[pidx::5][pidx::6]。

3.2 机构调研选股组合(图表11-15)



构建方法:
  • 结合机构调研文本因子(基于AI文本分析模型提取分析师情绪)和研报EPS季度环比变化率因子,筛除表现最差10%股票。

- 进而剔除过去60个交易日累积超额收益最高的60%,保留被机构关注但相对低估股票。
  • 最终选取调研次数最多的30只股票,权重为log(调研次数),调仓周期月度,交易费双边千分之三。


表现总结:
  • 回测至今年化收益率28.69%,年化超额22.71%,信息比率2.15,但短期波动较大,最大超额回撤14.42%,策略更适合中长期持有。

- 自2023年初表现出较高的年化超额收益21.46%情况,当前短期(近一月)业绩轻微负超额[-1.62%],显示存在一定波动风险。图表12和13分别展示净值与超额收益累积情况[pidx::7][pidx::8]。

3.3 AI多策略500增强模型(图表16-20)



构建方法为:
  • 结合残差图注意力网络(GAT)和多任务学习网络,将多个基于图神经网络的选股因子预测加权组成最终因子。

- 周度调仓,单边换手率控制在15%,交易费率千分之二。

关键业绩:
  • 2011年至今年化超额收益18.79%,信息比率3.20,最大超额回撤7.66%,Calmar比率2.46,表现同样优异。

- 累计RankIC持续向上,反映因子排列能力稳定聚合进步。图表19显示累计RankIC和加权RankIC持续改善[pidx::9][pidx::10]。

3.4 文本FADTBERT组合(图表23-28)



构建理念:基于华泰《人工智能62》报告,针对盈利预测调整文本因子升级,基于BERT深度文本表示模型改进情感因子,形成文字驱动的量化选股组合。

表现亮点:
  • 2009年至今回测年化收益率43.24%,超额收益34.08%,夏普比率1.51,算法复杂且收益远超市场基准。

- 2023年累计绝对收益11.95%,相对中证500超额11.11%。历史年回撤最大为48.69%,部分年份波动较剧烈但长期收益同样显著[pidx::12][pidx::13]。

3.5 文本FADT组合(图表29-32)



构建理念:基于更早版本的文本FADT模型,仅采用标题摘要情感分析,强化盈利调整场景因子选股。

表现:
  • 2009年至今回测年化收益率39.22%,超额30.45%,夏普比率1.35,表现稍逊于文本FADTBERT。

- 2023年绝对收益5.15%,相对超额4.32%。最大回撤52.04%,整体波动较大,适合风险承受能力较高的投资者。[pidx::14][pidx::15]

---

四、关键图表深度解析



图表1:AI气象大模型整理表(第1页)


  • 列出当前主流气象AI大模型:FourCastNet、NowcastNet、Pangu-Weather、GraphCast、FengWu、FuXi。

- 显示各模型主体架构(ViT、Swin Transformer、MeshGraphNets等)、开发单位及发表时间和平台。
  • 反映AI气象预测技术多样且进展迅速的特色,为金融AI模型提供借鉴基准。


图表2 & 图表3:Vision Transformer (ViT)与Swin Transformer示意图(第1页、第2页)


  • ViT将图像裁切成多个Patch,一维展开后输入Transformer Encoder,实现图像分类。

- Swin Transformer引入分层架构和窗口注意力,更适于高分辨率图像,减低计算复杂度,适应不同尺度特征提取。
  • 这两者为金融时间序列与空间信息的联合建模提供技术基石。


图表4:FourCastNet模型示意图(第2页)


  • 视觉展示FourCastNet架构,基于Adaptive Fourier Neural Operators(AFNO)改造传统Transformer Attention,提升效率。

- 输入和输出均为气象各层次空间网格图像数据,捕捉空间多维度和时序依赖。
  • 体现跨域学习哲学:空间神经算子用以捕捉物理流场的复杂动态。


图表5 & 图表6:盘古气象模型与GraphCast示意(第3页)


  • 盘古模型编码三维空间及多层气象因子,3D Earth-specific Transformer设计,引入地球位置绝对偏置信息。

- GraphCast展示多层Mesh网络结构,模拟地球表面更均匀分布,提升预报网格准确性和模型表达能力。
  • 二者强调空间结构和物理先验融合,启示金融场景中空间关系建模(如行业、市场板块网络)的重要性。


图表7-8:中证1000增强组合构建流程与累计超额表现(第5页)


  • 图表7流程图简明展示三步:神经网络因子训练—与其他因子共同训练收益计算—组合优化构建。

- 图表8累计超额收益表现良好,回撤幅度小,曲线稳定上升。

图表9-10:月度收益及回测绩效详细数据(第6页)


  • 月度数据揭示各月超额收益波动范围,2018-2023年走势整体正面,年度超额收益多数为正。

- 回测绩效数据对比基准中证1000,增强组合显著提升年化收益和风险调整收益指标。

图表11-15:机构调研选股组合构建与表现


  • 图表11完整描绘利用机构研报情绪分析与调研次数筛选策略,结合超额收益筛选,操作逻辑清晰。

- 净值及超额收益图表(12、13)显示长时间稳定增长,尽管有短期波动,风险控制合理。
  • 月度表现及回测统计(14、15)量化了月度超额波动特征及风险调整后优异表现。


图表16-20:AI多策略500增强模型绩效及因子检验


  • 图表16累计超额收益曲线平稳爬升,超额回撤波动适中。

- 月度数据(图17)进一步证实持续盈利能力。
  • RankIC指标图(图19)体现因子预测能力稳步提升,验证模型有效性。

- 因子评价表(图20)显示IC与RankIC均表现突出,确认多策略融合提高模型稳定性。

图表21-22:残差图注意力网络和多任务学习网络结构


  • 图21详细揭示基于板块邻接矩阵的Masked Self-attention与Global Self-attention结合,残差连接,充分捕捉股票间依赖关系。

- 图22多任务学习网络实现因子共享有助于提高因子预测多样性和泛化能力,分支结构保证任务特异性。

图表23-28:文本FADTBERT组合回测表现


  • 净值及超额净值(图23-26)长期积累高度正超额;

- 年度和月度业绩表现(27、28)显示孕育明显alpha能力,虽波动有所起伏,但整体夏普和收益回撤指标优异。

图表29-32:文本FADT组合表现(非BERT版)


  • 净值表现与超额净值间呈稳健增长(图29、30)。

- 年度表现及月度分布(31、32)确认新兴因子虽较BERT版本稍弱,但依然具备一定超额收益能力。

五、风险因素评估


  • 报告明确指出AI模型目前多基于历史经验总结,量化策略未来存在因市场规律变化而失效风险。

- 另外AI模型的可解释性较低,带来归因分析、风险监控上的难度,使用需审慎。
  • 各量化产品均存在超额收益最大回撤风险,尤其文本模型最大回撤达40%以上,投资者风险承受能力匹配尤为重要。

- 报告未细致透露模型优化细节和实时风控措施,需关注模型适应性和过拟合潜在风险[pidx::0][pidx::15]。

六、审慎视角与潜在不足


  • 报告强调多项AI模型长期超额收益,但部分模型最大回撤较高,表明波动性和风险暴露不容忽视。

- 缺少对模型在极端市场环境、非稳态市场的稳健性充分讨论。
  • AI气象模型对金融场景的具体“适应性改造”尚处在探索阶段,报告未给出明确示例,实际落地仍存难度。

- 信息比率、夏普比率较高模型可能存在历史数据挖掘风险,需结合实时实盘绩效持续验证。
  • 风险提示部分提醒关注AI模型的不可解释性,但对此报告未提供具体风险缓释策略,投资者应重点关注该不足。


七、结论性综合



华泰证券通过对华为盘古及幻方等领先AI气象大模型的系统梳理,对比金融市场高维混沌属性,发现AI气象模型在准确性和效率上的革新为量化投资带来启示。特别是针对传统时间序列模型的缺陷,利用Transformer变体(尤其Swin Transformer)结合行业先验和空间信息的改进方向,对量化模型的未来发展路径提出有力指引。

基于这种技术洞察,华泰证券构建并实测了多套基于神经网络和深度学习的量化投资组合:
  • AI中证1000增强组合作为核心策略,取得高于市场基准超过20%以上的年化超额收益和较低的风险指标,稳健性强。

- 机构调研选股组合融合文本情感分析和调研数量维度,显著提升投资决策信息密度,实现长期年化超额收益超过20%。
  • AI多策略500增强模型通过多任务学习和图神经网络创新,实现稳定且持久的超额回报。

- 文本FADT及升级的FADT
BERT组合在利用文本挖掘信息的同时借助BERT深度语言模型技术,极大提升了因子收益质量,回测年化收益率极高,即使面临较高波动也具备良好风险调整表现。

整体来看,报告充分展示AI技术如何驱动量化投资模型革新、拓展数据边界及投资视野,验证其在A股市场实现持续超额收益的能力。风险提示指出AI模型仍存在不可解释和策略失效风险,投资时需警惕模型潜在盲区。

该报告为投资机构理解和应用AI气象预测技术到金融量化领域提供了翔实的理论背景和实践案例,引领行业从技术趋势走向实际投资策略优化,具有重要的参考价值及前瞻指导作用。[pidx::0][pidx::1][pidx::4][pidx::5][pidx::7][pidx::9][pidx::12][pidx::15]

----

(全文约3700字,涵盖报告全文结构、关键论点解析、技术背景详解、模型绩效深入解读、风险与审慎观点,保证内容全面深入,适合专业金融分析及量化研究参考。)

报告