MDGNN: Multi-Relational Dynamic Graph Neural Network for Comprehensive and Dynamic Stock Investment Prediction
创建于 更新于
摘要
本报告提出了多关系动态图神经网络(MDGNN)框架,系统揭示股票投资中的多维关系和时序演变,利用多关系图构建多元实体及其交互,结合Transformer捕捉演化动态,实现对股票涨跌的精准预测。实验表明,MDGNN在沪深指数数据集上显著优于主流时序及图模型,提升预测效果及投资回报率,验证了多关系动态图在复杂金融系统建模中的优势 [page::0][page::1][page::4][page::5][page::6]。
速读内容
- MDGNN模型设计与创新 [page::2][page::3]

- 构建多关系图,包括股票、行业、投资银行三类节点及多种边关系。
- 设计层次化多关系图嵌入层,采用基于多头注意力的聚合机制,整合不同Meta-path上的信息。
- 利用Transformer结构捕捉图快照间的时序演化,结合相对位置偏置(ALIBI)和前向屏蔽保证时间依赖性。
- 实验环境与数据集详情 [page::4]
| 数据集 | 股票数量 | 银行数量 | 行业数量 | 边数量 |
|---------|----------|----------|----------|------------|
| CSI100 | 100 | 196 | 97 | 18,950,706 |
| CSI300 | 300 | 202 | 191 | 62,500,988 |
- 42维输入特征涵盖市场表现、估值、公司类别及机构共识预测。
- 回测区间2020年至2023年,半年为训练周期,逐步训练和验证。
- MDGNN与主流模型对比表现 [page::5]
| 方法 | CSI100-IC | CSI100-IR | CSI100-CR | CSI100-Prec@30 | CSI300-IC | CSI300-IR | CSI300-CR | CSI300-Prec@30 |
|-------------|-----------|-----------|-----------|----------------|-----------|-----------|-----------|----------------|
| MLP | 0.0027 | 0.0282 | 0.1166 | 0.4751 | 0.0039 | 0.0314 | 0.1721 | 0.4958 |
| LSTM | 0.0040 | 0.0335 | 0.1289 | 0.4808 | 0.0049 | 0.0345 | 0.1859 | 0.4958 |
| Transformer | 0.0058 | 0.0422 | 0.1383 | 0.4987 | 0.0063 | 0.0442 | 0.2122 | 0.5065 |
| GAT | 0.0031 | 0.0274 | 0.1534 | 0.4812 | 0.0066 | 0.0454 | 0.2653 | 0.4991 |
| GCN | 0.0038 | 0.0305 | 0.1616 | 0.4927 | 0.0075 | 0.0674 | 0.2816 | 0.5055 |
| RGCN | 0.0104 | 0.0578 | 0.1912 | 0.4985 | 0.0090 | 0.0845 | 0.5159 | 0.5104 |
| HAN | 0.0108 | 0.0525 | 0.2267 | 0.4997 | 0.0086 | 0.0848 | 0.3511 | 0.5112 |
| HGT | 0.0112 | 0.0657 | 0.2384 | 0.5036 | 0.0115 | 0.0874 | 0.4108 | 0.4923 |
| EvolveGCN | 0.0065 | 0.0538 | 0.1815 | 0.4961 | 0.0080 | 0.5012 | 0.4989 | 0.4830 |
| HTGNN | 0.0118 | 0.0724 | 0.2643 | 0.5039 | 0.0192 | 0.1773 | 0.4653 | 0.5126 |
| MDGNN | 0.0123| 0.0746| 0.2741| 0.5081 | 0.0322| 0.2488| 0.9828| 0.5232 |
- MDGNN在两个数据集上所有评测指标均领先,尤其CSI300提升显著。
- 组件消融与关系效果分析 [page::5]
| 移除组件 | IC | IR | CR | Prec@30 |
|---------------|---------|---------|---------|----------|
| 无边权重 | 0.0268 | 0.2155 | 0.8950 | 0.5152 |
| 无Meta-path | 0.0216 | 0.1723 | 0.7502 | 0.5076 |
| 无层次聚合 | 0.0303 | 0.2392 | 0.9402 | 0.5227 |
| 无时序提取 | 0.0286 | 0.2226 | 0.8745 | 0.5215 |
| 全模型(MDGNN)| 0.0322 | 0.2488 | 0.9828 | 0.5232 |
- Meta-path模块去除导致最大性能下降,强调多关系的重要性。
| 关系组合 | IC | IR | CR | Prec@30 |
|---------------------|----------|----------|----------|----------|
| 仅股票间关系(SS) | 0.0217 | 0.1727 | 0.7372 | 0.5128 |
| 包含银行边(SB) | 0.0264 | 0.2092 | 0.8220 | 0.5203 |
| 仅行业间关系(II) | 0.0210 | 0.1632 | 0.7133 | 0.5101 |
| 含行业边(ST,II) | 0.0217 | 0.1802 | 0.7755 | 0.5134 |
| 无具体说明组合 | 0.0283 | 0.2300 | 0.9074 | 0.5208 |
| 全关系 | 0.0322 | 0.2488 | 0.9828 | 0.5232 |
- 投资银行关系对性能提升贡献最大,行业关系次之。
- 实例分析与超参数调优 [page::6]


- 在一个投资银行持股的典型子图中,MDGNN准确捕捉银行股联动上涨趋势,优于传统时序模型。
- 窗口大小为10和GNN层数为2或3时模型表现最优,参数过大则出现过拟合。
深度阅读
MDGNN: Multi-Relational Dynamic Graph Neural Network for Comprehensive and Dynamic Stock Investment Prediction - 深度分析报告
---
1. 元数据与概览
标题: MDGNN: Multi-Relational Dynamic Graph Neural Network for Comprehensive and Dynamic Stock Investment Prediction
作者与机构: Hao Qian等,Ant Group与Alibaba Group,均位于中国杭州。
发布日期: 未明示确切发布日期,但文献引用时间反映为2023年前后。
主题: 本报告探讨的是股市价格动态预测,尤其侧重于如何利用多关系动态图神经网络(MDGNN)整合多元、多时序的复杂股票关系,从而提升股票投资预测的准确性。
核心观点:
传统的股票价格预测方法存在两个主要瓶颈:(1)缺乏对股票间多重关系的综合建模;(2)忽略了股票关系与价格的时间动态演化。为此,作者提出了Multi-relational Dynamic Graph Neural Network (MDGNN),该框架通过每天构造多维关系动态图,结合图神经网络与Transformer模型,动态捕获股票之间错综复杂、多层次的关系及其时间走势,从而获得更全面的股票市场信息表达,并在多个公开数据集上优于现有最先进系统(SOTA)[page::0-1]。
---
2. 逐节深度解读
2.1 摘要与引言
- 关键论点:
股票价格预测难度主要源于价格动态受多方面因素影响,其中关系网络复杂且随时间变化。传统方法多聚焦于序列模型或静态图模型,忽视多层关系结构及其演变。MDGNN则通过建立包含股票、行业、投行多节点类型、多重关系的动态图,结合Transformer编码器,动态提取时间序列信息,解决了前述不足。
- 推理依据:
股票市场涉及投资者行为、经济数据、新闻报道等多种影响因素,且股票间高度关联。单一关系或静态图无法有效覆盖所有影响因素,掩盖了潜在的交互作用和时间演变。MDGNN框架利用多关系动态图提升表达能力和时序感知能力。
- 数据点与假设:
股票价格运动非独立事件;多层关系(例如“股-股”、“股-行业”、“股-投行”)均对价格有实质影响;关系网络每日变化,故采用离散时间快照动态图。
- 复杂概念:
- 多关系动态图(Multi-relational Dynamic Graph): 节点通过多种不同类型的边相连;这些边以及节点属性在时间序列上演变。
- 图神经网络(GNN)与Transformer结合: GNN负责单日图的多关系信息聚合,Transformer捕捉时间维度的动态演化。
2.2 相关工作
- 传统趋势预测方法涵盖线性回归、XGBoost、LSTM等,但通常忽略股票间交互。
- 静态GNN如GCN、GAT不能捕捉时序演变。
- 动态图模型(例如EvolveGCN、HTGNN)尝试较好捕捉时序动态,但多关系建模仍偏弱。
- MDGNN结合动态多关系图与强时序编码,填补此空白。
2.3 基础定义与问题设定
- 将股票市场关系定义为时间序列快照的多关系图集合$\mathcal{G} = \{\mathcal{G}1, \mathcal{G}2,...,\mathcal{G}T\}$,每个$\mathcal{G}t=(\nut, \mathcal{E}t, \mathcal{R}t)$为第$t$交易日的图,节点是股票、行业、投行等,边表示多关系类型。
- 预测任务为节点回归(node regression),输出为未来一交易日的相对收益率,与基准指数收益对比的超额收益。
- 训练目标为最小化损失函数$\mathcal{L}$,保证模型$f(\mathcal{G}, \Theta)$预测准确。
2.4 算法设计
2.4.1 Intra-day层(单日多关系图构建与嵌入)
- 构建多关系图:节点包括股票($S$)、行业($T$)、投行($B$)。
- 三类关系:
- 股票-行业关系 ($\mathcal{E}{ST}$):涵盖产业链上下游、政策影响、成本/需求变化等。
- 股票-投行关系 ($\mathcal{E}{SB}$):投行对股票的买卖行为、研究报告等影响。
- 股票-股票关系 ($\mathcal{E}{SS}$):同产业股票、共股东持股等关联。
- 数据来源: 通过每日交易数据及文本数据(宏观报告、新闻、财报)结合金融词典抽取关系边。
- 图嵌入层:
- 利用多头图注意机制带权边特征,计算节点邻居加权聚合。
- 定义三条元路径meta-paths($SS$,$S B S$,$S T T S$);每条路径分别生成股票节点表示 ${\bf h}{i1}, {\bf h}{i2}, {\bf h}{i3}$。
- 利用关系注意力进行层次融合:赋予不同权重对多路径嵌入进行加权求和,得到最终股票表示$\mathbf{h}{vi}$。
- 堆叠$L$层实现信息从局部到全局的逐渐扩散。
2.4.2 Inter-day Temporal Extraction层(时序动态捕捉)
- 针对每只股票生成过去$\delta
- 采用Transformer结构,将股票嵌入序列转换为Query (Q)、Key (K)、Value (V)。
- 引入ALIBI位置偏置,鼓励模型关注近期事件(位置距离越远,惩罚越高),并通过前向掩码防止信息泄漏未来。
- 最终通过自注意力机制,计算时间依赖的节点表示$\mathbf{z}{vt}$,动态捕获股票关系的演变。
2.4.3 预测层
- 基于动态表示$\mathbf{z}
---
3. 图表深度解读
3.1 图1(MDGNN架构示意)
- 描述: 图示明晰展现了多层次流程:从多关系图的每日快照构建、多路径聚合,到时间维的Transformer编码,最终输出投资预测。
- 关键趋势与关系:
- 多个时间点的图$\mathcal{G}1, \mathcal{G}2,... \mathcal{G}T$体现了动态图的时间维度。
- “Step1-3”表示基于三类节点之间的多重边关系的聚合策略,突出多关系与层次结构。
- Transformer编码块通过带有ALIBI位置编码(Q,K,V的点积加权)实现时序特征捕捉。
- 联系文本: 图中设计逻辑对应算法设计部分,展示如何系统地集成和编码多关系与时间序列的双重信息。

3.2 表1(数据集统计)
| 数据集 | 股票数 | 投行数 | 行业数 | 边数 |
|---------|---------|---------|---------|------------|
| CSI100 | 100 | 196 | 97 | 18,950,706 |
| CSI300 | 300 | 202 | 191 | 62,500,988 |
- 解读: CSI300规模显著大于CSI100,覆盖更多股票及行业节点,图更大更复杂,验证了MDGNN模型在大规模场景下的信息捕获能力。
3.3 表2(与基线模型比较的绩效)
- 指标: IC、IR、累计收益CR、Top30精度(Prec@30);均显示MDGNN优于传统时序模型(LSTM、Transformer)、单一关系图模型(GCN、GAT)、多关系异构图模型(RGCN、HAN、HGT)以及动态图模型(EvolveGCN、HTGNN)。
- 量化优势:
CSI300中IC由最佳基线0.0192提升至0.0322+;RP指标提升幅度达到近40%。
- 趋势解析: 表明多关系及动态时序的综合建模带来了显著性能提升,尤其在样本更丰富的CSI300中表现更明显。
3.4 表3(组成部分消融实验)
| 组件去除 | IC | IR | CR | Prec@30 |
|----------------|-------|-------|-------|---------|
| 无边权(w/o edge) | 0.0268| 0.2155| 0.8950| 0.5152 |
| 无元路径(w/o meta-path) | 0.0216| 0.1723| 0.7502| 0.5076 |
| 无层次聚合(w/o aggregation) | 0.0303| 0.2392| 0.9402| 0.5227 |
| 无时间层(w/o temporal) | 0.0286| 0.2226| 0.8745| 0.5215 |
| 完整模型(MDGNN) | 0.0322| 0.2488| 0.9828| 0.5232 |
- 说明: 去掉元路径对性能影响最大,说明多关系路径结构是核心设计优势。时间层与边权也有显著贡献,层次聚合稍微次之。
3.5 表4(关系类型作用验证)
| SS | SB | ST | II | IC | IR | CR | Prec@30 |
|-----|-----|-----|-----|-------|-------|-------|---------|
| ✔ | - | - | | 0.0217| 0.1727| 0.7372| 0.5128 |
| | ✔ | - | | 0.0264| 0.2092| 0.8220| 0.5203 |
| | | - | | 0.0210| 0.1632| 0.7133| 0.5101 |
| | - | | ✔ | 0.0217| 0.1802| 0.7755| 0.5134 |
| | | | - | 0.0283| 0.2300| 0.9074| 0.5208 |
| | | | | 0.0322| 0.2488| 0.9828| 0.5232 |
- 解读: 表明股票-投行(SB)关系对模型贡献最大,股票间(SS)次之,行业关系(ST, II)影响较小但不可忽略,支持构建多关系网络的设计理念。
3.6 图2(案例研究)
- (a) 子图展示四支银行和地产相关股票及其持股机构之间的多关系网络。
- (b) 多模型对股票变化率预测对比,MDGNN更准确预测了上涨趋势,体现其多关系传染机制能力。
- (c) 不同行业变化率对比,银行和地产受多关系网络影响更大,验证行业异质性。

3.7 图3(超参数敏感度)
- (a) 窗口大小:累计收益随窗口增加先升后趋稳,窗口为10表现最佳。
- (b) GNN层数:层数增加带来性能提升,4层后出现过拟合趋势。

---
4. 估值分析
本报告为学术/技术研究性质,无直接的企业估值内容,故不涉及传统估值模型(DCF、市盈率等)。但算法性能提升可视为对股票选择策略价值的间接体现。
---
5. 风险因素评估
报告未明文列出风险因素,但结合内容隐含如下风险或限制:
- 数据质量和表示能力:多关系图构建依赖多源数据及文本挖掘,数据质量问题可严重影响模型表现。
- 模型复杂度与过拟合风险:多层GNN及Transformer模型可能导致过拟合,尤其在数据不足或关系噪声较大时。
- 动态关系建模时效性:适用性可能受限于快速变动的市场结构,例如非正常波动事件影响。
- 计算资源:大规模多关系动态图计算与训练需求高,限制实际应用。
报告中通过验证集和提前停止技术部分缓解过拟合风险,并通过多数据集验证增强模型鲁棒性。
---
6. 批判性视角与细微差别
- 偏见与假设依赖:
作者强烈假设多关系及时序动态是股票预测核心驱动,但在某些市场极端情景(黑天鹅事件)可能失效。
- 模型解释性不足:尽管提出基于注意力机制的权重分析,可用于解释哪些关系重要,但实际金融因果分析仍然较弱。
- 异构关系权重设计:关系权重学习依赖模型自适应,实际对投资决策的重要性或因果方向缺少明确分析。
- 市场外因素缺失:宏观政治、突发新闻等外部影响并未直接纳入,此类因素对股价影响有时非常关键。
- 实验数据限制:主要以中国市场CSI100、CSI300为样本,跨市场迁移性能未论述。
---
7. 结论性综合
本文首次系统定义并实证股票价格动态预测中的多关系(多方实体及其多连接类型)与时间演变特性,提出了基于多关系动态图结构的MDGNN模型,集成图神经网络层和时间序列Transformer层,实现对股票及其关联实体(行业、投行)复杂关系的动态聚合与演绎。
通过对比多个传统时序模型(MLP, LSTM, Transformer),静态图模型(GCN, GAT, RGCN,HAN,HGT)以及动态图神经模型(EvolveGCN, HTGNN),MDGNN在两个主要中国股市指数数据集上所有指标(信息系数IC,信息比率IR,累计收益CR,Top-k精度)均取得了显著领先,特别是在包含更多多元关系和大规模节点的CSI300数据集上的表现更为突出[page::4-5]。
模型设计中特别强调多关系图的构建——包含股票-股票、股票-投行、股票-行业及行业间多层连接,且通过层次聚合与关系注意力机制精准融合多种关系表示,消融实验印证多关系元路径模块的核心价值[page::5]。案例研究进一步展示此多关系动态传播机制如何有效捕获市场热点趋势,提升预测准确率[page::6]。超参数实验表明模型在窗口长度和图层深度上具有一定鲁棒性,合理设置将获得最佳性能。
总体而言,MDGNN为股票投资预测引入了创新的动态多关系图建模范式,填补了现有模型多关系与时间演化两方面的不足,为金融领域的深度时序图学习树立了典范与实践基础。未来方向可从模型解释性、非结构化信息融合(新闻、宏观事件)、跨市场适应及轻量化部署等方面深入。
---
参考文献说明
报告引用了大量近年主流图神经网络(GCN, GAT, RGCN, HGT等)及Transformer经典论文,同时结合金融领域多因子模型、机器学习趋势预测研究,确保理论基石稳固,方法与实证切合股市实际,技术路线科学合理。
---
总结
MDGNN通过搭建并动态更新涵盖股票、行业、投行多元关系的动态图,利用分层多关系图注意力机制及Transformer时序编码模块,能够精准捕捉多层、多源异构信息及其随时间推移的演变特征,实现更加有效的股价变动预测。基于数据驱动的全面验证显示该模型在多项关键性能指标上均优于既有主流基线,为金融预测领域提供了显著的技术进步路径。