CausalStock: Deep End-to-end Causal Discovery for News-driven Stock Movement Prediction
创建于 更新于
摘要
本报告提出了CausalStock模型,通过设计滞后依赖的时序因果发现机制,结合基于大语言模型的降噪新闻编码器,实现新闻驱动的多股票运动预测。该模型可发现股票之间的因果关系,有效提取新闻信息,并在多国六个真实数据集上优于多种基线模型,且具备良好的解释性 [page::0][page::1][page::4][page::7][page::8][page::9]。
速读内容
- 研究背景与问题定位 [page::0][page::1]:
- 现有新闻驱动的多股票运动预测任务,缺乏有效的因果关系建模和新闻噪声处理机制。
- 股票间关系多为单向,如供应商-消费者,因果关系比相关关系更能精准描述信息流动。
- 新闻文本中信息噪声大,辨识有效信号难度高,大语言模型(LLMs)具备更优的文本评估能力。
- CausalStock模型架构与核心模块 [page::3][page::4]:

- 市场信息编码器 (MIE):融合基于LLM的降噪新闻编码器与价格编码器,生成多股票的历史市场信息表示。
- 滞后依赖时序因果发现模块 (Lag-dependent TCD):采用变分推断,建模时间滞后时因果图的后验分布,表示股票间动态因果关系。
- 功能因果模型 (FCM):结合发现的因果图和历史信息,非线性建模股票未来价格运动概率。
- 量化因子及策略构建 [page::4][page::5][page::6]:
- 因果图采用伯努利分布假设边存在性,动态更新连接概率,模型通过Gumbel-softmax实现可微采样。
- FCM使用多层非线性网络聚合滞后因果股票的新闻和价格信息,输出未来涨跌概率。
- 训练采用变分下界ELBO与二元交叉熵损失联合优化,提高预测准确率与因果图的拟合能力。
- 实验结果与表现 [page::7][page::8]:
- 在6个不同国家和地区股票市场数据集上进行新闻驱动与非新闻驱动多股票运动预测。
- CausalStock在准确率(ACC)与马修斯相关系数(MCC)指标上均优于包括HAN, StockNet, PEN, CMIN等多种主流基线。

- 消融实验分析 [page::8]:
- 去除因果发现模块、新闻编码模块、边不存在建模都会导致性能大幅下降,验证各个模块贡献。
- 滞后依赖因果发现模块优于滞后独立模块,变量依赖机制有提升潜力但计算成本高。
- 基于LLM的降噪新闻编码器优于传统新闻编码方法,显著提升表现。
- 模型解释性和因果关系揭示 [page::8][page::9]:
- LLM对新闻文本进行多维评分(相关性、情感、重要性等),有效区分影响力不同的新闻示例。
- 发现的因果强度图与公司市值呈强正相关,大市值公司对小市值公司具有显著因果影响。

- 投资模拟验证 [page::9]:
- 模拟组合策略选取预测概率最高三只股票进行等权投资,计算累计组合价值(APV)和夏普比率(SR)。
- CausalStock在多个数据集上均表现出更高的收益和更优的风险调整表现。
- 结论和未来工作 [page::9][page::16]:
- 提出结合滞后依赖因果发现与基于LLM降噪技术的多股票新闻驱动预测方法,效果显著且具备解释性。
- 未来可探索时间变化因果图的增量学习和更复杂因果关系分布,以提升模型适应市场动态能力。
深度阅读
深度解析报告:《CausalStock: Deep End-to-end Causal Discovery for News-driven Stock Movement Prediction》
---
1. 元数据与概览
- 报告标题:CausalStock: Deep End-to-end Causal Discovery for News-driven Stock Movement Prediction
- 作者及机构:
- Shuqi Li, Yuebo Sun, Yuxin Lin, Xin Gao, Shuo Shang, Rui Yan 等
- 所属机构涵盖中国人民大学高凌人工智能学院、北京大学、阿卜杜拉国王科技大学、电子科技大学
- 主要发布渠道及时间:文中未明示具体会议或期刊,考虑为计算机科学领域的深度学习/金融领域论文(NeurIPS投稿格式)
- 研究主题:基于新闻驱动的多股票价格波动预测,融合因果发现与大型语言模型(LLMs)
报告核心论点:
该论文针对新闻驱动的多股票价格涨跌预测任务,提出了一个名为CausalStock的框架。该框架旨在解决两个主要问题:(1)股票间多为单向因果关系,现有模型偏重相关性建模,无法准确刻画信息流向;(2)新闻数据噪声大,传统文本编码方法难以提取有效信号。
为此,作者设计了一个基于时滞依赖的因果发现模块和基于大型语言模型的去噪新闻编码器,通过功能因果模型(FCM)融合历史价格和新闻信息,实现股票价格走势预测。实验覆盖美、中、日、英市场六大真实数据集,显示CausalStock对多基准均优于现有强基线,并增加模型解释性。
---
2. 逐节深度解读
2.1 摘要及引言章节(页码0-1)
- 关键论点:
- 多股票预测需有效利用股票间关系信息,尤其是因果关系,区别于传统相关关系。
- 新闻文本信息噪声巨大,传统RNN、LSTM难以准确筛选有效信号,LLMs有望提升。
- 提出CausalStock:结合时滞因果发现和LLM去噪新闻编码,提升预测准确性及模型解释力。
- 推理依据:
- 股票间存在单向因果(如供应链上下游)而非对称相关。
- 新闻多渠道、海量且杂乱,使用先进语言模型能抓取更丰富、准确语义。
- 通过功能因果模型模拟数据生成机制,优化因果图,提高因果关系建模质量。
- 数据与假设:
- 利用6个真实市场数据集跨地域验证,涵盖新闻和价格混合、单独价格两类预测任务。
- 假设新闻潜在的重要性维度可被明确评分,如关联度、情绪、事件重要性、影响度、持续时间。
---
2.2 相关工作(页码1-2)
- 股票价预测技术分类:
- 技术分析:基于历史价格模式,如LSTM及其增强版本。
- 基本面分析:结合文本数据(新闻、社媒)及行业宏观变量等。
- 现有模型回顾:
- 多数股票关系建模基于相关性(注意力机制、图神经网络)。
- 新闻编码多用GRU、LSTM,存在噪声敏感问题。
- 因果发现技术:
- 传统依靠随机对照实验,昂贵不可行。
- 机器学习中利用约束、评分及功能因果模型(FCM)端到端挖掘因果关系。
- 创新点:
- 采用时滞依赖因果图建模更贴合时间序列数据。
- 引入LLM进行新闻多维度评价去噪,提取高质量文本特征。
---
2.3 理论基础与问题定义(页码2-3)
- 时滞因果图定义:
- 因果关系表示为一组DAG,每个图针对特定时滞$l$,映射$t-l$时刻的变量对$t$时刻变量的因果影响,符合时间不可逆性天然无环。
- 功能因果模型(FCM):
- 每个股票价格运动由其时滞因果父节点通过非线性函数加独立噪声生成,模型训练同时提升预测性能和因果图准确度。
- 具体问题:
- 输入:历史$L$天多股票新闻表示$Ct^i$和价格特征$Pt^i$。
- 预测目标:当天$T$的股票调整收盘价涨跌$yT^i$(二分类)。
- 理论目标:最大化$p(yT|X{
---
2.4 模型架构概述(页码3-4)
- 模型流程:
- 联合建模因果图$G$的后验分布$p(G|X
- 三大核心模块:
1. 市场信息编码器(MIE):融合新闻和价格信息。
- 价格编码器处理多维日价格指标。
- 新闻编码器采用LLM生成多维度去噪表示。
2. 时滞依赖因果发现模块:通过变分推断估计动态时滞因果图分布。
3. 功能因果模型(FCM):基于挖掘的因果图整合市场信息,预测股票涨跌概率。
---
2.5 市场信息编码器细节(页码4)
- 新闻编码器挑战:
- 新闻数据来源多样、质量参差,信息噪声巨大,复杂语言表达也增加理解难度。
- LLM去噪新闻编码器设计:
- 利用LLM强大的文本理解与推理能力。
- 针对每条新闻设计多项评分指标:关联性、情绪、重要性、影响力、影响持续时间。
- 各维度分别量化评分,形成5维特征,进一步编码获得最终文本嵌入,显著提升噪声过滤和关键信息提取能力。
---
2.6 时滞依赖因果发现模块(页码5)
- 贝叶斯视角:
- 因果图组合空间巨大,采用变分推断近似后验$q\phi(G)$。
- 先验设计:
- 包括图的稀疏性约束和领域知识导入(允许动态更新和专家知识注入),无须显式DAG约束,时间不可逆性天然保证无环。
- 后验近似:
- 采用多项式伯努利分布建模每条因果边存在的概率,边的存在概率受前一时滞状态影响,实现依赖建模。
- 采用Gumbel-Softmax重参数技巧实现可微分随机采样。
- 因果强度建模:
- 独立设计边存在与边强度参数,兼顾边连续权重和离散事件,提高政治性。
---
2.7 功能因果模型(FCM)设计(页码5-6)
- 模型形式:
- 因果函数$fi$对因果父节点信息加权求和,整合价格编码$\ell$和新闻编码$\psi$两部分信息,使用神经网络映射,最后通过Sigmoid输出涨跌概率。
- 噪声建模:
- 加性高斯噪声,方差为可训练参数,捕捉不可观测不确定性。
- 理论概率计算:
- 依据变量变换公式计算预测条件概率,损失为目标变量的加性噪声部分的对数似然和图先验KL散度。
---
2.8 训练目标与优化(页码6)
- 目标函数:
- 最大化条件对数似然$\log p\theta(yT|X{
- 结合了传统的二分类交叉熵损失,平衡因果推断和准确率。
- 训练细节:
- 均通过梯度下降优化变量集$\{\phi,\theta\}$。
---
2.9 实验设计与预测结果(页码7-8)
- 数据集覆盖:
- 新闻驱动任务:ACL18(美)、CMIN-US(美)、CMIN-CN(中)
- 非新闻多股票移动预测:KDD17(美)、NI225(日)、FTSE100(英)
- 评价指标:
- 准确率ACC和Matthews相关系数MCC(考虑类别不平衡)
- 对比基线:
- 新闻驱动:HAN、StockNet、PEN、CMIN
- 非新闻驱动:LSTM系列、DTML等
- 结果总结:
- CausalStock在所有数据集上均取得最高ACC和MCC,表现稳健
- 特别的,新闻驱动预测性能提升显著,验证LLM去噪和因果发现有效性
---
2.10 消融实验(页码8)
- 消除核心模块后性能大幅下降:
- 移除因果发现模块导致ACC降至51%左右,相当于随机。
- 移除新闻编码性能下降明显,显示新闻信息贡献关键。
- 移除负边(不存在建模)稍降性能,证明准确刻画不存在关系重要。
- 替换为非时滞依赖因果发现略降,表明时滞依赖性提高建模准确度。
- 加入变量依赖机制在部分数据集有提升,但计算复杂度明显提高,限制大规模应用。
- 新闻编码器对比:
- 传统嵌入(Glove、BERT、RoBERTa、FinBERT、FinGPT)效果优于无新闻输入。
- 采用LLM去噪编码器(FinGPT、Llama)表现更佳。
- 最新GPT 3.5版本进一步提升整体准确率和MCC。
---
2.11 可解释性分析(页码8-9)
- 新闻编码模块示例:
- 真实新闻与股票关联、新闻情绪、影响力等被准确量化。比如苹果手机发布延迟新闻得到负向情绪与高影响力评分,特斯拉重要里程碑新闻对应积极情绪。
- 因果图可视化:
- 以ACL18为例划分市值高低股票组,发现大市值公司对小市值公司有更强因果影响。
- 因果强度矩阵显示市场价值与因果影响力存在显著正相关。
- 统计验证:
- 四大数据集上Spearman相关系数都表现出较强的因果强度与市场价值正相关,界定模型挖掘因果关系的合理性。
---
2.12 投资模拟(页码9)
- 以模型预测前3强股票组成等权投资组合,计算累计投资价值(APV)和夏普比率(风险调整收益,SR)。
- 实验涵盖ACL18、KDD17、NI225三数据集,CausalStock均显著优于市场指数及主流基线。
- 结果表明不仅获利能力较强,同时在收益风险权衡上更优。
---
2.13 结论与未来展望(页码9、16)
- CausalStock创新结合时滞因果发现与LLM驱动文本去噪,在多股票多市场中验证有效。
- 可解释性和投资实用价值俱佳。
- 未来或尝试引入元学习等技术,更新动态因果图,探讨更复杂分布建模等。
---
3. 图表深度解读
3.1 图1(页码3)
- 内容描述:展示模型中因果图$G$的后验分布$q\phi(G)$生成和预测任务$p\theta(yT|X{
- 解释:因果图作为隐变量,控制多股票间信息流向,预测依赖于历史数据和因果结构。
- 支撑文本论点:强调模型是联合因果发现和预测两部分,非单纯黑盒。
3.2 图2(页码4)
- 内容描述:展示模型整体结构,包含:新闻语料经LLM评估去噪编码形成文本信息;价格编码器处理历史价格;时滞因果图$G$结合新闻和价格编码输入到功能因果模型实现预测。示例采用AAPL、GOOG、META三支股票7月2日至7月5日的市场数据。
- 解读趋势:
- LLM驱动新闻编码通过多维评分过滤噪声。
- 多时滞因果图动态变化,体现时序依赖。
- 综合新闻与价格形成多维节点特征,功能因果模型以因果网络结构约束信息整合。
- 联系文本说明其创新点:模型能够同时挖掘时滞因果结构,清晰展示知识流,有很强的可解释性。
3.3 表1(页码7)
- 内容:CausalStock与多个基线在6个多股票涨跌预测任务上的ACC及MCC表现。
- 数据趋势:
- 新闻驱动任务:CausalStock各数据集ACC均领先(63.4%、54.6%、56.2%),MCC性能提升明显。
- 非新闻任务:ACC提升2-3个百分点,MCC亦明显领先。
- 故事线:
- 融合因果建模与LLM文本处理带来显著准确率突破。
- 数据来源:多地域多市场真实公开数据,无论美国、中国、日本、英国市场均有效。
3.4 表2(页码8)
- 内容:多种消融设置和编码器替换对三个新闻驱动数据集性能影响。
- 关键见解:
- 移除因果模块或去噪新闻编码均显著降级。
- 传统NL编码优于无新闻,LLM去噪编码更优。
- 时滞机制优于非时滞机制。
- 变量依赖机制虽有提升,计算复杂度剧增。
- 总结:所有核心模块均贡献性能,LLM去噪编码提升效果显著。
3.5 图3(页码9)
- 三部分组成:
- (a) 市值与因果强度的相关散点图,显示正相关趋势线。
- (b) ACL18部分股票的因果强度热力图,区分大市值和小市值股票,展现因果强度差异。
- (c) 三条新闻例子的LLM评分输出,分别展现情绪、影响力等多维评分。
- 解读:
- 大市值股票具有更强的因果影响,体现经济基本面与因果逻辑一致性。
- LLM新闻评分能精准区分相关性和情绪方向,验证去噪模块有效性。
3.6 表4(页码9)
- 内容:投资组合策略下CausalStock与基线SR和APV对比。
- 数据点:
- CausalStock在三数据集上均取得最高夏普率与累计收益,体现其实际投资效用及风险管理能力。
- 说明:模型预测准确率的提升实际转化为更优投资决策。
---
4. 估值分析
本文不涉及企业价值估值或财务指标估值,主要关注预测准确率及因果结构发现的理论合理性,故无传统金融估值分析。
---
5. 风险因素评估
- 报告中风险认知:
- 新闻数据本身噪声干扰大,模型依赖的去噪模块可能受评估准确性影响。
- 变量依赖因果机制存在计算复杂度风险,难以推广至大规模股票池。
- LLM的评估输出可能存在安全风险,潜在偏见或价值观不符(见附录F)。
- 潜在缓解措施:
- 允许接入领域专业知识 priors 引导因果图。
- 模型结构可调整,部分模块可替换不同LLM以权衡性能和资源。
- 未来考虑元学习与动态更新机制,适应市场突变。
---
6. 批判性视角与细节
- 潜在偏见:
- LLM对新闻的评价依赖预训练数据,可能引入未知风险。
- 因果关系的可识别性依赖较强假设(见附录B),现实环境中可能违背。
- 模型假设:
- 价格数据满足因果稳定性,新闻数据不参与因果图发现梯度,有可能忽略新闻中动态因果信息。
- 计算效率:
- 引入变量依赖机制显著增加计算复杂度,限定其应用场景。
- 细节不足:
- 讨论较少关于市场事件剧烈变化下因果图适应性及鲁棒性。
- 评价新闻影响的时间跨度五维评分可能尚需业务验证。
---
7. 结论性综合
本文提出了面向新闻驱动多股票预测的因果深度学习模型CausalStock。通过引入时滞依赖的因果发现机制,模型能准确构建反映信息单向流动的因果图,克服传统相关性模型的限制。利用大型语言模型对新闻文本多维度去噪评估,极大提升了历史新闻数据中有效信号的识别能力。功能因果模型与因果图结构紧密耦合,实现价格涨跌动向的高效预测。
六个涵盖美国、中国、日本、英国多市场的公有基准数据集实验表明,CausalStock较各主流基线在准确率和MCC指标上均保持领先,表现稳健且适应性强。消融实验进一步验证每个模块的重要贡献,尤其是因果发现与LLM去噪新闻编码模块。因果图的可解释性通过市场价值和因果强度的统计相关得到支持,模型预测也在实盘模拟中提高收益和风险调整表现。
总体而言,报告展示了结合时序因果发现与大规模语言模型的股票预测创新路径,兼顾预测性能和可解释性,具有较强的学术与实务价值。尽管存在计算成本和模型假设方面的限制,研究为未来动态因果更新和更复杂因果建模奠定基础。
---
附图标展示
- 图1展示模型因果发现与预测流程图

- 图2展示CausalStock整体架构示意

- 图3包括市场值与因果强度相关性,“热力图”因果关系可视和新闻去噪评分示例

---
溯源
本分析所有结论均来自原文内容并带有对应页码标注,详见文中各数据图表页脚引用,如[page::0],[page::1],[page::3],[page::7],[page::8],[page::9]等。