`

Stock Recommendations for Individual Investors: A Temporal Graph Network Approach with Mean-Variance Efficient Sampling

创建于 更新于

摘要

本报告提出了PfoTGNRec模型,通过结合时间图网络与均值-方差有效采样,有效捕获了个人投资者偏好与投资组合的动态变化,解决了推荐准确性与投资组合多样化的权衡问题。实证结果显示该模型在推荐性能与投资组合夏普比率上均优于当前主流动态及静态模型,为个人投资者提供兼顾偏好和收益的交易建议 [page::0][page::1][page::3][page::5][page::6][page::7]。

速读内容

  • 个体投资者股票推荐面临的挑战包括:价格预测精度有限、个体投资者偏好多样且受心理因素影响,以及投资组合多样化与用户偏好的矛盾[page::0][page::1]。

  • PfoTGNRec模型设计三大核心模块:[page::3]

- 动态嵌入学习:基于Temporal Graph Network(TGN)捕获用户-股票交互的时间动态,使用GRU更新节点记忆,利用图注意力机制生成时间节点嵌入。
- 均值-方差有效采样(Mean-Variance Efficient Sampling,MVES):结合用户偏好排序和基于投资组合均值-方差优化的排序加权,选取正负样本,促进推荐股票的组合多样化和风险控制。
- 目标函数采用贝叶斯个性化排序(BPR)损失进行训练,强化模型对正负样本的区分能力。
  • 数据与实验设置:使用希腊国家银行真实个体交易数据,包含8337用户、92只股票、152,084次交互,使用时间序列的每日调整收盘价作为特征;数据按时间分割为训练、验证、测试集[page::4]。

- 实验结果总结[page::5][page::6]:
- 综合指标(结合NDCG@5推荐准确率与P(SR)@5夏普比率改进率)中,PfoTGNRec优于所有静态与动态竞品模型,尤其在权衡推荐性能与投资性能方面表现最突出。

- 推荐性能指标显示,动态模型相比静态模型能更好推荐未被训练期间买入的新股票,提升投资组合多样性。PfoTGNRec略低于用户偏好最优的TGN,但通过采样策略增强了多样化和收益。
- 投资组合表现方面,PfoTGNRec提升了收益率和夏普比率,明显优于基于价格的模型和部分已有股票推荐模型,说明其动态特征学习与采样策略的有效性。
  • 量化因子与策略关键点[page::3]:

- 量化策略中引入基于现代投资组合理论的均值-方差评分计算因子:
$$
y{u i}^{M V}=\frac{\frac{\mu{i}}{\gamma}-\frac{1}{2}\sum{j:j\neq i}\frac{1}{|y{u}|}\sigma{i j}}{\sigma{i}^{2}}
$$
其中 $\mui$ 是未来30天的均值收益,$\sigmai^2$ 为方差,$\sigma{ij}$ 为协方差,$\gamma$ 为风险厌恶参数。
- 通过对候选股票集同时考虑用户偏好排名和基于MV的投资组合得分排名,结合权重系数 $\lambda
{MV}$ 进行加权最终决定正负样本。
  • 超参数分析[page::6][page::7]:

- 批大小增大提升推荐性能但对投资表现有轻微负影响。
- 节点维度与候选项数量对推荐和投资表现均有波动,需权衡选择。
- 负样本数量的增加有利于提升整体表现。
- 风险参数 $\gamma$ 和交叉权重 $\lambda_{MV}$ 对推荐与投资性能影响显著,需调优以平衡两者。

深度阅读

金融研究报告详尽分析


报告元数据与概览


  • 报告标题:《Stock Recommendations for Individual Investors: A Temporal Graph Network Approach with Mean-Variance Efficient Sampling》

- 作者:Youngbin Lee, Yejin Kim(UNIST,韩国),Javier Sanz-Cruzado, Richard McCreadie(格拉斯哥大学,英国),Yongjae Lee(UNIST,韩国)
  • 发布时间及会议:2024年,5th ACM International Conference on AI in Finance (ICAIF ’24)

- 研究主题:面向个人投资者的股票推荐系统,重点是时间序列图网络方法与均值-方差高效采样技术
  • 核心论点:传统股票价格预测模型精准度有限,且个人投资者倾向于依赖个人偏好而非理性的投资理论,导致股票推荐系统需平衡三核心要素:(1)用户个人偏好,(2)投资组合多样化,及(3)上述两者的时间动态变化。基于此,报告提出了一个结合时间图网络与均值-方差采样的推荐模型——PfoTGNRec。该模型在真实交易数据上表现优于若干最新动态嵌入及股票推荐基线模型,实现偏好与投资回报率的有效平衡和提升。

- 目标传递信息:通过引入时间动态视角及多样化约束,PfoTGNRec能更好满足个人投资者在复杂变化市场环境下的需求,对推荐性能和投资收益实现了显著提升。相关代码和数据公开以支持研究验证。

---

逐节深度解读



1. 引言(Introduction)



关键论点
  • 个人投资者参与度显著增长(美国58%家庭持股,2019年为53%),但行为存在多类非理性偏差,导致其长期投资表现普遍低于市场平均水平,如标普500指数[page::0]。

- 现代投资组合理论(MPT)通过多样化组合降低风险、提升收益,已是机构投资主流,但个人投资者往往凭主观喜好投资,忽视MPT[page::0]。
  • 股票推荐面临三大挑战:(1)个体偏好多样且复杂,(2)投资业绩核心需依赖多样化降低风险,(3)两者存在矛盾与权衡,同时,时间因素影响股票特征和用户行为需同步考虑[page::1]。

- 现有多数研究侧重价格预测,精度有限(最高约57%),并忽略用户偏好,难以实现良好的推荐效果[page::1]。
  • 个人投资者对模型推荐的接受度有限(所谓“能引马至水口,不能强其饮水”),需设计既符合偏好又兼顾收益的系统[page::1]。

- 本文提出的PfoTGNRec基于时间图网络(TGN)和均值-方差高效采样方法,旨在同时捕捉时间动态偏好和组合多样化,验证显示相比前沿动态嵌入和推荐模型提升了3.45%的综合指标[page::1]。

支撑推理:大量行为金融研究支持个人投资者的非理性,投资业绩差距明显,且现有机器学习和推荐研究没有有效解决上述的多维度问题,验证了研究的必要性和创新点。

---

2. 相关工作(Related Works)



关键论点
  • 推荐系统常见的协同过滤(CF)技术,如矩阵分解和BPR,实现了基于历史交互的个性化推荐[page::2]。

- 股票推荐中已有结合用户偏好和多样化的CF模型,但多数是分段处理方式,非整合优化,且未考虑股票和偏好的时间变化[page::2]。
  • 动态模型已有用于价格预测,但未凸显用户偏好或多样化平衡[page::2]。

- 动态图学习(如TGAT、TGN)近年来发展,用以建模时间变化的图结构关系,TGN在多任务中展现出强大能力,但尚未应用于股票推荐[page::2]。
  • 本文创新点是将TGN应用于个人投资者股票推荐,结合均值-方差高效采样使推荐同时考虑偏好与多样化[page::2]。


支撑推理:文中分析充分梳理了CF、动态图神经网络和股票推荐交叉领域,强调此前工作无有效结合时间、偏好、多样化三大方面。

---

3. 方法(Method)



3.1 动态嵌入学习(Dynamic Embedding Learning)


  • 利用时间图网络(TGN)构建动态图,以捕捉用户-股票交互的时间序列信号。

- 通过“消息传递”(message)机制提取每次交互中源节点和目标节点的信息,包含节点先前记忆状态和时间差、交互特征,捕捉时间依赖性。
  • 使用GRU动态更新节点记忆,确保节点嵌入能反映随时间演变的用户行为和股票特征[page::2-3]。

- 采用图注意力机制(attention)生成节点在特定时间点上的嵌入,将邻居节点记忆和边特征结合,增强多跳连接信息捕获[page::3]。

3.2 均值-方差高效采样(Mean-Variance Efficient Sampling)


  • 受现代投资组合理论启发,通过均值-方差指标,采样时不仅考虑用户偏好排名,还考虑将该股票加入用户当前持仓组合后的风险调整收益表现。

- 对每个用户和时间点随机采样一组候选股票,分别构造按用户偏好排名和按投资组合多样化(基于均值-方差得分)排名的两个列表。
  • 将两者结合得到最终排名,超参数λMV调控偏好与多样化排名的权重。

- 从最终排名中选出高排名的正样本股票和底部的负样本股票,形成对比学习的训练对[page::3]。
  • 均值-方差得分公式体现了收益率$\mui$与资产间协方差$\sigma{ij}$的权衡,以及用户当前持股数量和风险厌恶系数$\gamma$的调节[page::3]。


3.3 模型优化


  • 采用Bayesian Personalized Ranking(BPR)损失,利用正负样本对训练模型评分,使模型学习用户倾向于正样本的偏好[page::4]。


---

4. 实验设计(Experiment)



4.1 数据集和设置


  • 使用希腊国家银行真实个人投资者交易数据,包含8337用户,92只股票,2018-2022年间共152,084次交易。

- 采用每日收盘价的过去30天调整价作为股票边特征。
  • 股票过滤去除停牌及异常价格行为,用户平均组合规模约6只股票。

- 数据按时间顺序切分为训练(80%)、验证(10%)、测试(10%)集,确保时序完整性[page::4]。

4.2 基线模型


  • 推荐模型:传统静态模型(Pop、BPR、WMF、LightGCN、SGL)和最新动态图模型(DyRep、Jodie、TGAT、TGN)。

- 价格模型:非个性化基于历史收益率和夏普比率选股模型。
  • 股票推荐模型:现有代表性静态组合模型Two-Step和MVECF[page::4]。


4.3 评估指标


  • 推荐性能:Hit Ratio (HR) 和 Normalized Discounted Cumulative Gain (NDCG) — 衡量用户实际购买股票在推荐列表中的排名。

- 投资性能:组合收益和夏普比率提升分析,包括推荐后组合相对于原组合的改进(差值和提升用户比例)。
  • 推荐列表生成排除用户已有组合内资产,严谨模拟补充型推荐场景[page::4]。


---

5. 实验结果



5.1 综合表现(RQ1)


  • 结合NDCG@5和P(SR)@5绘制性能平衡图(图3),PfoTGNRec处于最优点,平衡了用户偏好与投资组合表现。

- 结合加权指标表1($\alpha$调节推荐与投资权重),PfoTGNRec在所有权重下均优于基线,表现最均衡且稳健[page::5]。

5.2 推荐性能分析(RQ2)


  • 动态模型普遍优于静态模型,符合捕获时间上下文的预期,但整体性能差距较小。

- 进一步分解发现,动态模型在推荐训练期未出现的“新股票”上优秀表现明显,静态模型推荐重复购买股票占优,缺乏多样性,限制投资组合多样化[page::5]。
  • PfoTGNRec推荐性能略逊于TGN,系模型为了强化多样化效果有意牺牲部分推荐准确度[page::6]。

- 价格模型和现有静态股票推荐模型在捕获个体偏好上表现较差[page::6]。

5.3 投资组合表现(RQ3)


  • PfoTGNRec在组合收益与夏普比率提升方面表现优异,领先多数基线。

- 价格模型(Return、Sharpe)表现较差,显示基于历史价格预测未来收益难度极大。
  • Popularity基线表现不错部分因数据中投资绩效的流行偏差,但其推荐效果差。

- 现有股票推荐模型Two-Step和MVECF未能有效捕获股票时间动态,投资表现不佳[page::6]。

5.4 超参数影响(RQ4)


  • 批次大小:NDCG@5略增,P(SR)@5随批次变大略减,体现推荐质量与投资表现的轻微权衡。

- 节点维度:推荐性能稳定,投资性能波动大,暗示维度选择对捕捉动态组合分布重要。
  • 候选股票数目:对推荐影响有限,对投资性能有一定影响,采样复杂度提高。

- 负样本数目:推荐和投资指标均受益于负样本增多,但计算开销加大。
  • 风险偏好参数$\gamma$:均表现中有峰值,需调参确定最佳风险调节。

- 偏好与多样化权重$\lambda{MV}$:提高$\lambda{MV}$明显降低推荐准确,但提升组合表现存在峰值,体现两者的典型权衡关系[page::6][page::7]。

---

图表深度解读



图1:时间维度对股票推荐的重要性


  • 描述:图1(A)展示同一股票在不同时间段的价格走势不同;(B)两用户截然不同操作风格,短期交易和长期持有的时间跨度差异。

- 解读:股票特征随时间变动,推荐系统需动态识别合适买入时机。用户持仓行为亦随时间差异显著,系统必须建模个体时间偏好。
  • 联系文本:强化了引言和动机中时间动态不可忽视的论断[page::1]。

- 局限:图为示意,实际应用中动态捕捉需较复杂时序建模。

图2:PfoTGNRec模型结构


  • 描述:流程图展示整个框架三大模块:(1)动态嵌入学习(图中Memory embedding采用GRU,graph embedding用图注意力),(2)均值-方差高效采样(结合偏好和组合基于收益-风险排名),(3)基于BPR loss优化模型。

- 解读:清晰表现模型如何基于时序图数据动态获取嵌入,再通过投资组合理论引导采样,最后用个性化排序训练。突出时间动态与多样化结合的技术细节。
  • 联系文本:支撑方法章节核心说明,帮助理解模型创新设计[page::3]。


图3:综合推荐与投资绩效比较


  • 描述:二维散点图横轴为NDCG@5(推荐准确),纵轴为P(SR)@5(投资夏普提升),点代表不同模型,PfoTGNRec位于右上角领先。

- 解读:模型有效平衡两目标,独占优势地位。竞争模型在两指标上多有偏颇(偏好或投资),PfoTGNRec实现较好折衷。
  • 联系文本:反映RQ1的实证结果,强调模型优越的综合性能[page::5]。


表1:不同权重$\alpha$下推荐与投资综合指标


  • 描述:表格用加权公式结合NDCG与P(SR),不同比例测试模型综合性能,PfoTGNRec各权重均领先。

- 解读:表明模型无论如何平衡推荐与组合,都保持领先,表明泛用性强。
  • 联系文本:强调模型的稳健性能和实际应用灵活调节能力[page::5]。


表2:各模型详细推荐及投资指标


  • 描述:表列HR、NDCG等推荐指标及投资收益、夏普比率改进等多维度指标。

- 解读:展示动态模型特别是PfoTGNRec在投资性能与推荐表现上的优势,价格模型表现差,静态模型受限。
  • 联系文本:支持RQ2与RQ3结论,强调动态建模和多样化采样的必要[page::6]。


图4:超参数对NDCG@5和P(SR)@5的影响


  • 描述:六组子图分别衡量批次大小、节点维度、候选项数量、负样本数目、风险参数$\gamma$、权重$\lambda{MV}$对两指标的影响。

- 解读:表现推荐与投资性能常见的“此消彼长”趋势,尤其$\lambda
{MV}$过大可削弱NDCG,提示权衡设计关键。
  • 联系文本:为RQ4的性能调优提供实证依据,指导未来实际部署时的参数设定[page::7]。


---

估值分析(无)



本报告聚焦算法模型与性能验证,无直接公司或行业估值分析,不涉及DCF、P/E等传统金融估值技术。

---

风险因素评估



报告明确指出股票价格预测难度及个体行为非理性为根本挑战,模型设计即为规避这些风险(通过多样化和动态建模降低单一风险敞口)。风险主要体现在:
  • 价格波动与预测误差导致投资组合风险

- 个人投资偏好多变且受偏差影响大,导致模型接受度风险
  • 模型参数调节不当可能导致推荐效果或投资收益折损


缓解策略包括使用时间图网络动态捕获行为演化,均值方差采样平衡收益和风险,动态负采样提升模型泛化能力[page::1,3,6]。

---

批判性视角与细微差别


  • 报告承认价格预测模型准确率上限约52%-57%,体现对当前预测模型局限的直接认识,提升了报告整体的学术严谨性[page::1]。

- 模型设计中,牺牲部分推荐准确度以换取投资多样化和风险控制可能导致部分用户体验下降,实际接受度还需进一步验证[page::5-6]。
  • 虽然动态模型能显著提升新股票推荐能力,但实际推荐结果(推荐的股票组合稳定性、市场变化适应性)尚未深入展开分析,存在应用场景不确定性。

- 数据选取和清洗过程中删除极端或停市股票,可能影响模型对极端行情的适应能力。
  • 模型在希腊市场的重要实证展示了可行性,但地理及市场规模的局限应在迁移到其他市场时谨慎考虑。


---

结论性综合



本研究围绕个人投资者股票推荐的三大核心难题:用户偏好异质性、投资组合多样化重要性以及两者的时间动态关系,提出了创新模型PfoTGNRec。该模型利用时间图网络(TGN)有效捕获用户和股票特征随时间的变化,结合均值-方差高效采样在负样本生成过程中引入投资组合多样化视角,实现对个体偏好和投资表现的平衡优化。

实证验证基于希腊真实投资交易数据,显示PfoTGNRec不仅在推荐准确率(NDCG@5等)上优于传统静态和部分动态模型,更在投资组合收益和夏普比率提升方面具备明显优势。模型通过参数调优可调节推荐偏好和投资多样化权重,实现业务应用中的需求差异化。

图表分析进一步佐证了模型在时间动态特征敏感性、多样化采样策略的优越设计,以及综合绩效的领先地位。超参数研究揭示了推荐准确性和投资性能之间的典型权衡,为实际部署提供了参数选择依据。

总体来看,本文为个人投资者股票推荐领域贡献了首个融合时间图神经网络动态嵌入与现代投资组合理论约束的统一框架,有效应对个性偏好与资产多样化双重需求,推进个性化智能投资辅助系统的发展,具有重要理论价值和应用潜力。

[page::0,1,2,3,4,5,6,7]

报告