`

When AI Meets Finance (StockAgent): Large Language Model-based Stock Trading in Simulated Real-world Environments

创建于 更新于

摘要

本报告提出StockAgent,一种基于大型语言模型(LLM)的多智能体股票交易仿真系统,能够模拟投资者在现实市场环境下的交易行为及对宏观经济、政策变动等外部因素的响应,避免历史数据泄漏问题。通过对GPT与Gemini两种LLM驱动下的交易行为差异分析,揭示了不同模型对市场态度及交易策略的显著影响。系统还支持多轮实盘交易仿真,验证了外部经济事件对交易行为和价格波动的作用,为基于LLM的投资建议和量化策略研究提供了重要工具与洞见 [page::0][page::5][page::12][page::15][page::18][page::19][page::20]

速读内容

  • StockAgent框架设计包括投资者代理模块、交易模块及论坛(BBS)模块,赋予代理不同个性及初始资产配置,模拟真实交易环境及多样投资偏好 [page::4]。

  • 仿真流程分为预交易准备、交易会话及交易后步骤,融入利率、贷款、破产检查及外部经济事件影响,贴近NASDAQ及香港交易所机制 [page::6]。

  • 使用财务自由现金流贴现(FCFF)法对两家公司股票估值,提供理想股价区间和财务指标,为交易仿真提供坚实数据基础 [page::8][page::9][page::10][page::11]。

- 量化因子/策略构建与回测:通过基于GPT-3.5-Turbo与Gemini-Pro驱动的AI代理,模拟200名代理10-154个交易日的多环境交易行为,考察外部因素影响及模型差异对交易策略稳定性和行为的影响 [page::12][page::13][page::15]。
  • GPT代理交易量显著高于Gemini,但交易频率较低;Gemini代理交易更频繁但交易量较低,表现出更一致的交易群体特征,GPT代理则更分散,呈现更强的主观交易风格 [page::14][page::15]。

| AI Agent | A Trade Shares | B Trade Shares | A Volume | B Volume |
|----------|---------------|---------------|--------------|--------------|
| GPT | 3,118,792 | 329,590 | 176,758,380.8| 14,109,526.0 |
| Gemini | 128,981 | 112,134 | 3,588,331.52 | 4,325,246.50 |
| AI Agent | Stock A Price | Stock B Price | A Trading Times | B Trading Times |
|----------|---------------|---------------|-----------------|-----------------|
| GPT | 55.70 | 43.43 | 384 | 263 |
| Gemini | 23.46 | 36.03 | 800 | 688 |
  • 不同LLM模型均呈现对股票A表现优于股票B的共识,但交易策略迥异:GPT交易周期较长且波动较大,Gemini交易更稳定,凸显模型特性对交易结果重要影响 [page::18][page::19]。


  • 外部因素影响分析:剔除利率变化和BBS讨论显著影响交易频率和市场情绪,利率消失使代理更乐观,缺少BBS信息导致代理保守,影响股票价格走势与交易行为 [page::15][page::16][page::17]。


  • 盈亏分析显示剔除财务报告与利率变化能使部分代理由亏损转为盈利,取消贷款功能和BBS信息降低代理的风险偏好,反映外部数据完整性对仿真稳定性及盈利预测关键作用 [page::18]。

  • 研究重点围绕LLM驱动的多智能体系统如何在贴近真实环境的模拟中体现行为金融学理论,揭示不同模型的交易倾向,及外部信息对策略执行和市场表现之影响 [page::3][page::18][page::19][page::20]。

- 未来方向:集成多样化策略、扩大仿真规模、优化情绪分析模块与提示系统,并开发可自定义的多市场仿真平台,提升LLM代理股市交易的可解释性与可靠性 [page::19][page::20]。
  • 研究代码开源,支持学术和工业界进一步探索基于LLM的投资策略开发和验证 [page::0]。

  • 交易价格相关性分析显示GPT对股票A持乐观态度,Gemini偏向悲观,表明不同LLM存在固有市场预测倾向与风格差异 [page::13]


深度阅读

金融研究报告详尽分析报告



一、元数据与报告概览


  • 报告标题:When AI Meets Finance (StockAgent): Large Language Model-based Stock Trading in Simulated Real-world Environments

- 作者:由中英美多所高校研究人员联合撰写,主要贡献者包括Chong Zhang(University of Liverpool, UK),Xinyi Liu(Peking University, China)等。
  • 发布日期:2024年9月

- 发布机构:论文发表于ACM,文长33页,附有代码链接:https://github.com/MingyuJ666/Stockagent
  • 研究主题:基于大型语言模型(LLM)的AI智能代理在仿真、模拟真实股票交易环境中的应用与表现分析。

- 核心论点:本研究提出了一个多智能体系统——StockAgent,以LLM驱动的代理模拟真实世界中投资者的交易行为,能避免历史市场数据对模型预测的泄漏影响,研究外部因素(宏观经济、公司基本面、政策及全球事件等)对交易行为和收益的影响。该系统为金融AI智能代理提供了更真实的模拟框架和行为分析,有助于开发更有效的量化策略和投资建议。

二、逐节深度解读



2.1 引言(Introduction)


  • 关键论点:市场交易复杂且易变,参与者复杂多样,受经济、政策、情绪等多重因素影响,直接影响交易行为与决策。传统依赖历史数据的回测方法存在已有数据偏差和静态限制,不能真实反映市场流动性和情绪动态,因而有限。

- 推理依据:指出当前流行的回测框架如Zipline、Backtrader、Trading Gym虽有助于算法测试,但无法解决过拟合及情绪影响等问题。
  • 技术创新点:采用大型语言模型的推理能力和泛化能力,引入多智能体交互系统来模拟投资人之间的复杂动态,填补现有空白。

- 研究问题:提出三大研究问题(RQ1-RQ3),涵盖模拟效果、LLM本身的决策稳定性和外部条件对模拟交易行为的影响。
  • 方法框架:基于GPT和Gemini两款最新LLM设计实验,围绕真实US股市场选取两只股票(A、B),对其进行多阶段交易全过程模拟。[page::0,1]


2.2 背景和相关工作


  • 传统工具:强调回测工具的优缺点,定位StockAgent在现有回测环境上的延伸,核心是克服过度拟合与忽视市场情绪等问题。

- LLM驱动代理技术:介绍CoT(Chain of Thought)等LLM增强推理能力技术,强调其在多领域构建动态代理系统的潜力。提及类似WarAgent对军事和CosmoAgent对宇宙探索的模拟,证明多智能体系统可在复杂环境中实现策略调整和交互。[page::2,3]
  • 金融领域LLM应用:LLM在金融文本解析、情绪分析、风险检测等方面的初步应用,金融语言模型如何辅助趋势预测和合规管理。

- 行为金融:引入行为金融理论解释投资者非理性决策及心理偏差,强调市场非效率、认知局限及情绪驱动的决策特征,为StockAgent决策模型设置心理态度和交易风格提供理论基础。[page::3,4]

3 StockAgent架构设计


  • 系统组成

- 投资代理模块:400个代理,每个带有不同资本、负债和四类性格(保守、激进、均衡、成长偏好),模拟不同投资风格。
- 交易模块:采用随机时钟页置换算法避免交易死锁,实现代理买卖订单撮合和价格动态更新(图1展现该算法结构)。
- 论坛(BBS)模块:模拟投资者间信息共享和交流,增强交易的社交互动因素,对市场情绪具有影响。
  • 核心设计亮点

- 引入随机顺序控制保证交易无死锁。
- 性格设定增加投资决策的多样性与模拟人类投资行为的复杂性。
- BBS模块增强了信息传播机制,反映真实市场中公开信息对行为影响。[page::4,5]

4 StockAgent模拟设计


  • 模拟流程(图2):包括市场初始化、代理初始化,每日交易三阶段(前备、交易、后续)。每日结束后代理分享未来交易预估与交易帖。

- 初始假设
- StockAgent行为限制在买、卖、持有、做多、做空,追求资产总价值最大化。
- 理解财务工具(贷款、利率、股息、破产)并基于此调整。
  • 初始化设置

- 资金设定随机,范围100,000至5,000,000单位。
- 交易成本基于美股印花税设定,实际费率详列。
- 模拟期限为1年(264交易日),涵盖不同利率设定和贷款成本。
  • 外部事件设计:如减准率调整,利率上调,季度财报发布,配合现实对应年份进行,分时期影响市场资金成本与流动性。

- 金融分析
- 基于自由现金流折现法(FCFF)和加权资本成本(WACC)公式,估算两公司的理想市值和股价。公司财务数据从收入表、资产负债表,现金流表抽取关键指标。
- 定量计算股票估值范围(上下限)与理想价格,作为交易基准。[page::6-10]

5 试验设计、结果与验证


  • 实验设计

- 通过200个智能代理在不同外部事件下运行30轮,模拟至10日和154日周期。
- 对比使用GPT-3.5-Turbo和Gemini-Pro两套LLM作为决策引擎。
- 评估角度对应三大研究问题:模拟效果(价格关联与交易行为)、LLM可靠性(交易策略差异)、外部环境下的行为模拟。
  • 模拟效果

- 价格相关性分析(图4):GPT和Gemini对同一股票表现出不同走势和情绪,GPT更乐观偏多头,Gemini则偏悲观喜欢做空。
- 交易行为差异(表10、11):GPT交易量远大于Gemini而交易频率较低;Gemini交易频次较高但交易量较小。两模型对不同股票交易谨慎程度不同。
- 代理群体行为(图5):GPT驱动的代理更分散,表现多样化,显示更主观的决策能力;Gemini群体较为统一,更趋向跟风交易。[page::13-15]
  • LLM可靠性

- 最终价格走势(图6、7)差别显著,GPT代理允许更大波动和交易回合数,Gemini代理表现稳健幅度小。
- 两代理均可区分相对表现优劣股票,显示内在市场理解的某种共性。
- 不同LLM的内在交易策略导致结果波动、风险承受度和潜在收益不同。[page::15-17]
  • 外部条件影响

- 通过“去除”特定信息(金融信息、BBS交流、贷款利率变动等)测试外部因素对交易行为影响。
- 去除利率变化显著提升交易频率和股价乐观情绪(图8、9)。
- 缺少BBS交流导致股价趋缓,个人交易更保守。
- 退出贷款信息使个体表现更保守,市场整体盈利能力变化不一。
- 利用可视化(图10)观察不同环境下盈利分布,金融信息缺失增大代理收益差异性,市场竞争加剧。[page::16-18]

6 讨论


  • 关键发现与启示

- 不同LLM驱动的代理表现出明显不同的交易风格和行为模式,影响模拟结果可靠性和用户决策指引。
- GPT代理个体决策多样,表现出更强主观能动性,Gemini代理更趋同一调,易于模拟羊群效应。
- 外部宏观经济及信息环境对代理交易决策与收益有重要影响,模拟时需综合多维度影响因素确保仿真准确。
  • 未来工作展望

- 引入技术指标分析、策略优化及高频交易模块。
- 融合情绪分析模块,增强系统对市场情绪变化的响应机制。
- 构建可定制股票模拟平台,提高适用多市场、多策略研究的灵活性。
- 深入研究不同LLM内在偏差对交易建议和量化策略的影响,提升基于LLM的金融AI决策系统的可靠性和解释力。[page::18-20]

7 结论



StockAgent首次将基于大型语言模型的多智能体系统应用于高度逼真的股票交易环境模拟,揭示了不同LLM模型驱动的交易代理之间显著差异及其对投资行为和市场表现的影响。该框架有效避免了使用历史数据造成的信息泄露,实现了真实市场外部因素对策略影响的全方位模拟,助力金融AI与量化策略研发。[page::20]

---

三、图表深度解读



1) 图1:随机时钟页置换算法示意(第4页)


  • 展示了如何通过随机顺序分配交易决策权给代理,防止多代理同时尝试交易导致死锁。

- 该设计借鉴操作系统中的内存页替换思路,适时“轮询”并随机调度代理。
  • 保障了多任务环境下的交易公平性和系统稳定性。[page::4]


2) 图2:交易模拟工作流(第6页)


  • 展示了每日交易流程:初始化—利息/贷款偿还—破产检测—事件触发—交易执行—价格更新—预估行动—BBS交易贴发布。

- 细化了交易多个阶段及数据交互,使模拟现实交易流程动态精准。
  • 示意中的提示语与JSON命令格式体现了智能体操作的标准化和人机交互设计。[page::6]


3) 图3:投资决策演示(第11页)


  • 图中清晰展示了智能体如何结合股票价格、财务报表、论坛讨论和特殊事件信息,作出买卖决策。

- 体现了StockAgent在模拟环境中多维信息融合的能力和在不确定市场环境中的决策流程。
  • 该图形化例子有效反映了系统捕捉复杂外部因素的设计初衷。[page::11]


4) 图4:10日价格相关矩阵及走势(第13页)


  • 左侧:价格变化相关系数热力图,不同模型和股价间负相关和正相关关系清晰显现。

- 右侧两子图:分别展示GPT和Gemini下两只股价涨跌轨迹,GPT整体呈现上涨趋势,Gemini呈下跌。
  • 表现了不同LLM本质交易偏好差异及对市场走势的不同解读和反应。[page::13]


5) 图5:T-SNE交易行为聚类(第14页)


  • GPT代理点分布分散且呈现3类明显聚类,表现个人差异性强,主观性高。

- Gemini代理聚类较集中,行为趋同。
  • 反映了两模型驱动智能体在群体合作和个体表现的差异性,关联行为金融理论中的投资者异质性。[page::14]


6) 图6 & 图7:Gemini与GPT代理价格点走势(第16页)


  • 两图均为股票A与B交易轮数对应的价格散点,GPT图明显更多交易回合和更大波动幅度。

- Gemini图价位平稳,回合数较少,显示更保守、震荡的交易风格。
  • 强调不同LLM带来市场波动性的差异,对风险偏好和投资策略选择有现实意义。[page::16]


7) 图8:不同外部条件缺失对股价影响(第17页)


  • 多条曲线代表去除财务信息、论坛交流、贷款、利率变化等不同信息后价格走势。

- 去除利率变动使股价上涨显著;去除金融信息导致价格较低且下行。
  • 说明外部经济政策和信息流对市场信心和价格形成机制的决定作用。[page::17]


8) 图9:交易频率对比(第17页)


  • 柱状图清晰展示不同条件下两只股票的交易次数,印证缺失利率变动显著提高交易活跃度。

- BBS信息缺失对交易频率影响较小,但对价格走势有较大影响。
  • 突显交易行为受信息环境调节的重要特征。[page::17]


9) 图10:代理组亏盈3D条形图(第18页)


  • 各代理在有/无关键外部信息条件下的收益变化,有些缺失信息环境令部分代理由亏转盈。

- 变化剧烈,体现市场信息透明度对盈利分布和市场竞争格局的重要影响。
  • 反映了多样化行为代理在不同信息场景下的差异化投资表现,揭示市场复杂性。[page::18]


---

四、估值分析


  • 估值方法:报告采用折现现金流模型(FCFF)和加权平均资本成本(WACC)方法估算企业价值和股票理想价格。

- 关键输入参数
- 财务报表数据:收入表、现金流表、资产负债表中的净收入折旧、无现金费用、长期债务、股东权益等。
- 资本成本:成本股权率Ke计算基于CAPM模型(无风险利率、市场预期收益率、Beta系数),成本债务Kd根据不同期限负债利率加权计算。
- 贴现期限与现金流终值:分周期计算贴现现金流总和,加上终值贴现形成估值区间(上下界)。
- IPO价格公式将市场价值减去债务及交易费用,折算到股本价格。
  • 估值数据:表2、4分别表述企业A、B在不同交易日的估值走势和估值区间;表3、5说明各时间点的资本成本和成长率常数;表6、7列出具代表性的理想股票价格范围,作为模拟交易的理论基准。

- 结论:该估值方法为交易模拟提供合理的价格水平和市场环境基础,确保有效性和现实关联。[page::8-10]

---

五、风险因素评估



报告未设立专门风险章节,但隐含风险点如下:
  • 模型过拟合风险:依赖历史数据训练的模型存在过拟合风险,模拟结果可能未完美代表未来市场。

- LLM固有偏差:不同LLM训练数据及架构差异带来的决策偏差,影响交易策略和推荐的可靠性。
  • 信息缺失的市场失真:模拟环境中缺乏全面外部信息会严重扭曲交易行为,导致市场表现异常。

- 交易死锁问题:多智能体竞争中技术性死锁风险,已通过随机时钟算法部分缓解。
  • 市场生态复杂性:无法完全模拟真实投资者心理、多样策略和不可预测事件,存在系统性误差。


报告部分通过BBS模块设计和多场景实验间接反映对风险的感知与缓解策略,但并无系统展开。未来需进一步确保风险识别和管理以提升模拟严谨度。[page::4,6,15]

---

六、批判性视角与细微差别


  • LLM模型选择影响研究结果的局限:虽然选用当前主流GPT和Gemini,但它们本身在训练数据及推理机制的差异可能导致结论具有一定代表性偏差,其他LLM的表现尚未涵盖。

- 模拟周期较短:部分模拟仅持续10交易日,可能不足以观察行情长期趋势和策略适应性,延长模拟期可增强结论稳健性。
  • 外部事件设计与现实对应的抽象化:模拟事件基于真实但简化模型(如利率变动、政策发布),可能无法完全反映政策执行的市场复杂反应。

- 代理投资策略深度有限:目前代理以性格区分较粗糙,未显著包含复杂技术指标、风险管理策略或高频交易细节,限制了对复杂市场行为的仿真模拟。
  • 交易成本模型简单:交易成本固定费率设定未考虑滑点、流动性影响等,更细致的成本建模将提升模拟真实度。

- 潜在实验偏差:使用单一市场环境样本,样本选择可能不具备广泛代表性,扩展到国际市场或更多股票样本有助检验泛化性。[page::1-20]

---

七、结论性综合



本报告提出的StockAgent系统是创新性的基于大型语言模型的多智能体股票交易模拟平台,突破传统历史数据回测的局限,融合了行为金融理论、外部市场事件和智能体交互机制,展现了高保真度动态交易环境建模。
  • 不同LLM(GPT与Gemini)驱动的代理表现出显著不同的市场偏好、交易频率和个人决策多样性,表明模型内在结构深刻影响模拟结果和潜在投资建议。

- 利用FCFF估值体系作为交易价格基准,增强模拟的真实感及财务基础,支持对市场动态进行合理推断。
  • BBS交流、贷款利率、财务信息等外在条件显著影响代理交易行为和市场价格,体现信息透明度和宏观金融调控对市场信心的本质作用。

- 货币政策、公司财务状况、投资人情绪均被有效集成到模拟框架内,促进了对股票市场复杂生态系统的探究。
  • 实验丰富,从价格走势相关性、交易量、价格和交易频率、罚损分布等多角度验证模型有效性,反映了市场中策略多样性和风险决策的复杂现实。

- 未来可在技术指标、风险管理、算法优化、高频交易和模拟平台定制化等方面深化,进一步提升模拟的适应性和准确度。

总体来看,StockAgent是大型语言模型与金融交易结合的开创性探索,提供了新的视角和工具,推动金融AI智能体研究向更真实、高效、多维信息融合的方向发展,具有重大理论价值和应用前景。[page::0-20]

---

参考图片展示


  • 图1:随机时钟页置换算法示意图


  • 图2:交易模拟工作流


  • 图3:智能体投资决策示意


  • 图4:价格相关矩阵及股价走势


  • 图5:智能体行为聚类(T-SNE可视化)


  • 图6 & 图7:Gemini与GPT驱动智能体交易价格走势



  • 图8:不同外部信息缺失下股票价格走势


  • 图9:不同外部信息缺失下交易频率对比


  • 图10:代理组盈利状况3D图



---

总结



本报告详实解析了基于LLM的StockAgent智能体多代理股票交易模拟系统,其在交易行为多样性、信息环境响应、市场模拟可信度等多方面的分析令人信服,并且为进一步的金融AI领域研究提供了坚实的理论和实验基础。未来应融合更多市场微观结构元素、提升模拟细粒度、加强风险控制模块,以实现更真实和智能的量化交易仿真环境。

报告