金融研报AI分析

NIFTY: A Financial News Headlines Dataset for Large Language Model Based Financial Market Forecasting

本报告介绍了NIFTY金融新闻标题数据集,包含两种格式分别支持大语言模型的有监督微调和强化学习对齐。数据集涵盖2010年至2023年十余年的高质量财经新闻及股市指标,适合用于股票价格走势预测和模型信息增益分析。实验表明模型规模显著影响语义嵌入的信息丰富度和聚类效果 [page::0][page::1][page::5][page::6][page::13]

OPTIMAL INFORMATION ACQUISITION FOR ELIMINATING ESTIMATION RISK

本报告基于投资者主动获取额外信息以消除估计风险的框架,提出“信息时钟”概念量化信息量,从而推导可封闭形式的效用值函数(适用于CARA和CRRA效用)。采用确定性等价准则评估信息价值,结合获取信息的成本,构建最优信息获取策略。研究显示,较早获取信息有更高价值,风险厌恶度较低的投资者更倾向于积极采集信息,且信息价值与市场条件无关,主要受风险偏好和信息时钟影响 [page::0][page::2][page::13][page::17][page::19][page::31]。

The Rise of Recommerce: Ownership and Sustainability with Overlapping Generations

本报告研究品牌重商(recommerce)渠道的兴起及其对产品耐用性和可持续性的影响。通过构建两期及重叠代际经济模型,分析品牌运营二手市场与第三方市场对垄断商策略的差异。结果表明,品牌重商通过增加产品耐用度、降低二手产品质量不确定性以及取消佣金费用等间接效应,提升了厂商利润与可持续发展目标的契合度,而非直接依赖重商交易收入。这为数字化二手交易渠道如何调和厂商利润和环保目标提供了理论新视角 [page::0][page::1][page::3][page::12][page::13][page::19][page::20]

DESPITE ABSOLUTE INFORMATION ADVANTAGES, ALL INVESTORS INCUR WELFARE LOSS

本报告构建具有信号可靠性异质性的金融市场一般均衡模型,深入分析投资者依据主观信念交易时的福利表现。研究发现,尽管Class-I投资者在信号无偏或轻微偏差时因信息优势而获得更高效用,但当信号偏差加剧或某类投资者占比过大时,全体投资者福利均低于无交易基准,即发生“双重损失”现象。报告还探讨了通过操纵信号偏差提升效用的策略,并揭示了投资者生存与福利之间的内在联系 [page::0][page::1][page::2][page::14][page::16][page::24].

Comparative Study of Bitcoin Price Prediction

本报告通过对比LSTM与GRU两种神经网络模型,利用比特币历史数据,结合5折交叉验证与L2正则化方法,研究了两者在比特币价格预测任务中的表现。结果显示,GRU模型在均方误差(MSE)指标上优于LSTM,且预测速度快30%,表明GRU更适合处理具有长期依赖性的金融时间序列数据,为数字货币价格预测提供了有效的深度学习模型选择参考 [page::0][page::4][page::5]。

Counting Clinical Trials: New Evidence on Pharmaceutical Sector Productivity

本报告基于大规模生成式人工智能模型开发了一种高精度文本分类方法,对2010年以来的临床试验发表数量、质量、组成进行了重新统计。我们发现自2010年以来,临床试验的数量和质量保持稳定,且先前报告的临床试验数量显著增加系分类方法失准所致。此外,公共经费支持比例和高质量引用的临床试验比例亦稳定,表明制药行业生产率自2010年以来未见明显下降。相比之下,其它医疗研究论文数量显著增加,主要由文献综述和来自中国等新兴科研国的科学家贡献,但这部分研究的平均质量有下降趋势。该结果指出制药行业生产率未见实质性恶化,且生成式AI在科学数据构建中展现出强大应用潜力 [page::0][page::2][page::12][page::19][page::21][page::22][page::23][page::24][page::25][page::27][page::29][page::34][page::35].

No-arbitrage conditions and pricing from discrete-time to continuous-time strategies

本文构建了一个从离散时间简单策略通过条件伪距离拓扑生成连续时间金融市场模型的通用框架,避免使用随机微积分且无需半鞅假设。研究了经典无套利条件(NFL,NFLVR,NUPBR)及较新AIP条件,证明这些条件在适当拓扑下连续时间成立当且仅当离散时间成立。同时,展示了即使没有无套利条件,连续与离散时间的超额对冲价格保持一致,为非半鞅市场模型下定价与对冲提供了理论基础和数值估计方法 [page::0][page::1][page::8][page::12][page::15]。

On Joint Marginal Expected Shortfall and Associated Contribution Risk Measures

本报告提出了一种新型系统性风险度量指标——联合边际期望损失(JMES),用以衡量在一个实体处于特定困境水平下,另一个实体风险边际期望损失的附加影响。基于JMES,设计两类系统性风险贡献度量工具,考察其单调性、共动性可加性等基本性质,并通过copula结构和随机序关系,确立不同风险向量间JMES指标的比较条件。结合多种边缘分布和copula的数值算例,以及对全球主要股指间风险传染的实证分析,验证了所提度量相比传统CoVaR、CoES和MES的有效性和稳定性,为系统性风险管理提供了新的理论工具与实证方法 [page::0][page::4][page::6][page::11][page::25][page::33][page::35]

Packing Peanuts: The Role Synthetic Data Can Play in Enhancing Conventional Economic Prediction Models

本论文提出合成数据如同“填充材料”,可填补经济预测模型中的数据空缺,从而提升模型在有限或缺失数据场景下的性能与稳健性。基于Affinity信用卡消费与Womply小型企业数据,研究构建了利用多种缺失值处理技术的基线模型,并设计了随机森林生成合成数据的混合数据模型。实证结果显示,混合数据模型在OLS回归和随机森林预测中显著优于传统方法,证明了合成数据对经济预测的潜在提升价值 [page::0][page::4][page::8][page::10][page::11].

Computational analysis of US Congressional speeches reveals a shift from evidence to intuition

本报告通过分析1879年至2022年美国国会发言,构建了Evidence-Minus-Intuition(EMI)指标,衡量证据基础语言与直觉基础语言的相对使用频率。研究发现,自20世纪70年代中期起,国会中证据基础语言持续下降,伴随党派极化和收入不平等加剧,以及国会立法生产力下降。EMI指标与党派极化呈负相关,且预测未来收入不平等,强调提高证据基础语言对民主健康的重要性 [page::0][page::1][page::2][page::3][page::4][page::5][page::6][page::7][page::8][page::9][page::10][page::11].

Fight like a Woman: Domestic Violence and Female Judges in Brazil

本报告基于2010-2019年巴西圣保罗的司法数据,发现女性法官审理的家庭暴力案件比同经验男性法官更倾向判罪,概率高出31%(10个百分点)。该差异专属于家庭暴力案,且由女性法官在证据解释和判决标准上体现的群体身份偏见驱动。女性法官对亲密伴侣暴力案判罪率尤为显著,且此差异仅在非直接抓获犯罪(主观证据较多)场景明显。此外,性别差异对上诉率、判决撤销率和被告再犯率无影响,表明女性法官的严格判决无额外司法负担也未增加再犯风险 [page::0][page::2][page::4][page::10][page::17][page::21][page::24][page::28][page::30]。

Breaking open the black box of the production function: an agent-based model accounting for time in production processes

本报告提出并构建了一个基于Agent的经济生产模型,首次系统引入了生产过程的时间维度,详细模拟了具有异质性和不同生产工序时长的企业如何在订单驱动下调整资本与劳动力投入,处理生产中的失败风险。通过设定虚拟中央计划者,分析了不同工业政策及生产周期时长对宏观经济指标(如GDP水平及投资消费结构)的显著影响,揭示了生产时间对经济动态和产业结构调整的重要作用,为传统生产函数的时间局限性问题提供了新视角和理论支撑 [page::0][page::1][page::2][page::3][page::4][page::5][page::9][page::15][page::16][page::17][page::18][page::19][page::20][page::21][page::22][page::23][page::24].

Large Language Model in Financial Regulatory Interpretation

本报告探讨了将大型语言模型(LLMs)应用于复杂金融监管文本的自动解析与计算的方法,重点设计工程化提示优化文本理解与数学计算。通过模拟银行资产组合,验证了GPT-4在基于巴塞尔Ⅲ框架的最低资本要求计算中优势显著,同时比较了不同LLMs性能及文档加载方式,提出了高效且准确的监管文本处理流程,提升了金融机构风险管理和合规效率 [page::0][page::2][page::8][page::11].

Coherent Risk Measure on \(L^{0}\) : NA Condition, Pricing and Dual Representation

本文针对定义于随机变量空间\(L^{0}\)上的动态一致风险度量,重构无套利(NA)条件及资产定价基本定理。论文引入基于一致风险度量的风险对冲价格概念,推广经典几乎必然非负的可接受头寸定义,建立了在NA条件下风险对冲价格集合的闭合性,并在风险度量时间一致性假设下给出了风险度量和风险对冲价格的对偶表示。该框架不仅连接了风险度量与无套利定价理论,也对多维市场及非传统风险度量模型提供了理论支撑 [page::0][page::1][page::2][page::6][page::7][page::8][page::9][page::10][page::11][page::13][page::14][page::15][page::17][page::18][page::19][page::20][page::21][page::22][page::23][page::24][page::25][page::26][page::27][page::28][page::29].

IS THE PANEL FAIR? EVALUATING PANEL COMPOSITIONS THROUGH NETWORK ANALYSIS. THE CASE OF RESEARCH ASSESSMENTS IN ITALY

本文提出一种基于网络分析的实证策略,通过对意大利三届经济学、统计学及工商管理研究评估面板成员的合著、期刊发表和机构归属三种网络连结结构比较,检验其智识构成的公平性。结果显示,2004-2010年及2011-2014年两届面板成员之间的合作及相关网络链接显著强于2015-2019年随机抽选的控制组面板,表明前两者存在认知同质性和潜在的不公平状况,可能导致评价结果的偏向和认知偏见。[page::0][page::5][page::10][page::12][page::17][page::23]

A Two-layer Stochastic Game Approach to Reinsurance Contracting and Competition

本文提出一个双层随机博弈模型,研究一个保险人和两个竞争再保险人的比例再保险合同及竞争。通过组合Stackelberg博弈与非合作Nash博弈,推导了均衡存在的充分必要条件并证明其唯一性,均衡策略为常数且可半解析表达。模型涵盖了风险厌恶和相对业绩竞争,数值研究揭示风险规避和竞争程度对均衡溢价及再保险比例的敏感性,为再保险市场的定价与竞争提供理论支持 [page::0][page::4][page::14][page::23]

Complex network analysis of cryptocurrency market during crashes

本报告通过希尔伯特谱识别2017-20年间三次加密货币市场崩盘,采用部分相关构建复合网络。在崩盘期间,网络度密度与聚类系数显著上升,平均路径长度降低,表明信息快速流动及市场恐慌同步抛售的发生。2019-20年崩盘网络变化不显著,暗示动态差异。此研究有助于投资者理解崩盘中的市场结构变化,辅助决策 [page::0][page::4][page::5][page::8][page::9]

High-Frequency Stock Market Order Transitions during the US-China Trade War 2018: A Discrete-Time Markov Chain Analysis

本研究采用一阶齐次离散时间马尔可夫链模型,分析了2018年美中贸易战期间六大行业高频股票市场订单的转移动态。通过卡方检验确认订单序列服从马尔可夫性质,估计转移概率矩阵并据此计算稳态分布、平均再现时间、谱间隙及熵率。研究发现,高波动日交易者更加活跃且大量限价单被故意撤销以影响市场,尤其在财经银行板块全执行订单表现出显著的循环模式,显示其在贸易战中的韧性。类似的谱间隙和熵率表明交易策略在高低波动日较为一致。该分析对理解极端宏观经济事件下的市场行为和制定交易策略具有重要参考价值 [page::0][page::1][page::7][page::10][page::11][page::13]。

Knowledge Distilled Deep Deterministic Policy Gradient for Portfolio Management

本报告提出了一种结合Markowitz投资组合理论与强化学习的混合方法——知识蒸馏DDPG(KDD),通过监督学习阶段预训练代理,再通过强化学习优化投资组合配置。实验表明,KDD模型在收益率、夏普比率等九项指标上均优于传统模型和主流AI算法,最高夏普比率达2.03,实现了高收益与低风险的有效平衡,验证了其在复杂动态金融市场的应用潜力[page::0][page::1][page::4][page::7][page::9][page::10][page::11]。

Inflation Models with Correlation and Skew

本报告提出了一种多因子正态对数通胀模型,结合单因子高斯利率模型G1++,实现对不同期限通胀指数间相关性的拟合,并推导了零息和同比互换、期权的解析定价公式。通过引入杠杆函数模型捕获波动率偏度,实现了市场波动率微笑的再现。针对模型复杂度,报告还提出了无需校准的简化模型,实证展示其与全模型相近的定价性能。研究结合欧元市场数据,展示了校准及定价效果 [page::0][page::6][page::9][page::14][page::17]。