`

Neural Hawkes: Non-Parametric Estimation in High Dimension and Causality Analysis in Cryptocurrency Markets

创建于 更新于

摘要

本文提出了一种基于时刻的神经网络方法,利用物理信息神经网络高效求解Hawkes过程的Fredholm积分方程,实现对高维多维标记Hawkes核的非参数估计。方法在模拟数据中表现鲁棒且准确,并应用到加密货币高频市场数据,揭示成交量对比特币交易率的影响及多达15对加密货币间的因果传导关系,提供市场微观结构的新见解 [page::0][page::2][page::10][page::22][page::23][page::24][page::26].

速读内容

  • 方法创新与基本框架 [page::0][page::2][page::4][page::6]

- 利用Hawkes过程二阶统计的Fredholm积分方程和物理信息神经网络(PINNs),通过深度神经网络直接求解积分方程,避免了传统Wiener-Hopf方法在高维下矩阵求逆的计算瓶颈。
- 设计了一个加权时间损失函数强化时间因果性捕捉,并采用Deep Galerkin Method (DGM)深度架构。
- 参数配置推荐:64神经元,1层DGM,学习率0.001,批量大小8,训练轮数1000,250个时间积分点。
  • 数值实验验证多样核函数性能 [page::8-16]

- 在6组核函数(指数衰减、慢衰减、延迟、抑制、多峰高斯、非乘积型)模拟数据上训练,均能准确拟合时间核$\varphi^{ij}(t)$和标记核$f^{ij}(x)$。
- 误差随着事件数增加呈$\sim N^{-0.5}$收敛速度,优于文献中Wiener-Hopf的$N^{-0.33}$。
- 结果显示该神经方法比Wiener-Hopf更为稳定,能缓解后者在不同二阶统计估计参数选择下的震荡和噪声问题。
  • 训练和调参建议 [page::17][page::18]

- 模型对DGM层数、神经元数量和训练样本数量表现鲁棒,批量大小过大反而影响收敛速度,建议设小(1-8)。
- 学习率设置0.001表现最佳。
  • 应用于加密货币市场的实证研究 [page::20-26]

- 数据来自2023年12月1日至30日Coinbase的15对主流加密货币,微秒级成交逐笔数据。
- 单变量分析BTC-USD成交量标记,发现标记核是量的凹非减函数,交易量超过5万美元后效果趋于饱和,时间核显示多峰延迟结构。

- 多变量15维Hawkes估计,分解出各币种自激和相互激励,系统接近临界状态(分支比0.8),行情涨跌等微结构特征显著。
- 定义溢出率、领导者指数与接受者指数揭示各币种间因果关系,发现BTC、ETH领导市场,XRP既是强领导者也是强接受者,关联XLM,市场活动大小与因果强度并不严格正相关。
  • 稳健性检验 [page::25][page::35][page::36]

- 对高频数据的日内季节性影响进行校正,发现模型估计核及因果指标在选定交易活跃时段(7:00-12:00 UTC)内稳定,与全时段数据差别不大。
  • 总结 [page::26]

- 提出一种基于物理信息神经网络的高维多维Hawkes过程非参数估计新方法,克服传统方法的计算挑战,精度高且鲁棒性好。
- 该方法可支持连续求解核函数,适用于复杂核函数形式。
- 结合加密货币市场数据,揭示了交易量的非线性影响和币种间的复杂因果传导结构,提供金融微观结构研究新工具。

深度阅读

金融研究报告详尽分析报告



---

1. 元数据与概览


  • 标题: Neural Hawkes: Non-Parametric Estimation in High Dimension and Causality Analysis in Cryptocurrency Markets

- 作者: Timothée Fabre, Ioane Muni Toke
  • 发布机构: Laboratoire MICS, CentraleSupélec, Université Paris-Saclay, SUN ZU Lab, Paris, France

- 发布日期: 2024年11月5日
  • 研究主题: 多维标记Hawkes过程的非参数核估计方法与加密货币市场因果关系分析


核心论点:
报告提出了一种新颖的基于动差(moment-based)的神经网络估计方法,用于解决多维标记Hawkes过程的Fredholm积分方程,从而实现内核的非参数估计。该方法借助物理信息神经网络(PINNs)解决高维偏微分及积分方程,在高维数据(尤其是加密货币市场高频微结构数据)中效果显著。作者通过模拟数据进行了广泛验证,并在加密货币市场实证分析中揭示了交易量对交易到达率的影响及多品种交易对之间的因果传播关系。整篇报告旨在突破传统估计方法计算量大、受维度诅咒和局部收敛问题的限制,提供一种更稳定、高效的非参数核估计新范式。[page::0,1,2]

---

2. 逐节深度解读



2.1 引言与文献回顾


  • 介绍Hawkes过程:一种自激及互激的点过程,广泛用于建模时间序列事件,刻画事件间激励效应。强调其在金融(尤其市场微结构)、地震、神经科学等领域的应用。

- Hawkes过程的性质由基线强度和核函数共同定义,核函数反映历史事件对未来事件率的影响。
  • 传统核估计多以参数化方式(通常为指数核)通过极大似然估计求解,容易受非凸性影响且难以适应复杂形态(如非单调、含潜伏期、含抑制效应)的情况。

- 非参数方法的需求迫切,已有方法包括EM算法、自回归(INAR)框架、贝叶斯推断及少量研究尝试神经网络方法(倾向于似然优化,受局部极小值影响且计算成本高)。
  • Bacry和Muzy提出的基于第二阶统计的Fredholm积分表征为非参数估计提供理论基础,但其通过Wiener-Hopf方法数值求解时受维度爆炸和数值稳定性问题限制。

- 报告针对该问题,借助PINNs的最新发展,提出用神经网络替代传统矩阵反演,解决高维Fredholm积分方程。[page::1,2]

2.2 方法框架与物理信息神经网络(PINNs)


  • 通过复习Fredholm积分方程的结构及解决方法,说明PINNs如何将原问题视为“物理”限制下的损失函数优化问题,避免传统解法中的高维矩阵反演,提升求解稳定性和扩展性。

- PINNs原本用于偏微分方程,这次创新性地应用在积分方程解算。
  • 设计包含时间和标记变量的神经网络结构,训练过程中引入加权损失函数强化时间因果性,以提升对小时间尺度高波动内核的拟合能力。

- 采用Deep Galerkin Method(DGM)改进传统网络,替换激活函数为ReLU以更好拟合非连续核。
  • 网络拆分为多子网络对应各行内核矩阵,实现并行化并降低训练难度。

- 提供细致的训练流程(含初始化、自适应采样、批处理梯度下降等),确保训练效率和结果稳定性。[page::3,4,5,6]

2.3 核估计与训练细节


  • 核函数记作 \(\phi^{ij}(t,x)\),其中\(t\)为时间,\(x\)为标记(交易量等)。

- 定义加权损失函数 \(\mathcal{L}^\omega\) 来缓解高幅值核对模型训练的主导影响,使得较小兴奋或抑制效应核同样被精确拟合。
  • 对时间采样采用非均匀采样,在极短时间尺度(毫秒及以下)采样密度更高,匹配高频金融事件的特点。

- 标记变量采用离散均匀采样。
  • 对积分计算采用数值积分(复用对数网格),权衡计算精度和效率。

- 训练过程中根据因果性设计特殊的时间权重策略,强化模型对时间前后延迟效应的捕获。
  • 介绍标准化时间与标记数据的预处理方案,便于模型训练收敛和提效。

- 特别提到训练时间不随事件数直接增长,计算时间主要集中在统计量估计阶段,这相比基于似然优化方法有显著优势。[page::6,7,8]

2.4 数值验证


  • 设计6个模拟实验覆盖指数衰减、慢衰减(幂律)、带延迟指数衰减、抑制作用内核、多模态高斯内核及非乘积形态核。

- 实验维度从2维扩展到15维,事件数上千万,充分展示算法的高维适应性。
  • 实验结果显示该方法能够精确恢复各类内核形态,尤其是复杂的延迟、多峰以及抑制现象均能被准确识别(见图1-7)。

- 归一化误差随样本量呈现约 \(N^{-0.5}\) 衰减,显示高统计效率且优于传统Wiener-Hopf方法理论分析的 \(N^{-0.33}\) 衰减。
  • 网络结构参数如层数、神经元数对结果影响有限,较小批量训练提高学习速度和稳定性。

- 对比传统Wiener-Hopf方法,神经估计在核的顺序量级显著不同的情况下,结果更加平滑且无振荡。
  • 神经网络方法对统计二阶量估计网格参数调整不敏感,而Wiener-Hopf对网格选择极为依赖,体现其更高的实用鲁棒性。[page::8-19,32]


2.5 应用:加密货币市场高频数据分析



2.5.1 交易量对到达率影响(单维标记情况)


  • 利用Coinbase 2023年12月1-30日15对主流币交易数据,时间戳精确至微秒。

- 交易量作为标记构造离散分布,涵盖从100美元到100,000美元以上的多档划分。
  • 核函数随交易量呈现凹非减曲线,大规模交易量边际信息递减,50,000美元以上趋于平台期(即影响度不再上升)。

- 时间核展现多个典型延迟峰值(约10微秒、4-5毫秒、10毫秒),大交易量对应的峰值更多,可能反映复杂回馈机制。[page::20-22]

2.5.2 多维因果溢出分析


  • 建立15维单标记Hawkes过程(无标记因子,M=1),估计交易对间冲击传播。

- 计算基线强度、核矩阵及分支比(系统稳定性指标)约0.80。
  • 发现BTC与ETH虽是交易量最大的币种,却非内部兴奋最强,部分小币如AAVE、DOGE拥有更强的自激性。

- 汇总因果溢出指标定义“领头羊比率”和“接受者比率”,量化币种在冲击传递网络中的角色。
  • 结果表明,BTC、ETH、XRP为显著领头羊,而XLM、XRP等为主要接受者。XRP作为典型“双向”节点既传播又接收冲击。

- 交易量排名与领头羊程度存在一定偏离,交易量大并非冲击引领力强的充分条件,提升因果分析实际应用价值。
  • 全面考虑了引入内核的延迟、多峰及抑制特征,揭示加密货币市场微观结构复杂多元的传播机制。[page::23-25]


2.5.3 交易日内季节性及稳健性验证


  • 验证Hawkes模型在市场实际存在日内非平稳性情形下的稳健性。

- 统计显示7-12点(UTC)交易活跃度相对稳定,采用该时间段数据重估模型。
  • 新估计的分支比、因果量度与全时段估计极为接近,证明原模型在实际中的适用性。

- 进一步基于每日子样本拟合计算指标的分布,证明模型输出在时间上的稳定性及鲁棒性。
  • 与相关文献实验及理论相符,凸显本文方法在实务场景中的可推广性与实用价值。[page::25-26]


---

3. 图表深度解读



3.1 模拟实验图解


  • 图1-2(第10-11页):指数衰减核的时间核和标记核拟合。实线为真实内核,虚线为估计核。整体贴合度极高,表明神经网络准确捕获指数衰减形式及不同形状的标记依赖。

- 图3(第12页):慢衰减(幂律)核的拟合,x轴为对数尺度,展示模型对长记忆行为的拟合优秀,能准确再现随时间缓慢衰减的模式,同时对标记函数的拟合也极为一致。
  • 图4(第13页):带延迟的指数衰减核,多峰结构明显,模型能清晰识别不同事件间传导延时,证明了方法对非单调功能的捕获能力。

- 图5(第14页):含抑制效应的内核,允许核函数取负,神经估计较Wiener-Hopf方法更平滑、稳定,成功避免振荡。
  • 图6(第15页):15维高维双峰高斯核,图中多子图展示不同维度间的内核形态,模型成功捕捉到复杂多峰时序结构,验证了高维扩展能力。

- 图7(第16页):非乘积型双峰高斯核,在标记不同取值下时间核变化,被成功捕获,展示了模型对非乘积依赖的泛化能力。
  • 图8(第17页):估计误差随样本量的对数坐标衰减图,呈现 \(\sim N^{-0.5}\)的速率优于传统方法。

- 图9-10(第18页):显示超参数(网络层数、神经元数量、训练集大小、批量尺寸)对误差和损失影响,批量尺寸较小有助于性能,表明模型训练较为稳定。
  • 图11-12(第19页):Wiener-Hopf方法与神经估计对比。Wiener-Hopf结果震荡严重,神经估计结果光滑且拟合好。进一步用估计核反推二阶统计,再用Wiener-Hopf估计,波动减小,说明神经方法对数据噪声较鲁棒。

- 图13-14(第20-21页):对比不同二阶统计网格对估计影响。神经方法稳定,Wiener-Hopf震荡,尤其网格过细时噪声更大,凸显神经方法对统计参数调节不敏感的优势。

3.2 实际数据分析图解


  • 图15(第22页):BTC-USD交易量对内核影响。左图为时间-标记内核随交易量变化,不同颜色代表不同交易量档。右图为聚合标记内核 \(f(x)\),曲线呈现递增凹函数,交易量大于5万美元后趋于平台期。

- 图16(第23页):15维加密交易对的分支比矩阵、核主对角线项及其幂律衰减近似。显示币种间因果影响及自激结构,给出市场多层次动态特征。
  • 图17(第25页):溢出比率及领头羊和接受者指标排名矩阵。BTC、ETH为主要领导币,XRP既是领导者也是主要接受者。币种参与度与领导力并非强相关,实现因果推断的价值。

- 图21-24(第35-36页):日内交易活跃度趋势,稳健性分析结果。多时间窗估计说明方法对日内非平稳影响具有鲁棒性,核心结论保持稳定。

---

4. 估值分析



报告主要聚焦非参数核估计方法的设计与应用,未涉及财务估值模型或目标价预测,因而本节无相关内容。

---

5. 风险因素评估



虽然报告未专门设立风险章节,但通过文内内容可辨识潜在风险:
  • 数值计算稳定性:传统Wiener-Hopf方法在高维、不同量级内核估计中呈现振荡,可能误导因果推断。新方法通过神经网络拟合大幅提升稳定性,但依赖神经网络训练的收敛性与超参数配置,仍可能存在收敛至局部极小值风险。

- 数据依赖与二阶统计估计误差:高频数据存在细微的非平稳及波动,二阶统计估计质量直接影响核估计精度。报告中通过网格设计和加权损失函数来缓解此问题,但对极端或非常规市场条件下的鲁棒性尚需进一步检验。
  • 标记空间离散化假设:实际标记空间复杂,离散处理可能简化真实结构,选取标记划分区间时需谨慎。

- 市场非平稳:通过季节性分析部分尝试减轻市场日内非平稳风险,但长期宏观事件等不可控因素依然可能影响参数估计。

报告通过多轮数值实验和实证稳健性检验,部分缓解上述风险,但实际应用中仍应监测模型稳定性及重训练频率。[page::18,20,25]

---

6. 批判性视角与细微差别


  • 报告高度依赖二阶统计估计,若统计估计误差较大,将影响内核估计可信度。尽管提出了加权损失和时间加权,两步方法可能仍难以彻底避免误差放大。

- 关于核矩阵的稀疏性及高维可解释性,报告未讨论较多。实际高维金融体系往往呈现高度稀疏和局部块结构,这对核估计和后续因果识别具有指导意义,相关约束可能提升精度和含义。
  • PINNs的训练复杂度和超参数敏感性在其他研究中已显著,报告展示对多参数敏感性不大,或受限于具体架构和任务,需更普遍验证。

- 文献回顾虽详尽对比相关方法,但对其他深度学习相关时间序列模型(如Transformer用于点过程建模)未展开,可作为未来拓展方向。
  • 在应用层面,虽提供量化的“溢出”和“领头羊”指标,但未进一步结合区块链技术特性、交易策略及市场微观机制做因果机理诠释。


---

7. 结论性综合



本报告创新性地将物理信息神经网络应用于多维标记Hawkes过程的非参数核估计中,成功绕过了传统Wiener-Hopf方法计算复杂性高、数值不稳定的局限。该方法通过学习Fredholm积分方程近似解,实现了高效、稳定及具有一定鲁棒性的高维内核估计。

从模拟实验看,该方法对多类型核函数均表现出较高拟合精度,能够捕捉复杂的延迟、抑制及非乘积性的核特征,误差随样本量以约 \(N^{-0.5}\) 的速率衰减,训练对网络结构和超参数不敏感,适合大规模并行计算。

通过图表细读,所有关键图表均验证了方法的拟合优异性:
  • 图1-7清晰展示模型在时序及标记维度上准确拟合多样化核形态。

- 图11-14实验证明神经网络方案显著优于Wiener-Hopf方法,在降噪和避免振荡方面表现卓越。
  • 图15揭示交易量作为标记对交易率的非线性、递减边际效应,符合现实市场认知。

- 图16-17和附录分析展示币种间复杂双向因果影响,新指标提供金融市场内因果关系的可量化衡量,突破了仅凭交易量推断领头羊的局限。

从实证应用看,方法成功揭示加密货币市场交易内核的多峰延迟及抑制结构,提供有效的因果传播网络分析工具,具备广泛推广潜力。

风险控制及方法稳健性方面,报告通过多角度数值与实证检验展示了方法的高鲁棒性及稳定性,且针对日内季节性等实务问题进行了针对性处理,增强了模型的现实可用性。

总体而言,报告严谨创新,理论与实证俱佳,开拓了金融高频因果关系分析的新路径。推荐该非参数神经Hawkes估计为金融市场微结构及相关多维事件因果分析的重要工具。

---

附:部分关键图表引用(Markdown格式)


  • 指数衰减核时间拟合(图1)示例:


  • 指数衰减核标记拟合(图2)示例:


  • 多维加密货币因果溢出热力图(图16)示例:


  • 加密货币市场领导者-接受者排序(图17)示例:


  • 交易量影响标记内核(图15)示例:



---

参考文献标注



本文中报告所有结论、数据及论断均严格源自原文所述内容,[page::对应页码]。内容引用覆盖0-36页全文,确保可溯源和准确。

---

报告