`

Optimal Control of Reserve Asset Portfolios for Pegged Digital Currencies

创建于 更新于

摘要

本论文针对锚定数字货币的储备资产组合管理问题,构建了连续时间随机最优控制模型,结合自激Hawkes过程模拟铸币和赎回交易簇集性,设计了基于Pontryagin极大值原理的软阈值重平衡策略。通过模拟多种金融压力测试情形,验证了模型在维持锚定稳定性同时实现收益最大化的有效性,并给出实际可实施的结算窗口重平衡规则,明确了压力响应的单调性和资金转移机制,为稳定币发行机构提供透明可审计的资金调度方案 [page::0][page::1][page::4][page::6][page::11][page::14][page::19][page::20]。

速读内容


稳定币储备资产管理问题建模及背景介绍 [page::0][page::1]

  • 论文聚焦稳定币发行者如何在现金流动性和短期限国债收益之间权衡储备配置。

- 采用Hawkes过程模拟铸币与赎回的簇集现象,刻画赎回压力与价格偏离(脱锚)的动态反馈机制。

储备管理动态模型及控制目标 [page::3][page::4][page::5][page::6]

  • 储备资产分为即刻可用现金和带息短期国债,状态变量包含现金余额、国债面值、偏离程度及流动强度。

- 控制变量为现金与国债间再配置流量和铸币赎回的差价费率。
  • 目标函数综合收益、锚定稳定惩罚、费率波动成本及交易成本,构建无限期折现成本最优化问题。


随机模型预测控制与Pontryagin极大值原理求解方法 [page::7][page::9][page::10][page::11]

  • 使用模型预测控制(MPC)将无限期问题转换为滚动有限期控制,结合Hawkes过程的条件期望进行确定性近似。

- 通过Pontryagin极大值原理导出状态影子价格,控制策略呈现软阈值(带交易成本的稀疏)结构,且费率采用线性反馈形式。
  • 设计以结算窗口为单位的分段常数控制,简化实际操作,控制信号仅需基于窗口内的影子价格加权平均计算。


压力响应单调性与操作规则 [page::13][page::14]

  • 证明控制策略对赎回压力的响应呈单调性,赎回压力越大,现金配置比例越高。

- 识别出阈值现象,赎回压力低于阈值时保持不动,超过阈值时以最大速率转向现金。
  • 策略避免频繁切换,符合风险管理中的稳健性要求。


数值模拟与策略性能对比 [page::15][page::16][page::17][page::18][page::19][page::20]

  • 设定三种典型市场场景(单次冲击、持续簇集、误警),评估最优策略与最大收益、最大流动性策略的表现。

- 结果显示最优控制在保持收益的同时,有效降低脱锚概率和扩大响应时机,避免了保守或激进策略的明显缺陷。
  • 回测图显示最优策略在初期稳健持有国债,压力增大后及时提升现金储备,具有较好的风险收益平衡。




结论与未来研究方向 [page::20]

  • 提出了结算窗口下的稳定币储备动态管理框架,实现资金流动性与收益的最优权衡。

- 该方法具有透明、可审计和实施简便等优势,适应监管需求。
  • 建议未来工作扩展更复杂的流动模型、在线参数估计及稀有事件概率分析。


深度阅读

详尽分析报告:《Optimal Control of Reserve Asset Portfolios for Pegged Digital Currencies》



---

1. 元数据与概览


  • 报告标题:《Optimal Control of Reserve Asset Portfolios for Pegged Digital Currencies》

- 作者:Alexander Hammerl(Technical University of Denmark),Georg Beyschlag(Technical University of Munich)
  • 发布日期:2025年8月14日编译

- 研究主题:聚焦于稳定币(stablecoins)发行机构的储备资产组合的动态管理,研究如何在维持稳定币锚定(如1美元锚定)同时最大化储备资产的收益,通过最优控制理论解决储备管理问题。
  • 核心论点:稳定币发行人需在储备资产的流动性与收益之间权衡,通过现金与短期国债的动态配置,以及对铸币和赎回的费用设定,实现对锚定偏差的最小化。本报告提出了一套基于随机模型预测控制(MPC)及Pontryagin极大值原理的控制框架,通过带有激励特性的“霍克斯(Hawkes)过程”建模铸币与赎回应答流,针对储备的现金与国债配置和费用扩展制定动态反馈控制策略。

- 主要结论:开发的控制策略带有明晰的bang-off-bang(极限-静止-极限)结构,结合结算窗口限制,实现软阈值策略(soft-thresholding),能够在市场压力加剧时快速向现金转移储备,在平稳期维持国债收益,策略既切实可行又与实际运营时间窗口高度契合,显著提升锚定稳定性且避免不必要的收益牺牲[page::0,1,3]。

---

2. 逐节深度解读



2.1 引言


  • 阐述稳定币作为数字资产市场核心基础设施的地位,稳定币发行方守约履行1:1锚定需即时满足赎回需求同时争取储备收益。

- 指出基于法规(如美国GENIUS法案)对可用储备资产的严格限制(现金、短期美债和逆回购协议等),导致一个典型的库存管理问题:现金的流动性和国债收益之间的平衡,以及如何通过费用调整吸取订单流的不平衡。
  • 论述稳定币经营问题与DeFi中更广泛的流动性和价格稳定的机制相互影响,包括与矿工最大可提取价值(MEV)相关的市场行为及其对赎回执行的影响。

- 总结大量文献,强调即使全抵押型设计依旧存在锚定偏差,价格和波动性具有状态依赖性,铸币赎回流的簇集性(clustered order flow)对锚定表现影响重大,策略必须反映这些动态而非假设偏差为纯噪音。
  • 介绍了两类数据分析对因果关系的分歧观点(稳定币流动与比特币价格的相互作用),以及宏观金融环境(如利率)如何调节流动性的机会成本与赎回风险。

- 引入行业整体安全视角,提及跨币种资金流动及市场间风险传染,强调对压力情景的建模需求,并以MakerDAO、Terra-Luna崩溃案例警示操作中对流动性压力的精细管理必要性。
  • 全文框架预告,指明下面章分别介绍模型设定、求解方法、实验设计与数值结果以及结论[page::0,1,2]。


2.2 储备管理框架



2.2.1 法规要求


  • 以美国GENIUS法案作为建模基准,列明6类允许的高质量流动性资产,包括储备现金、FDIC担保的存款、90天以内国债、隔夜逆回购、政府货币市场基金及其代币化形式。

- 资产构成形成流动性层级,现金即时结算但无收益,短期国债收益率约5.4%但因市场风险存在价格损失可能;其他类别流动性和结算时间均有限制并伴有不同风险(例如智能合约风险)。
  • 强调储备配置核心矛盾:现金流动性与零收益对比国债利率收益与流动性风险[page::3,4]。


2.2.2 动态储备模型与价格锚定


  • 定义锚定价格偏差 \(\Delta P(t)\),正值表示币值低于1美元。

- 铸币和赎回应答以自激性的“霍克斯过程”(Hawkes process)建模,分别反映事件簇集效应,赎回流的强度随偏差波动呈平方反馈,体现信任危机诱发的“银行挤兑”动态。
  • 铸币与赎回以标记点过程反映交易量,净赎回流为赎回与铸币差额。

- 锚定偏差增长率由流动性不足的比例决定(赎回需求超过现金备付),手续费\(\delta(t)\)反向抵消偏差。
  • 简化将储备划分现金和短期国债两类作为状态变量,控制包括现金与国债间转移速率\(\omega(t)\)和手续费\(\delta(t)\)。

- 储备动态遵循确定性微分方程,现金收益为零,国债收益按周期利率计算,存量非负及交易速率有限制。
  • 目标函数为长期折现成本,考虑锚定偏差平方、手续费平方、交易摩擦成本及持有债券机会成本。

- 整体控制问题为无限期随机最优控制,服从稳态强制条件确保过程不爆炸[page::4,5,6,7]。

2.3 方法论与解决方案



2.3.1 随机模型预测控制(MPC)


  • 由于无限期问题计算复杂,采用滚动有限期MPC,每个时间点求解未来短期控制优化,只施行当前决策再更新。

- 利用历史数据递归更新和预测霍克斯强度的条件均值,完全转化为确定性优化问题。
  • 管理模型因子包括当前储备状态、锚定偏差和预计铸币赎回流量,优化轨迹给予反馈控制。

- MPC适合约束处理、动态预测的灵活管理,确保政策可审计且实时适应流动性变化[page::7,8]。

2.3.2 Pontryagin最大值原理(PMP)


  • 将MPC中确定性最优控制转化为微分方程系统,通过构造Hamiltonian求解状态和协态变量。

- 协态变量被解释为状态的隐含贬值/价值。
  • 控制信号的解析结构为:

- 费率\(\delta(t)\)有线性反馈结构并被截断限幅。
- 储备调整速率\(\omega(t)\)带有绝对值成本项,呈现软阈值(soft-thresholding)形式,含有区间投影,体现bang-off-bang行为:当影子价格差低于阈值,无动作;高于阈值,全速调整[page::9,10]。

2.3.3 结算窗口与离散控制实现


  • 考量实际结算窗口(如Fedwire时间等)限制控制更新频率,控制在窗口内保持常值。

- 离散化Hamiltonian最小化导出相应窗口度量的累积影子价格差,重新形成窗口级别软阈值控制策略。
  • 离散策略确保时间平均交易决策符合实际操作节奏,避免因交易密度过高导致的计算和执行负担。

- 定理3.1严密证明该窗口软阈值规则是子区间内优化的全局凸解,且可视为对连续策略的自然折叠。
  • 介绍单调压力响应性质(Theorem 3.2),给出一系列数学步骤保证:

- 赎回压力越大,最佳储备调整策略越倾向于现金持有(即\(\omega^*\)越负)。
- 存在阈值参数,当赎回流量小于阈值时无动作,超过后快速转向现金。
- 这一性质帮助稳健且可预测地转变储备结构,防止过度震荡和市场冲击[page::11,12,13,14]。

2.4 数值实验



2.4.1 实验设计


  • 模拟2025年8月到10月三个月,三次日内结算窗口(10:00, 13:00, 16:00)。

- 三个情景测试系统表现:
1. 单次冲击:30~45天赎回压力增加2-4倍,随后指数回落。
2. 长期簇集:自激参数接近临界,产生多发后续簇集事件。
3. 虚假警报:短期铸币激增后赎回轻度反弹,测试控制器的抗误判能力。
  • 测量指标包括完全脱锚事件频率及响应时滞。

- 对比策略包括最大收益策略(优先持有国债,需时转现金)和最大流动策略(全现金持有)[page::15]。

2.4.2 参数设定


  • 利率采用2025年8月最新曲线,窗口利率约$5.4\%$年化换算成每窗口4.93e-5。

- 折现率$\rho$为每窗口7.31e-5,体现8%年化资本成本。
  • 最大调仓速率10%供应量每窗口。

- 订单流参数基于USDC和USDT实测数据,基础频率及簇集参数均服从稳定(亚临界)霍克斯过程,交易规模为十万级美元。
  • 成本参数$c{peg}$通过允许10bps最大偏差及基于国债收益估算,确保经济代价量化合理,费用罚金\(c{fee}\)与目标手续费10bps对应。

- 交易成本反映市场微结构包含线性价差和二次市场冲击。
  • 模拟初始10B规模,储备分配现金10%、国债90%[page::16,17]。


2.4.3 结果呈现与分析


  • 总收益对比表明最优控制策略远优两极端方法,尤其对冲击期表现更加稳健和收益可观。

- 全债策略由于提现需求,后期流动性吃紧,失败概率与响应迟滞不及最优控制。
  • 全现金策略虽无脱锚风险但放弃重大收益。

- 图1(见图片)展示三策略现金买入/卖出行为,最优控制明显具备灵活建仓和适时脱仓特征。
  • 铸币赎回压力上升前,策略维持票据头寸;压力加大后,快速且持续转为现金;虚假警报下,控制器无过度反应,避免不必要收益损失[page::19,20]。


2.5 结论


  • 强调本文将储备管理转化成严格的连续时间随机最优控制问题,模型完备反映簇集事件、价格反馈和资金流动。

- 理论推进了储备调整与费用控制双控框架,具备纯数学最优保障,结合现实操作结算窗口,实现了操作可行的阈值式策略。
  • 数值模拟表明控制器在保持利率收益和锚定稳定之间达成了优越平衡,在压力时刻迅速调节现金,平稳时维持收益资产。

- 提出未来扩展方向包括更复杂流量统计建模、实时参数估计和风险敏感控制,以及实际发行方数据的经验验证。
  • 该研究为稳定币发行方提供了一套透明、可审计且适应性强的储备资产管理蓝图,有助于提升市场信心和监管合规[page::20,21]。


---

3. 图表深度解读



图1. 不同策略下的控制行为趋势图(第19页)


  • 描述:图1展示了三种策略(最优控制-绿线,最大收益-灰线,最大流动性-蓝线)在三种市场情景(单次冲击、长期簇集、虚假警报)下现金买入/卖出资金规模随时间变化。

- 数据解读
- 最大收益策略在初期迅速大幅买入国债(见灰线上升),待赎回需求强烈时快速卖出(灰线下降),表现出高波动和流动性危机。
- 最大流动性策略(蓝线)维持现金持有,无明显调仓行为。
- 最优控制策略(绿线)维持低仓位直至压力出现,随后以渐进方式增加现金仓位,避免流动断裂。
  • 联系文本论点:图形直观支持策略设计的有效性,最优控制在收益与风险之间动态权衡,比极端策略更平滑且合理[page::19]。


表1. 总收益对比(第17页)



| 策略 | 情景 | 总收益 |
|------------|-----------------|------------------|
| 最优控制 | 单次冲击 | 1.86×10^8 |
| | 长期簇集 | 1.20×10^8 |
| | 虚假警报 | 1.22×10^8 |
| 最大收益 | 单次冲击 | 5.52×10^7 |
| | 长期簇集 | 3.01×10^7 |
| | 虚假警报 | 7.85×10^7 |
| 最大流动性 | 单次冲击 | 0 |
| | 长期簇集/虚假警报| 0 |
  • 解读:最优控制收益远超最大收益策略,后者在流动性压力下迟缓响应导致较低收益,最大流动性策略放弃利息收益导致收益为零[page::17]。


表2. 脱锚频率及响应时长(第18页)



| 策略 | 情景 | 脱锚频率 | 响应时长(天) |
|------------|-------------|----------|----------------|
| 最优控制 | 单次冲击 | 1.0 | 1.75 |
| | 长期簇集 | 1.0 | 2.47 |
| | 虚假警报 | 0.0 | n/a |
| 最大收益 | 单次冲击 | 1.0 | 0 |
| | 长期簇集 | 1.0 | 0 |
| | 虚假警报 | 1.0 | n/a |
| 最大流动性 | 所有情景 | 0.0 | n/a |
  • 解读:最大流动性策略无脱锚风险但也无收益。最优控制在遭遇风险时能延迟脱锚响应,且在无压力时避免虚假预警导致无需求反应,显示优良的风险返力和平衡[page::18]。


---

4. 估值分析:无直接估值



本报告为运筹与资金管理策略研究,无直接公司估值部分,但通过成本函数设计隐式刻画了锚定偏差、费用和交易成本的经济价值权衡,关键利率、成本参数由市场数据和监管目标标定,隐含了储备组合的“成本-收益”约束框架。

---

5. 风险因素评估


  • 赎回流量激增风险:激励自激型赎回流可能形成流动性挤兑,造成现金不足导致锚定偏离。

- 市场利率变化风险:现金与国债收益利差的不稳定使得保守与收益性配置需动态调整,利率上升加剧现金持有机会成本。
  • 结算窗口限制风险:批量交易执行频次有限制,若窗口过长可能影响即时应对赎回峰值能力。

- 模型参数估计及市场变化:霍克斯过程参数、交易规模及簇集效应变化可能带来模型预测误差。
  • 极端事件脱锚风险:完全脱锚事件虽概率极低但破坏性极大,模拟样本有限难以准确估量尾部风险。


报告对以上风险多有定量述评,采取滚动MPC和软阈值策略帮助缓解,通过对赎回强度阈值敏感控制实现风险应对[page::6,7,14,20,21]。

---

6. 批判性视角与细微差别


  • 报告主要以美国法规为建模基准,跨地区适用性需谨慎验证,尽管作者提及普遍适用性。

- 对其他储备资产类型简化处理仅采用现金和短期美债,忽略细粒度操作性差异可能导致对特殊资产流动性风险估计不足。
  • 模型基于参数静态假设,但实际环境参数时变,本报告指出未来可引入在线估计改进。

- 赎回交易量和簇集强度建模使用单向激励霍克斯过程,未深度探讨多资产或多渠道交叉激励,限制复杂市场行为捕捉。
  • 数值仿真标配仅100次实验,尾部风险评估未充分,作者正视此点并提出未来扩展方向[page::20,21]。

- 费用模型线性和二次项设定合理但过于简化,未涵盖所有现实市场微结构复杂因素。

总体,尽管存在简化,报告理论体系严密,结合现实操作窗口且数值展示充分,适合作为稳定币储备管理的流程化框架。

---

7. 结论性综合



本报告针对稳定币发行机构的储备资产管理问题提出了一套基于随机模型预测控制和Pontryagin最大值原理的最优控制框架,将现金与短期国债的储备分配和铸币赎回费用作为控制变量,结合簇集型赎回应答流(Hawkes过程建模)和锚定偏差反馈,揭示了储备管理的“liquidity vs carry”核心矛盾。通过理论分析及数值仿真,得出以下关键见解:
  • 设计的最优策略在无压力时期最大限度保持持有短债以获取收益;在赎回压力积累或窗口变长时,策略自动倾向于迅速增加现金储备,防范流动性风险。

- 控制策略以“软阈值”形式实现操作简洁且响应灵敏,结合结算窗口节奏与操作实践,提升实施可行性和监管可审计性。
  • 数值实验显示最优控制较比极端策略,兼具安全和效益优势:相较最大收益策略,更能有效避免流动性紧张导致大规模债券抛售;相较最大流动性策略,实现收益提升。

- 监测赎回流量强度及动态反馈费用调整帮助在市场波动中保持锚定稳定,减少脱锚可能。
  • 研究成果为稳定币发行方提供了一个科学且实操友好的储备管理蓝图,有望增强市场信心和监管合规体系。

- 此外,报告强调未来需进一步扩展模型的动态估计能力、多资产配置、风险敏感控制及大样本尾部事件分析,提升现实适配度。

综上,本文深入剖析稳定币储备资产的最优配置问题,通过严谨的数学模型与实证仿真,建立了连接微观交易行为与宏观储备策略的桥梁,为数字货币市场提供重要的理论支持和操作指导[page::0-21]。

---

参考文献溯源



报告所引用文献涵盖法规条款、美联储利率数据、多个关于霍克斯过程和稳定币市场行为的实证研究及理论分析,支持模型假设及参数设定的科学有效性。文献[1]为关键法规文件,其他文献涵盖市场微结构、流动性风险、算法稳定币案例分析等四大维度,保证了模型的理论深度与实际关联[page::1,2,21]。

---

以上为这份未来前沿稳定币储备管理研究报告的详尽分析解构,涵盖了其理论建模、求解方案、实施细节及实证验证的全景视角,为金融专业人士和政策制定者理解数字资产时代的流动性风险提供了有力参考。

报告