Electricity Price Forecasting in the Irish Balancing Market
创建于 更新于
摘要
本报告针对爱尔兰电力平衡市场电价预测,提出了一个基于公开数据集和多种模型的可复现框架。研究发现,日内市场表现优异的深度学习模型在平衡市场表现不佳,简单统计模型LEAR凭借LASSO正则化方法表现最佳,且训练数据量增大显著提升模型准确度。结果表明,平衡市场的高度波动性和剧烈价格峰值对预测模型构成挑战,为后续研究提供了基准和改进方向 [page::0][page::2][page::15][page::23]。
速读内容
- 研究背景与意义 [page::0][page::1]
- 平衡市场(BM)价格波动剧烈,预测挑战大,现有文献稀少且缺乏公开数据。
- 日内市场(DAM)电价预测研究成熟,深度学习表现优异,本报告尝试将其方法迁移至BM。
- 数据集与特征 [page::8][page::9]
- 数据涵盖2019-2022年BM历史和未来预报数据,包括价格、交易量、风力误差、互联导流、日内市场价格等。
- 目标变量为未来16个开放结算周期的BM价格预测。
- 预测模型及方法 [page::11][page::12][page::13]
- 多类别模型:统计模型LEAR(基于LASSO正则化)、机器学习模型(随机森林RF、极端梯度提升XGB、支持向量回归SVR)、深度学习模型(单头DNN和多头RNN-DNN)。
- 采用滚动验证法,训练窗口30、60、90和365天,超参数通过验证集优化。
- 模型表现及对比分析 [page::15][page::16][page::17]
- LEAR模型整体表现最佳,预测更稳健且避免过度拟合价格峰值,且训练集时间越长性能越优,MAE降低3.31€/MWh。
- XGB表现优异,接近LEAR,优于RF与SVR。
- 深度学习模型在BM表现不佳,尤其多头模型较弱,常过度预测峰值,导致误差扩大,但在较稳定的DAM市场表现优于统计模型。


- 统计显著性检验及误差分时段分析 [page::18][page::19]
- DM检验显示LEAR与XGB、RF性能显著优于其他模型,所有模型均显著优于基线Naive模型。
- 15:00-18:00价峰和波动最大时段预测误差显著增大,DL模型夜间低价时段表现较好,LERA及ML模型对波动时段更稳健。

- 平衡市场与日内市场对比 [page::19][page::20][page::21]
- BM价幅更大且波动更剧烈,DL模型在DAM能捕捉峰值且表现优于LEAR,反之在BM表现则较差。


- 计算效率分析 [page::21][page::22]
- LEAR和XGB训练时间远小于DL模型,尤其多头RNN-DNN训练最耗时,适合实时快速训练的为LEAR和XGB。

- 量化策略及因子构建
- 本文无具体量化因子构建细节,核心在于多模型训练比较与性能基准搭建,公开数据集与代码促进后续量化策略研发 [page::2][page::23]
深度阅读
深度分析报告:《Electricity Price Forecasting in the Irish Balancing Market》
---
元数据与概览
报告标题: Electricity Price Forecasting in the Irish Balancing Market
作者: Ciaran O’Connor, Joseph Collins, Steven Prestwich, Andrea Visentin
发布机构: University College Cork, Ireland 的 SFI CRT in Artificial Intelligence、School of Mathematical Sciences 及 Insight Centre for Data Analytics
报告时间: 未明确给出具体日期,但参考文献最新至2022年,推测为2022年以后
研究主题: 聚焦于爱尔兰电力市场中平衡市场(Balancing Market, BM)电价的短期预测,比较不同统计、机器学习(ML)与深度学习(DL)模型在该复杂市场的表现差异与适应性。
核心论点与目标:
本报告针对电力平衡市场价格(BM价格)提出了一套开放且可重复的预测框架,基于爱尔兰BM数据,测试统计模型(如LEAR)、机器学习模型(如XGB、RF、SVR)以及深度学习模型(SH DNN和MH RNN DNN)的预测能力。结果表明,传统成功应用于日内市场(日前市场,DAM)的深度学习模型不适合BM市场;相反,简单、高效的统计模型LEAR表现最佳。这揭示BM市场的价格波动机制与DAM根本不同,表明针对BM需开发专门的预测模型。[page::0,1,2]
---
逐节深度解读
1. 引言与研究背景
报告强调短期电力市场的价格预测因其高波动性、剧烈价格尖峰和季节性需求特征而极具挑战性。随着可再生能源与储能系统的普及,这种波动性进一步加剧。BM作为实时市场中最接近现货交易、且价格波动最剧烈的市场,承担匹配供需的关键角色。尽管其重要性提升,学界和业界对BM价格预测关注相对较少,部分原因是BM数据难以获取且地区间规则差异较大。此外,DL方法虽在DAM市场广泛应用,但在BM市场的探讨稀缺,且无公开数据集。[page::1,2]
2. 文献综述
2.1 日前市场(DAM)预测
大量研究聚焦于DAM,表明深度神经网络(DNN)及其变体如LSTM、GRU具有较优性能,尤其在复杂的非线性关系建模上胜过传统统计方法。LEAR模型(LASSO正则化的自回归模型)因其计算效率高且准确性优异,也成为DAM预测中的标杆。不同特征选择和跨市场效应也明显影响深度模型表现。[page::3,4]
2.2 平衡市场(BM)预测
BM预测文献较少,多为统计和传统机器学习方法,如概率模型、梯度提升(XGB)和随机森林(RF)。研究指出BM价格极端尖峰预测困难,且波动性严重影响模型效果。深度学习模型应用稀缺,且效果参差不齐,凸显BM市场在建模上的独特性和挑战。[page::5]
3. 电力市场结构及BM特性
报告以爱尔兰单一电力市场(I-SEM)为例,解释欧洲电力市场架构:包括远期市场、日前市场(DAM)、日内市场(IDM)及平衡市场(BM)。BM作为生产与消费几乎实时匹配的关键市场,通过系统操作员对参与者提交的偏离合约的偏差进行调度,价格在5分钟结算期间内基于成交量和价格对确定。BM价格受极短时间窗口影响,波动性极强,且排除非能源动作(Flagging and Tagging)与最小接受阈值(DMAT)保证价格的合理性。[page::6]
4. 分析框架
4.1 数据集构建
数据源自SEMO和SEMOpx,覆盖2019至2022年。目标是预测未来16个开放结算周期(每周期30分钟),即$t+2$到$t+17$时段的BM价格。输入变量分为历史数据(如过去BM价格和量、风电预测误差、互连流量、日前市场价格)和未来数据(物理通知量、互连计划、可再生能源预测、需求预测及未来DAM价格)。不同数据时间范围根据数据可用性调整,充分反映BM短期价格预测的实时性要求。[page::8,9]
4.2 实验设计
采用多模型训练数据窗口(30、60、90及365天),利用滚动前移验证(walk-forward validation)方法,每8小时重新训练并在最新数据上测试,保证模型适应市场动态。超参数调优每季度更新。ML模型通过Scikit-learn及XGBoost,DL模型用Tensorflow及Talos,统计模型用Lago et al.提出的epftoolbox。[page::9,10]
4.3 评价指标
采用MAE、RMSE和sMAPE(对临近零值具有稳健性的对称MAPE)。利用Diebold-Mariano(DM)检验比较模型间统计显著性,确保评价的稳健性和科学性。[page::10,11]
5. 模型详述
- Naive基线模型: 用过去8小时BM价格作为预测。
- LEAR(LASSO估计自回归): 结合LASSO正则化实现特征选择,保证简单高效。每日调整正则化参数。
- 随机森林(RF): 多回归树聚合,主要利用bagging减少方差。
- 支持向量回归(SVR): 利用径向基核在高维空间中进行非线性回归。
- 极端梯度提升(XGB): 基于boosting思想的提升树,顺序减小偏差。
- 单头DNN(SH-DNN): 传统多层感知机,层数可调,使用ReLU激活,多层dropout防止过拟合。
- 多头LSTM-DNN(MH-RNN): 结合历史时序LSTM分支与未来数据DNN分支,通过串联层输出16步预测。训练采用早停,最大300轮。[page::11,12,13,14]
6. 实验结果
6.1 预测准确性
表1总结不同模型与训练长度下的MAE、RMSE、sMAPE。
- LEAR表现最佳,其预测更平滑,少尝试预测极端尖峰,导致整体误差降低(MAE从30天到310天训练提升3.31€/MWh)。
- XGB紧随其后,表现优于随机森林和SVR。
- DL模型整体表现较差,特别是MH-RNN,对BM复杂动态的拟合不足,表现随训练数据增加有所提升但仍落后。
- 30天训练期间,SH-DNN略优于XGB和LEAR,但随着波动增加后劣势明显。[page::15,17]
图3(LEAR预测)显示其保持预测稳定,避免尖峰预测;图4(MH-RNN预测)则呈现过度自信的尖峰预测,导致指标处罚严重。提高训练数据量(至365天)对所有模型均有显著提升(平均MAE降低3,RMSE降低2.67,sMAPE降低5.33),但DL改进幅度较小。
统计显著性检验
DM检验(表2)显示LEAR、XGB和RF组具有显著优于其他模型的预测准确度,DL模型间差异不显著,但均明显好于基线模型。
6.2 分时段性能
图5揭示价格与误差昼夜变化规律:
- 价格及波动最大时段(15:00-18:00),预测误差亦最大。
- DL模型在低波动、低价的夜间表现相对更好。
- LEAR及ML模型误差更为均衡,在高波动时段表现更稳健。
此特性对某些应用(如电池充电时间选择)具有指导意义。[page::18]
6.3 DAM与BM对比
图6对比显示BM价格波动幅度远大于DAM,出现多次急剧负值和超高正值,DM预测难度显著不同。DL模型在更稳定的DAM市场表现优异(图7中SH-DNN预测DAM价格),体现DL方法对BM市场复杂动态拟合不足,需针对BM设计更适合的模型框架。[page::19,20,21,22]
6.4 计算效率
图8展示模型训练时间消耗:
- LEAR训练时间极短,XGB也优于DL模型。
- DL训练耗时最长且波动较大,尤其是MH-RNN,因其复杂结构和大量参数。
- 各模型单次预测时间极短,适合实时应用,但频繁重训练背景下高训练时间是DL模型劣势。[page::21,22]
7. 结论
作者提出的开放且可复现框架,使得BM电价预测模型的评估透明化。结果表明,面对高波动、尖峰频繁的BM市场,简单统计和树模型优于复杂的DL模型。DL模型在预测BM价格的剧烈波动及尖峰方面表现不足,存在严重的过拟合和误判风险。作者指出未来可考虑结合不同模型优势,按时段动态选择算法(算法组合),或探索概率预测、尖峰检测等方向,提升BM预测能力。数据集、代码均开放,促进未来研究发展。[page::23]
---
图表深度解读
图1:欧洲电力市场典型顺序示意图
该图分层次展示欧洲电力市场结构,涵盖远期能量与输电市场、日前及日内市场、调度市场(Redispatching)和平衡市场,以及容量与辅助服务市场(非能源市场)。点线框表示非必需或可选市场。时间线从数月到实时,表明BM为最终调整阶段。该图帮助理解BM在整体电力市场架构中的定位和功能。[page::7]

图2:多头RNN-DNN模型架构
图示模型分为左侧历史数据输入流经LSTM块,右侧未来数据输入流经DNN块,双方均有dropout及flatten层,输出合并后通过DNN块产生最终输出。该架构试图兼顾时间序列依赖和未来特征信息捕捉,体现深度学习在时序数据融合中的典型设计思路。[page::14]

图3:LEAR模型预测与BM价格对比
蓝色曲线为实际BM价格,绿线为LEAR预测。可见预测曲线波动较低,平滑且未过度拟合尖峰。表明LEAR模型采取了保守策略,舍弃极端预测,反映出其在高波动市场中表现稳定的优点。[page::15]

图4:MH RNN DNN对BM价格预测
蓝色为BM实际,红色为模型预测。模型输出明显尝试捕捉尖峰,波动剧烈,表现出过拟合近期尖峰的倾向,导致评价指标受到严重惩罚。这反映深度模型在BM市场中预测的主要瓶颈及局限性。[page::18]

图5:BM价格和预测误差分小时分析
(左图)蓝线显示每小时BM价格平均值,红线为标准差,显示日间15-18点波动剧烈。
(右图)各模型对每小时预测误差(MAE),XGB和LEAR在波动高峰期误差最低,DL模型误差上升明显。图表展示了价格波动对预测难度的直接影响,并体现不同模型的时段适应性差异。[page::20]

图6:DAM与BM价格对比
绿线为BM价格,红线为DAM价格。BM价格在时间序列上表现出剧烈尖峰及大幅负值,价格范围远超DAM。该对比清晰反映BM价格的极端波动性和预测难度,佐证了DL在DAM表现优秀而在BM表现不佳的原因。[page::21]

图7:SH DNN模型对DAM价格预测
红色为模型预测,蓝色为真实价格。模型紧密拟合价格走势,尖峰预测准确,显示DL模型在价格较为平稳的DAM市场中较强的非线性建模能力和动态捕捉能力。[page::22]

图8:模型训练时间比较
柱状图展示各模型用365天训练数据训练所需时间(分钟)。LEAR和XGB耗时极短,RF、SVR耗时适中,DL模型因网络复杂度高,特别是MH RNN,耗时最长且波动大。此图强调模型在实时应用中计算效率的权衡,反映复杂深度模型可能在实际部署中的劣势。[page::22]

---
估值分析
本报告为技术型市场预测研究,不涉及公司估值或财务预测,因此无估值分析章节。
---
风险因素评估
报告主要探讨模型预测风险,指出DL模型在面对BM极端波动和突发尖峰时,容易出现过拟合和较大预测误差,风险较高。报文虽未专设风险缓解策略,但建议通过增大训练数据、合理选择模型组合、及未来发展概率预测和模式识别方法以缓解该风险。此外,数据获取难度和市场规则差异构成实证上的风险。[page::17,23]
---
批判性视角与细微差别
- 数据与模型适配性:报告强调DL在DAM上的成功经验未必迁移至BM市场,提示需深入研究BM市场固有特征。
- 假设与限制:DL模型分支设计假设历史和未来数据可以分开学习关系,但BM数据中两者强耦合,导致模型结构不匹配,表现受限。
- 评价指标选择:sMAPE指标替代传统MAPE,有效应对价格近零带来的误差计算难题,体现严谨性。
- 实验设计:滚动验证、超参数调优等配置充分考虑时序依赖,方法科学。报告未详细说明个别模型(如MH-RNN)具体参数范围和训练细节,略有不足。
- 局限性:未涉及更多BM市场或5分钟更细粒度数据,适用性有待扩展。
- 公开资源:报告开放数据和代码,利于社区验证与后续研究。
---
结论性综合
本报告创新提出针对爱尔兰BM电价预测的开放、详尽框架,全面比较统计、机器学习及深度学习方法。深度学习虽为日内市场提供优异表现,但在BM高度不稳定及尖峰频发环境下表现不佳,存在过度拟合及预测误差高风险。相反,基于LASSO正则的统计模型LEAR及树模型如XGB和RF,以其简洁高效和稳定预测性能,占据性能领先地位。从时序角度看,价格峰值时段预测难度更大,深度模型夜间相对表现更好但难以整体覆盖尖峰。训练数据量显著影响所有模型性能,长时间窗口训练有助于精准度提升。
图表深刻展现:
- BM价格波动极端,尖峰与负价频现(图6);
- LEAR模型提供平滑稳定预测,避免尖峰(图3),优于DL尖峰过度预测(图4);
- DL模型在DAM表现优异,显示市场结构差异实质影响(图7);
- 计算时间上,LEAR和XGB具备实时适用性,DL模型则资源需求大(图8)。
作者建议未来研究可考虑多模型组合算法,针对不同时段动态使用不同模型,同时扩展数据集与市场范围,引入概率预测及尖峰分类方法,以应对BM市场固有挑战。整体看,此报告为电力市场平衡价格预测领域提供了重要参考与实践基础,尤其是凸显了“平衡市场”不同于“日前市场”的复杂预测需求和建模挑战。[page::0-23]
---
参考资料标注溯源
本分析中的所有信息和结论均基于报告原文,具体页码引用标记为$page::页码$,便于后续查阅与溯源。
---