BigAlpha - 端到端大模型
比赛时间: -
数据即决策,洞察即超额(Attention is All You Need for Alpha)
主办方:BigAlpha
比赛介绍
## **赛事介绍**
在量化投资的演变进程中,传统的“因子挖掘 + 组合优化”两步走范式正面临信息损耗与人工偏见带来的双重挑战。传统方法过度依赖人工经验构建特征,往往难以捕捉市场中瞬息万变的非线性、高阶交互关系。因此,**端到端(End-to-End)量化建模**应运而生。其核心理念在于通过深度神经网络,跳过繁琐的显式特征工程,直接从原始市场序列数据中学习投资逻辑,实现从“原始数据”到“投资决策”的一站式映射。
本次挑战赛由 BigQuant 主办,旨在探索 **Transformer、注意力机制(Attention Mechanism)** 等大模型算法在金融时序数据上的极限能力,征集能够直接生成投资决策的深度学习模型。我们不再关注中间过程的“因子”表现,而是通过真实的**回测引擎**,直接评估模型输出权重在实战中的**超额收益、风险回撤与换手率**。
在本届赛事中,我们重点聚焦于**端到端权重生成赛道**。参赛者将不再被要求挖掘孤立的因子,而是需要构建一个能够处理复杂时空关系的神经网络模型。该模型需每日针对股票池(如中证1000成分股)直接输出一组**目标持仓权重**。我们鼓励参赛者采用无特征或弱特征的研发模式,尽可能使用原始量价序列(如 OHLCV、分时快照)作为输入,利用模型内部的 Embedding 层和注意力机制自发捕捉市场微观结构的深层规律。评审导向将不仅关注最终回测的年化超额收益和夏普比率,更会深度考察算法架构在处理“序列-决策”映射时的原创性、AI 技术的应用深度以及对大规模金融序列建模的科学性。
通过本次竞赛,您将获得处理 TB 级高频金融数据的实战经验,直面量化领域在“算法驱动决策”路径上的真实挑战。我们期待看到参赛者们应用创新的端到端方法,解决这个充满挑战且激动人心的量化投资难题。
## **数据说明**
本次竞赛提供高质量的A股市场数据,具体如下:
* **股票池**: 中证1000指数在历史相应时间点上的成分股。
* **时间范围**: 2023-01-01至2024-12-31。
* **数据内容**: 1分钟级别K线及盘口快照数据,财务数据,其他A股相关数据。
* **匿名化处理**: 所有字段特征均进行脱敏处理。
## **模版代码**
参赛者需按规范构建端到端模型并提交训练/推理代码。主办方提供以下示例:
* **Transformer 基础模型**: 参考 `demo_transformer.ipynb`(展示如何将分钟级序列转化为 Token 进行训练)。
* **轻量化序列模型**: 参考 `demo_lightweight.ipynb`(适用于算力限制下的端到端建模)。
* **分布式数据加载**: 参考 `demo_data_loader.ipynb`(演示如何高效处理 TB 级高频数据)。
## **赛程安排**
### **阶段一:宣传报名**
* **时间周期**:2026-05-15 至 2026-06-24 属于宣传报名期,其中 5月25日-6月24日为正式报名期,报名截止时间为**2026-06-24**。
* **报名组队**:通过活动主页进行报名。可单人或多人组队(单一队伍最多不超过5人)。报名完成后可加入官方社群(微信/QQ群)寻找队友。
* **内测服务**:2026-06-08 至 2026-06-18 属于系统内测阶段,参赛者可以提交代码,用于测试系统稳定性及熟悉比赛系统,最终成绩不计入初赛,内测阶段结束后会重置排分榜单。
### **阶段二:初赛**
* **时间周期**:2026-06-25 至 2026-08-05
* **运行机制**:
* 以**2026-07-26 23:59:59**作为**截止日期**。
* 在截止日期前,利用平台提供的数据开发模型并按照规范提交代码,平台会使用验证集数据对模型的输出数据进行回测并打分实时更新排名,以队伍最好的一次得分展示在”公榜(Public Leaderboard)”上;同时,参赛队伍可以选择和替换总计不超过2个模型作为截止日后的候选模型。
* 在截止日期后,参赛者将不允许修改候选模型的构建代码;平台在2026年2月24日至2026年2月27日期间的每个交易日盘后,会根据参赛者提供的代码构建每日的权重数据,每日计算得分排名,并以队伍最好的一次得分展示在”私榜(Private Leaderboard)”上。
* **线上技术工作坊**:由合作平台方工程师主讲,分赛道介绍平台功能、API使用、数据结构及回测框架。
* **账号与数据发放**:向所有成功报名的队伍发放比赛专用账号,开放数据访问权限。
### **阶段三:决赛**
* **时间**:2026-08-10 至 2026-08-25
* **决赛名单公布**:组委会根据公榜成绩和私榜成绩进行评估,同时参考提交代码质量,最终公布10支入围决赛的队伍名单。
* **决赛辅导(按需)**:入围决赛的队伍如有深化研究报告的需求,可提交希望沟通的问题清单,组委会将于**8月12日**至**8月14日**安排线上会议进行答疑辅导(分传统/AI赛道专场)。如无特别需求,可直接准备提交材料。
* **提交材料**:参赛队伍需提供以下材料:
* 模型研究报告(.pdf,10–15页):一份结构完整、论证严谨的深度报告,不同赛道需针对性补充内容:
* 摘要(Abstract)
* 引言(Introduction):模型研究背景与文献综述
* 模型构建(Factor Construction):详细阐述模型搭建的细节
* 创新性与局限性讨论(Innovation and Limitations)
* 结论(Conclusion)
### **阶段四:答辩颁奖**
* **时间**:2026年8月25日
* **决赛答辩会**:采用"10分钟展示 + 5分钟评委问答"的形式,线下举行并同步线上直播。
* **颁奖典礼**:答辩结束后,公布最终名次,并举行颁奖典礼,邀请所有嘉宾、评委与选手共同参与。
## **评估系统**
本次比赛的排名将基于参赛者提交的权重在 BigQuant 模拟回测系统中的表现。
### **数据检测**
* **数据列检查**:提交的文件必须且仅包含三列:`date`(交易日)、`instrument`(股票代码)、`weight`(目标持仓权重)。
* **权重列检查**:权重需满足总和为 1,不允许做空。
* **交易日完整性检查**:每个交易日都必须有持仓,不允许空仓。
### **评分公式**
$$
Score = 0.4 \times \text{Rank}_{Alpha} + 0.3 \times \text{Rank}_{Sharpe} + 0.2 \times \text{Rank}_{Turnover\_Adjusted\_Return} - 0.1 \times \text{Rank}_{Complexity}
$$
**指标说明**:
* **Rank_{Alpha}**:策略相对于基准(中证1000指数)的年化超额收益率排名。
* **Rank_{Sharpe}**:超额收益的夏普比率排名(评估风险调整后收益)。
* **Rank_{Turnover}**:考虑换手率成本后的净收益排名(惩罚过高频、无意义的调仓)。
* **Rank_{Complexity}**:模型参数效率评分,鼓励用更优雅的架构解决问题。
### **决赛评估**
入围决赛的队伍将由评审委员会进行综合评估,评分标准如下:
待补充
## **提交内容与代码规范**
### **核心逻辑要求**
参赛者需在 `main` 函数中实现模型的推理逻辑,返回格式如下:
| date | instrument | weight |
| --- | --- | --- |
| 2024-01-02 | 000001.SZ | 0.0025 |
| 2024-01-02 | 600000.SH | 0.0018 |
| ... | ... | ... |
## **赛事奖励**
**总奖金池:500,000 元**
(奖励细节待定)
## **代码要求**
本次竞赛为代码竞赛,所有提交必须通过合作的线上量化平台完成。为保证竞赛公平性,您的代码需满足以下条件:
* **平台提交**: 所有因子生成代码必须在指定的线上平台Notebook环境中运行并提交(AI赛道需使用平台指定的AI工具链/算力环境)。
* **运行时长限制**: Notebook <= 3 小时。
* **禁止访问外部网络**: 为防止信息泄露和使用未来数据,Notebook的互联网访问权限将被禁用。
* **最终提交**: 您提交的必须是可以自动运行的文件。
* **禁止显式特征输入**:禁止直接将外部计算好的因子或数据作为输入层。模型应以原始量价(OHLCV)或分时数据为起点。
* **禁止硬编码规则**:持仓决策必须由模型权重演化而来,禁止在代码中使用大量的硬编码业务逻辑(如 `if 涨幅 > 5% then 权重=0`)。
* **回测一致性**:主办方将对模型进行复核,确保提交的权重是由参赛代码在无未来信息的情况下真实生成的。
## **竞赛规则**
* **团队规模**: 每支队伍人数为1-3人,每位选手只能加入一支队伍(可选择单赛道或双赛道参赛,双赛道需分别提交代码)。
* **知识产权**: 参赛作品(代码、报告等)的知识产权归参赛队伍所有。主办方对所有作品拥有非商业性的评审、展示和宣传权利。对于获奖的优秀模型,主办方在同等条件下拥有优先的商业合作洽谈权。
* **诚信竞赛**: 严禁任何形式的抄袭、作弊或共享代码行为。一经发现,将立即取消该队伍的参赛资格。
* **最终解释权**: 本赛事所有规则的最终解释权归BigQuant大赛组委会所有。
## **竞赛支持**
* **官方交流社群**:建立赛事官方微信/QQ群,分传统赛道、AI赛道专属社群,用于日常通知发布、技术问题解答和选手间交流。
* **FAQ文档**:在官网建立持续更新的“常见问题解答”页面,分赛道整理专属问题。
* **技术支持**:AI赛道提供专属AI工具链使用教程、算力调试指导;传统赛道提供统计检验、模型有效性验证的技术指导。
奖金&奖项
¥500000

