风险中性的深度学习选股策略
创建于 更新于
摘要
本报告针对深度学习选股策略中的风格轮动和行业轮动问题,提出对股票样本进行风险中性化处理,通过截面回归剥离行业和市值风险因子影响,实现对股票收益的风险中性标注。基于风险中性样本训练的七层深度神经网络模型,预测未来10个交易日股票涨跌概率。实证显示风险中性深度学习模型能有效降低对市值因子的依赖,提升策略稳定性和收益表现。2011年以来以中证500股票池回测,年化超额收益达21.95%,最大回撤-5.03%,胜率74.6%,信息比2.92,显著优于普通深度学习策略 [page::0][page::3][page::8][page::10][page::14][page::15][page::17][page::19][page::20]
速读内容
- 深度学习模型结构及训练方法 [page::5][page::6][page::8]:
- 采用7层深层神经网络,输入层156个节点(包括传统选股因子、价量技术指标及28个行业哑变量),输出层3节点表示股票未来涨、平、跌3类。
- 使用ReLU作为隐含层激活函数解决梯度消失问题,输出层采用softmax激活函数得到股票上涨概率 $p(\text{上涨}|x)$。
- 优化目标采用交叉熵损失函数,训练时结合Dropout和BatchNormalization提升泛化能力和训练效率。




- 股票样本标注及风险中性化方法 [page::8][page::9][page::10][page::11]:
- 股票未来10交易日涨跌幅分布中提取上涨(前10%)、平盘(45%-55%)、下跌(后10%)样本,确保样本均衡。
- 传统标注方法受行业和市值风格轮动影响,训练模型易出现方向性偏差。
- 引入风险中性化标注,采用截面回归剥离行业和市值因子收益,使用残差收益进行样本打标签,缓解风格轮动影响。



- 股票特征及数据预处理 [page::12][page::13]:
- 选用156个特征,包括估值、规模、反转等传统因子,MACD、KDJ等技术指标,以及行业虚拟变量。
- 处理流程包括异常值和缺失值填充、极值截断(均值±3倍标准差)、时间序列标准化、截面标准化(z-score、min-max、排序标准化)及模型适配。

- 风险中性模型效果及IC分析 [page::14][page::15][page::16]:
- 深度学习选股因子IC均值0.082,表现稳定优于随机,风险中性模型与流通市值因子IC的相关性显著降低,说明成功降低了市值偏差。



- 策略回测表现对比 [page::16][page::17][page::19]:
- 普通深度学习模型年化超额收益19.71%,最大回撤-5.35%,胜率69.5%,信息比2.47。

- 风险中性深度学习模型年化超额收益21.95%,最大回撤-5.03%,胜率74.6%,信息比2.92,表现更优。

- 策略换手率较高,年化约17.7次,受技术因子较多影响。
- 策略同质性及差异分析 [page::19][page::20]:
- 两策略IC相关性高达0.84,表现具有较强同质性。

- 50只股票组合中重合度41.9%,100只股票组合中重合度53.3%,风险中性策略从不同角度筛选股票,增强组合多样性。

深度阅读
金融研究报告分析 — 《风险中性的深度学习选股策略》
---
1. 元数据与概览
- 报告标题:风险中性的深度学习选股策略
- 发布机构:广发证券发展研究中心
- 报告系列:深度学习研究报告之五
- 分析师:文巧钧、安宁宁
- 报告日期:约2018年,包含2018年4月份数据
- 研究对象:深度学习多因子选股模型,特别强调风险中性化处理以提升模型稳定性与预测性能,聚焦中证500股票池的多因子深度学习选股策略。
- 核心论点:
报告指出传统数据驱动的机器学习模型在股票市场的应用存在样本内外表现不一致的问题,主要由于市场风格切换和行业轮动导致历史训练数据的“知识”难以直接外推。为解决该问题,报告提出通过“风险中性化”方法对股票样本标注,即剥离行业和市值等风险因子影响,从而训练出风险中性深度学习模型,抑制风格轮动影响。
实证表明,风险中性化处理的深度学习选股策略能有效减少市值因子的影响,提升模型选股的稳定性和表现力。自2011年以来,在中证500成份股上的年化超额收益率达到21.95%,最大回撤为-5.03%,胜率74.6%,信息比为2.92。该策略虽收益优秀,但存在市场结构变化和参与者行为改变导致策略失效的风险。
---
2. 逐节深度解读
2.1 背景介绍
- 策略回顾(2014年至今)
广发证券金融工程团队围绕深度学习技术在投资上的应用已有系统工作,涵盖股指期货日内交易、Alpha因子挖掘、多因子选股等方向。其中,深度学习选股策略演进分为策略1(原始价量特征自动学习)与策略2(传统因子辅助价量指标,表现更佳)。报告回顾表示,深度学习选股策略2能在样本外环境下显著超越市场基准,图1显示其累积收益亮眼[page::3]。
- 存在问题
数据驱动型机器学习模型的成功依赖于历史数据“知识”在未来的有效传播。股票市场因参与者众多,包含大量噪声,且存在明显的风格及行业轮动,这使得训练数据场景与未来预测场景差异大,导致模型泛化不足,样本外表现不佳。
例如,模型训练在小市值偏好的市场环境,势必学会对小市值赋予较高权重,风格切换后模型失效概率高。为此,提出了“风险中性”股票样本标注方法,意味着从机器学习模型层面剥离风险因子,使模型关注在行业内市值区间真实的超额能力而非表面风格因子影响。
2.2 深度学习预测模型结构
- 模型结构及参数
采用7层深度神经网络,输入层(X)156个节点,含传统选股因子(估值、规模、反转、流动性、波动性等)、技术指标(MACD、KDJ等)、28个申万一级行业哑变量。五个隐含层H1至H5,节点分别为512、200、200、200、128,输出层Y3个节点对应未来10日股票的三分类预测:上涨、平盘、下跌。模型采用网格搜索优化结构[page::5]。
- 激活函数
隐含层采用ReLU(Rectified Linear Unit)激活函数,解决了Sigmoid/正切函数梯度消失问题,训练更深层网络更有效;输出层采用Softmax函数对三分类概率归一化[page::6-7]。
- 训练方法
用交叉熵作为损失函数,结合误差反向传播、Dropout(随机掩盖隐层节点以防止过拟合)、BatchNormalization(提升训练效率和效果)优化深度网络参数[page::8]。
2.3 股票样本的风险中性标注
- 传统标注法
以单期未来10个交易日涨跌幅为依据,将涨幅前10%股票标为“上涨”,中间45%-55%为“平盘”,后10%为“下跌”,三类样本数量相等利于训练。但此方法容易受流行风格和行业轮动影响,导致训练偏差,如“小盘股假涨”误判[page::8-9]。
- 风险中性处理
- 单风险因子中性化:分别在行业和市值区间内对股票进行收益排序,剥离行业/市值风格影响,从行业/市值分组内部寻找超额收益,生成“行业中性”和“市值中性”样本标签[page::9-10]。
- 多风险因子回归剥离:更进一步采用截面回归方法,以行业、市值等K个因子进行横截面回归,因变量为未来收益率,获得残差部分作为剥离风险因子后的真实超额收益$\epsilon_i$,以此重新打标签[page::10-11]。
该方法有效降低风格轮动和行业轮动对模型训练的影响,增强泛化能力。
2.4 策略流程与特征预处理
- 策略流程
历史数据预处理→样本筛选标注→模型训练→样本外数据预处理→模型预测打分→分档选股→构建组合。模型半年度更新,训练数据窗口4年,测试期自2011年1月起[page::11-13]。
- 因子特征
共156个因子,涵盖估值、规模、反转、流动性、波动性因子、技术指标(MACD、KDJ)、行业哑变量等。确保因子多样性且含有风格与行业信息[page::12]。
- 因子数据处理
- 异常值和缺失值处理(用前期数据填充)
- 极值界限处理(上下界限一般设定为均值±3倍标准差)
- 时间序列标准化(确保不同时期因子数据可比)
- 截面标准化(Z-score、Min-Max、Rank标准化,确保不同因子尺度统一)
- 根据特定机器学习模型特性调整输入数据格式和分布
- 样本标签基于剥离风险因子的残差排序生成
- 输出层采用Softmax函数计算股票上涨概率作为选股分数[page::12-14]
---
3. 图表深度解读
图1 & 图11、图12:选股策略收益及IC表现
- 图1(报告序章,风险中性深度学习策略表现)与图11展示深度学习模型IC(信息系数,衡量模型排名与真实收益之间的相关度),平均IC为0.082,标准差0.108,表明模型预测具备正相关性,大多数时间IC大于0,模型选股有效[page::0, 14]。
- 图12则将普通深度学习模型与风险中性模型的IC与流通市值因子IC相关性对比,普通模型IC与市值因子IC呈较强负相关,表明传统模型很大程度上依赖市值因素。风险中性模型后相关性明显减少,说明风险中性方法有效降低了模型对市值因子的依赖[page::15]。
图13:深度学习选股因子与流通市值的截面相关性
- 左图显示普通模型打分与市值呈平均-0.2的负相关,即小市值股票得分整体较高,模型有显著小市值偏好;右图风险中性模型相关度减至-0.12,多数时间甚至为正,表明风险中性模型减轻了小市值倾向,有时甚至偏大市值[page::16]。
图14 & 图15:普通与风险中性深度学习模型累积收益率对比
- 普通模型2011年至2018年累计表现优异,年化超额收益19.71%,最大回撤-5.35%,信息比2.47。
- 风险中性模型收益率略优,年化超额收益达21.95%,最大回撤-5.03%,信息比2.92,胜率74.6%。两图显示风险中性策略在选股有效性和稳定性方面表现更优[page::17]。
表2:策略分年度表现与换手率
- 策略各年均实现正超额收益,2015年表现尤为突出(52.02%年化超额收益)。
- 即使在市值、反转等因子表现低迷的2017年,仍有6.93%超额收益。
- 换手率较高,年化约17.7倍,反映策略交易活跃性及市场适应性[page::18]。
图16-18:普通与风险中性模型的对比及同质性分析
- 图16显示风险中性模型长期收益优于普通模型,且整体走势趋势一致。
- 图17证实两模型IC相关度高($R^2=0.8392$),表明两方法整体选股方向相近。
- 图18展示两模型选股重合度,大约42%-53%(股票规模50只与100只),说明两者虽同质性高,但仍有显著不同股票被选中,风险中性模型强调剥离风险因子的股票收益,提供了不同选股视角[page::19-20]。
---
4. 估值分析
报告未涉及传统的公司估值方法(如DCF、市盈率),侧重于策略收益以及模型预测能力评估。使用信息系数(IC)、累积收益率、最大回撤、胜率和信息比多维度评价策略性能,充分体现模型做多/对冲能力及风险调整收益。
---
5. 风险因素评估
- 策略模型失效风险:
报告明确提示,策略并非完全有效,主要风险在于市场结构变化、交易行为转变及同类策略参与者增多可能导致模型预测与市场环境脱节,策略表现下降[page::0, 21]。
- 市场风格轮动风险:
模型设计即为解决风格和行业轮动风险,若风险中性处理不充分仍可能存在因风格快速变换导致模型失效。
- 换手率风险:
策略换手率较高,带来交易成本和潜在市场冲击风险,可能影响实际净收益。
---
6. 批判性视角与细微差别
- 风险中性处理局限性:
尽管风险中性措施减弱市值因子对模型的影响,但结果显示风险中性模型依然与市值因子存在一定相关性,说明该处理无法完全剥离市场固有风格因素的影响,反映出深度学习模型对长期强势因子的敏感性扎根于历史数据特点。
- 样本选取限制:剔除ST股、停牌及上市不足一年股票,可能导致模型在冷启动或极端市场情况的泛化能力下降。
- 换手率高:尽管策略收益突出,但高换手率带来的交易成本未详细量化,实际净收益水平可能受此制约。
- 模型可解释性不足:报告没有提供深度学习模型内在特征权重解释,缺乏对哪些因子被模型重点利用的透明解读。
- 同质性分析提示:普通和风险中性模型在整体表现相关,但选股差异较大,表明不同标签设计背后模型关注的因子异同,建议后续融合多角度模型构建综合策略。
---
7. 结论性综合
本报告系统阐述了基于深度学习的多因子选股策略中,“风险中性”样本标注的理论和实证意义。风险中性处理通过剥离行业与市值风格因子影响,使得深度学习模型在训练中关注同一行业内部、同一市值区间内股票的超额表现,缓解了市场风格轮动导致的模型过拟合和预测失效问题。
从模型结构入手,报告详细介绍了7层深度神经网络的节点配置、激活函数选择(ReLU隐含层+Softmax输出层)和训练技巧(Dropout、BatchNormalization),确保了深度学习模型学习的有效性和泛化能力。样本标签设计兼顾了分类平衡性与风险中性原则。
大量实证分析包括选股因子和市值因子的IC动态对比,深度学习模型对冲收益曲线及年度绩效数据,充分证明风险中性深度学习模型较传统模型更少受市值风格影响,表现更稳定且收益优异。策略自2011年起,基于中证500指数股票池,每半年更新一次模型,年化超额收益高达21.95%,最大回撤控制在-5%左右,信息比近3,胜率超过74%,表现出良好的风险调整收益。
图表分析表明,深度学习选股模型IC平均值为正且波动稳定,采用风险中性策略后与市值因子相关性明显下降。两种策略相关度高但选股重合度不完全,说明风险中性标签赋予模型全新选股视角,丰富选股多样性。同时,策略换手率偏高,带来交易成本风险,需要权衡优化。
整体来看,报告理念清晰,实证结论有力,为使用深度学习模型应对市场风格变化、行业轮动提供了有效的解决路径。风险中性处理作为机器学习层面的因子剥离方法,值得在更多量化投资策略中推广和发展。但依然需要注意换手率高及市场快速变动带来的模型失效风险,以及加强模型解释性研究。
---
附:关键图表示意及核心数据点
| 图表编号 | 内容描述 | 关键数据/趋势解读 | 关联文本要点 |
| -------- | -------- | -------- | -------- |
| 图1 | 深度学习选股策略2年化收益曲线 | 收益稳健增长,2011-2018年表现优异,呈现截面外有效性初始验证 | 策略回顾,深度学习选股模型实证表现[page::3] |
| 图2 | 深度学习层级结构示意 | 层级清晰:输入→低层→中层→高层→输出 | 深度学习基本原理介绍,特征分层抽象[page::5] |
| 表1 | 网络结构节点数 | 输入156,隐含层各异最多512,输出3 | 神经网络设计细节[page::5] |
| 图3 | 两隐含层网络示意 | 多层全连接结构 | 深度学习模型传播机制[page::6] |
| 图4/图5 | Sigmoid与ReLU激活函数 | ReLU解决梯度消失,提升训练效率 | 激活函数性能解读[page::6-7] |
| 图6 | 股票样本分类标注示意 | 上涨、平盘、下跌按涨跌百分位排序,平衡样本 | 样本标签设计[page::9] |
| 图7/8 | 行业、市值中性样本标注示意 | 组内排序,剥离行业与市值影响 | 风险中性处理思想及流程[page::10] |
| 图9 | 策略流程图 | 数据预处理→模型训练→模型预测→分档选股 | 策略框架说明[page::11] |
| 图10 | 股票特征组成 | 估值、技指标、行业哑变量丰富特征集 | 特征工程说明[page::12] |
| 图11 | 深度学习模型IC走势 | IC平均0.082,表现持续有效 | 模型预测有效性[page::14] |
| 图12 | DL模型IC与市值因子IC相关度 | 普通负相关显著,风险中性弱相关 | 风险中性减少市值依赖[page::15] |
| 图13 | 候选模型打分和流通市值相关性 | 普通模型偏小市值,风险中性模型波动更均衡 | 选股风格调整[page::16] |
| 图14/15 | 选股策略累积收益曲线 | 风险中性模型超额收益更高最大回撤更小 | 策略表现对比[page::17] |
| 表2 | 策略分年绩效及换手率 | 年超额收益持续正值,换手率年均达17.7 | 策略稳健性及交易活跃度[page::18] |
| 图16-18 | 风险中性与普通模型表现同质性分析 | 风险中性表现更佳,IC高度相关但股票选择重合度约40-50% | 模型目标差异导致选股差异[page::19-20] |
---
综上所述,本报告提出的“风险中性的深度学习选股策略”通过风险因子剥离创新标注手段,重构机器学习训练目标,有效提升了深度学习多因子模型的市场适应能力和持续盈利能力,为量化选股领域提供了方法论创新,且实证结果充分验证其有效性。
[page::0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21]