基于地理关联度因子研究
创建于 更新于
摘要
本报告基于地理关联度理论,构建了6种地理相关系数类因子,重点包括地理相关系数因子及其拆解优化因子。通过月度调仓的全市场实证分析,发现𝐺𝐸𝑂𝐺𝐶𝑂𝑅𝑅𝑃因子表现最优,IC均值达0.069,正IC占比90%,多头相对中证500指数年化超额收益率13.98%,信息比率1.706。因子能够挖掘出传统BARRA因子之外的增量信息,但多头策略换手率较高,手续费敏感。报告进一步验证了因子在不同选股范围和手续费水平下的表现差异,提供了因子构造、特征分析及策略框架的系统研究,为多因子模型建设提供增量Alpha来源 [page::0][page::8][page::15][page::16][page::25][page::28]
速读内容
- 地理关联度因子背景与理论基础 [page::0][page::5]
- 传统多因子模型因子收益下降,因子开发迫在眉睫。
- Parsons和Sabbatucci(2018)提出地理关联股票存在领先滞后效应,价格变动对目标股票收益具预测能力。
- 地理关联度因子通过衡量个股与相同地理区域、不同申万一级行业股票间的收益相关性,从共同基本面因素中提取选股信号。
- 数据描述与市场现象分析 [page::6][page::7]
- TOP5省份上市公司数量及占比逐年上升,2022年占比超62%。
- 不同省份月均收益显著差异,股价表现存在明显地域差异。



- 地理关联度因子的构建方法 [page::9][page::10]
- 6种因子:地理相关系数(𝐺𝐸𝑂𝐺𝐶𝑂𝑅𝑅),地理相关系数变动因子(𝐺𝐸𝑂𝐺𝐶𝑂𝑅𝑅𝐶𝐻𝐺),及4种拆解因子(𝐺𝐸𝑂𝐺𝐶𝑂𝑅𝑅𝑃、𝐺𝐸𝑂𝐺𝐶𝑂𝑅𝑅𝑁、𝐺𝐸𝑂𝐺𝐶𝑂𝑅𝑅𝐼𝑃、𝐺𝐸𝑂𝐺𝐶𝑂𝑅𝑅𝐽𝑃),度量股价同地域但不同行业股票的相关系数。
- 以皮尔森相关系数计算股票月内日收益的相关性,权重均等。
- 拆解因子依据日度收益是否为正负进行区分,赋予不同信息意义。
- 因子特征分析 [page::11][page::12]
- 省份维度:因子值存在显著差异,小处如西藏因子值高,江苏上市公司多且因子值高。
- 行业维度:银行业因子值显著较低,反映银行股价与制造业差异。
- 市值维度:小市值股票因子值较高,相关性更强。



- 因子策略框架及逻辑 [page::12][page::14]
- 高地理相关性股票通常当期收益较低,但未来存在反转机会。
- 策略为买入地理相关系数因子值高的股票,卖出值低的股票,月度调仓。
- 调仓规则与收益反转机制相符。


- 因子分档及整体表现 [page::14][page::15][page::16]
- 6个因子中,𝐺𝐸𝑂𝐺𝐶𝑂𝑅𝑅𝑃、𝐺𝐸𝑂𝐺𝐶𝑂𝑅𝑅𝐼𝑃分层明显,收益区分度高。



- 𝐺𝐸𝑂𝐺𝐶𝑂𝑅𝑅因子IC均值0.074,正IC占比88%,多空策略年化收益22.11%,信息比率2.84,换手率约78%。
- 𝐺𝐸𝑂𝐺𝐶𝑂𝑅𝑅𝑃因子IC均值0.069,正IC占比90%,多头策略相对基准年化收益率13.98%,信息比率1.706。
- 𝐺𝐸𝑂𝐺𝐶𝑂𝑅𝑅𝐼𝑃因子IC均值0.063,正IC占比约89%,信息比率1.659,换手率约85%。




- 地理相关系数因子与传统BARRA因子相关性分析 [page::24][page::25]
- 地理相关系数类因子与HBETA、BTOP(市净率)呈正相关(约10%-15%),与流动性(STOM)、动量(HALPHA)、残差波动(HSIGMA)呈负相关(12%-22%)。
- 表明地理相关系子因子挖掘了传统因子体系之外的增量信息。
- 选股范围与手续费敏感性分析 [page::25][page::26][page::27]
- 在不同选股范围中,因子在中证1000及创业板表现优于沪深300,中证1000区间年化收益和信息比率均高于全市场。
- 换手率维持较高,约80%以上,显示换仓频率高,手续费敏感。
- 手续费增加导致策略净值表现下降,但3个核心因子策略在千五手续费费率下依然能持续跑赢基准。



- 风险提示 [page::0][page::28]
- 模型和策略基于历史统计和建模,可能受市场结构及政策环境变化影响而失效。
- 高换手率使得策略对交易成本较为敏感,需合理控制手续费水平。
深度阅读
报告详尽分析:基于地理关联度因子研究——多因子Alpha系列报告之(四十三)
---
1. 元数据与概览
报告标题:《基于地理关联度因子研究——多因子 Alpha 系列报告之(四十三)》
作者与机构:广发证券发展研究中心,主要分析师包括陈原文、罗军国、安宁宁等
发布日期:报告中涉及数据截至2022年6月30日
研究主题:重点探讨基于个股地理关联度构造的选股因子在A股中的应用及实证效果。
核心论点:
- 传统多因子模型中因子有效性逐渐减弱,因子拥挤风险加大,因子开发迭代和翻新变得尤为重要。
- 受领先滞后效应启发,基于个股地理关联信息构造新的因子,以期挖掘股票间隐含的增量Alpha来源。
- 构造了六种地理相关系数类因子,并通过月度调仓验证其有效性,最终确定三种表现优异的因子。
- 该类因子在IC表现、多空对冲策略和多头相对于基准(中证500)收益等多维度均表现出正面且稳定的选股能力。
- 与广泛使用的BARRA因子相关性低,表明其对传统因子的增量贡献,适合纳入多因子模型。
- 该策略换手率较高,对手续费较为敏感,需合理规划交易成本。
- 报告提示策略存在因市场环境与政策变动引致的失效风险。
总结而言,本报告提出并验证了地理关联度作为一个创新多因子选股工具的有效性,提供了丰富的数据和实证支持,具有较强的实际指导意义。[page::0,6,28]
---
2. 逐节深度解读
2.1 因子挖掘思考
关键点:
- 高频因子挖掘存在噪声高、复杂性大,但样本丰富、更新快且多样化,具有一定优势。
- 低频因子增量空间有限,尤其是财务指标等传统指标基本被挖掘殆尽,改从另类数据、图网络等视角寻求突破。
- 地理关联度因子属于低频因子创新尝试之一,旨在捕获个股间基于地理聚集的经济内生联系。
推理与假设:
- 高频数据带来丰富信息量,但需复杂的机器学习等方法提炼有用信号。
- 随着因子拥挤,原有热门风格因子的回报递减,开发独特因子以挖掘增量Alpha变得必要。[page::4,5]
---
2.2 关联度因子研究进展
理论研究回顾:
- “领先滞后效应”说明市场中不同个股对同类信息的反应不同步,存在可预测性。
- 关联方式多样:行业关联、科技关联、供应链关联、地理关联等,前者已在国内外均有较多探讨。
- Parsons和Sabbatucci(2018)首次提出地理关联股票间的收益领先滞后效应,并通过面板数据回归验证其经济学含义和预测力。
- 地理关联度信息由于分类基于省份而非行业,较不易被同一证券分析师覆盖率影响,信息有效性相对稳健。
A股市场匹配特征:
- 31省区间上市公司数目、增速和收益显著存在区域差异,经济地理集聚效应明显,具备因子构建基础。
- TOP5省份(广东、浙江、江苏、北京、上海)上市公司数和占比逐年提升,反映集中度提高。
初步实证发现:
- 直接采用Parsons和Sabbatucci的地理关联度构造法,反而表现与文献中市场相反:因子值越小说明个股未来收益越高,期望方向负相关且表现一般(年化超额收益7.52%,信息比率0.832)。
- 这提示简单基于省份和月均收益均值的因子未能充分捕捉价格时序上的相关性,需进一步优化因子构造方法。[page::5,6,7,8]
---
2.3 地理关联度因子构造及策略框架
因子定义及构建逻辑:
- 地理相关系数因子(𝐺𝐸𝑂𝐺𝐶𝑂𝑅𝑅):度量研究股票与同省不同申万一级行业股票的日频收益皮尔森相关系数的加权平均值。剔除ST股、停牌股、上市不足一年的股票。默认等权。
- 相关系数变动因子(𝐺𝐸𝑂𝐺𝐶𝑂𝑅𝑅𝐶𝐻𝐺):衡量过去一个月与最近三个月相关系数的差值,捕获相关性变动平台的动态特征。
- 相关系数拆解因子:参考Bollerslev等(2022)半贝塔概念,将收益序列基于正负拆分为4类因子(𝐺𝐸𝑂𝐺𝐶𝑂𝑅𝑅𝑃、𝐺𝐸𝑂𝐺𝐶𝑂𝑅𝑅𝑁、𝐺𝐸𝑂𝐺𝐶𝑂𝑅𝑅𝐼𝑃、𝐺𝐸𝑂𝐺𝐶𝑂𝑅𝑅𝐽𝑃),以捕捉不同波动方向的结构。
因子特征及中性化需要:
- 因子在省份、行业、市值层面表现差异显著。
- 例如,银行业因子均值仅为其他行业一半;小市值股票因子的地理相关更强。
- 因此拟进行行业、市值中性化处理避免因子被行业或规模伪装。
策略逻辑:
- 个股与地理关联公司股价变动相关度越高,后续出现反转的可能越大。因策略以持有因子值较高股票为多头,同时卖出因子值较低股票为空头。
- 改进后的因子通过反转效应挖掘未来收益。
- 实证显示,地理相关系数因子值与个股未来一个月收益存在正相关,尤其在地理关联股票收益为负时相关性更强。
该策略以月末收盘价调仓,剔除特殊股票,进行MAD去极值、Z-Score标准化,随后构建多空组合。[page::9,10,11,12,13,14]
---
2.4 实证分析及因子表现
样本与条件:
- 2010年1月至2022年6月,全A股市场,月度调仓,交易成本千分之三(卖出时扣费)。
- 因子分为十档,从小到大排序。
因子分档表现:
- 6种因子均显示分档收益呈明显梯度,部分因子(如𝐺𝐸𝑂𝐺𝐶𝑂𝑅𝑅𝑃、𝐺𝐸𝑂𝐺𝐶𝑂𝑅𝑅𝐼𝑃)分层区分度尤为显著。
绩效整体表现(见表5):
- 相关系数-变动类因子IC均值0.044-0.074,正IC占比88%-90%。
- 多空年化收益率约13%-22%,最大回撤较小,信息比率达到1.5以上,表现稳健。
- 多头相对基准策略超额年化收益均在10%以上,信息比率良好。
- 换手率均较高,约80%-85%。
三大主推因子详细表现:
- 𝐺𝐸𝑂𝐺𝐶𝑂𝑅𝑅(基础相关系数因子)IC均值 0.074,正IC占比88%,多头相对中证500年化超额收益13.21%,信息比1.55,换手率77.7%。
- 𝐺𝐸𝑂𝐺𝐶𝑂𝑅𝑅𝑃(拆解正相关系数因子)IC均值0.069,正IC占比90%,多头超额收益率13.98%,信息比率1.706,换手率82%。
- 𝐺𝐸𝑂𝐺𝐶𝑂𝑅𝑅𝐼𝑃(拆解异向相关因子)IC均值0.063,正IC占比88.7%,超额收益率13.48%,信息比率1.659,换手率84.6%。
图18-25展示了各因子多空对冲策略及多头相对中证500策略净值曲线,均表现出稳健正收益及较好抗跌能力。
换手率分析:历史换手率常年维持较高水平,存在手续费敏感性风险。[page::15,16,17,18,19,20,21,22,23]
---
2.5 地理关联度因子与BARRA因子相关性分析
BARRA因子简介:涵盖市场β、价值、成长、盈利能力、波动率、流动性、规模等核心维度。
相关性分析结果:
- 地理相关系数因子与BARRA因子相关性普遍较低。
- 与HBETA(市场β)、BTOP(账面市值比)呈小幅正相关(约10%-15%)。
- 与流动性因子STOM、动量因子HALPHA、残差波动HSIGMA负相关(15%-22%)。
- 这表明地理关联度因子捕捉了传统因子之外的新增信息,拥有一定独立性,适合作为多因子模型的补充。
该部分突显该因子在多因子框架内的重要性及创新价值。[page::24,25]
---
2.6 敏感性分析
选股范围敏感性:
- 在沪深300、中证500、中证1000、中证800及创业板不同股票池中测试,发现地理相关系数因子和相关拆解因子在中证1000和创业板股票池中表现更佳,年化收益和信息比率均优于全市场表现。
- 选股范围调整,有助于提升收益表现和交易效率。
手续费敏感性:
- 由于换手率较高,模型策略对手续费率敏感。
- 调整交易费用从千分之一到千分之五,策略表现逐级下降,但即使在千分之五手续费条件下,策略仍能实现正超额收益。
- 这提示实际操作中需权衡收益与交易成本,谨慎设计交易执行方案。
综合提示该因子策略受市场结构和交易成本影响较大,需要具体投资应用时的谨慎考量。[page::26,27]
---
2.7 风险提示
- 模型基于过去历史数据统计、建模构建,可能因未来市场政策调整、环境变化导致失效。
- 市场结构和交易行为改变或使策略失灵。
- 换手率高导致策略强烈依赖于低手续费环境。
该警示提醒策略使用者需注意外部环境变化带来的潜在不确定性。[page::28]
---
3. 图表深度解读
图1-3:区域上市公司数量与收益差异(页7)
- 图1显示五大省份上市公司数量及其占比从2010年起逐年增加,2022年达到62.06%。
- 图2展现这些省份年度公司数增长率波动较大,反映经济活动和上市节奏的区域差异。
- 图3月均收益呈现显著地理差异,广东等地表现一般优于全国平均水平,反映地理位置在公司表现中的重要性。
意义:验证了地理聚集效应,对设计基于地理信息的因子提供数据支持。
---
图4与表2:地理关联度因子初步效应(页8)
- 图4展示基础地理关联度因子IC值维持较低,累积IC缓慢下降,说明原始因子收益有限。
- 表2显示原始因子在多空策略及相对中证500策略上的表现有限(年化收益7.52%,信息比率0.832),尤其2017年表现波动大。
解读:显示基于单纯地理均值的因子可能掩盖价格变动的时序信息,需改进。
---
图5-7:因子特征差异(页11-12)
- 图5:省份分布显示西藏、青海等数量少省份因子值较高,江苏数量最多但均值亦不低。
- 图6:申万一级行业差异显著,银行业因子值较低不到其他行业50%,反映不同行业的地理相关性差异。
- 图7:市值分组显示小市值股票因子值显著高于大市值,显示地理信息与规模有关。
提示:需在实证中做行业和市值中性化处理以避免偏误。
---
图8与表3:单只股票的因子走势和收益相关(页12-13)
- 图8展示某股票地理相关系数因子随时间波动,与同期股价动向及关联股票收益的波动趋势类似。
- 表3中显示整体样本相关系数为0.034,尤其当关联股票收益为负时,该因子与未来收益相关达到0.108。
分析:因子具有预测反转的能力,尤其在股票关联收益表现不佳时更强。
---
图9与表4:全市场均值与中证全指关系(页13)
- 图9曲线显示因子均值与市场指数同期收益呈负相关(-0.379),与未来收益有弱正相关(0.017)。
- 负收益期因子均值升高,表明反转因子效力更明显。
结论:被视为一种反转类型因子。
---
图11-16:六因子分档收益(页14-15)
- 六个因子均呈现因子值越大,收益越高的分档趋势,拆解因子表现更优。
- 表现出的区分度和梯度平稳显示因子有效性。
---
表5及图17-25:因子总体与分年表现详解(页15-23)
- 表5综合各因子的IC均值、正IC占比、年化收益、信息比率、最大回撤、换手率,确认三主力因子表现优异。
- 图17-25展示净值走势,均表现平稳上涨,多空对冲策略和多头中证500相对策略均验证因子有效性。
- 分年度数据(表6-14)显示2015年及之前表现突出,2017年部分因子效力减弱。
- 换手率高达77%-85%,说明策略持仓频繁。
---
表16:与BARRA因子相关性分析(页25)
- 地理因子与流动性(STOM),动量(HALPHA)、残差波动(HSIGMA)存在负相关,说明因子捕捉了不同于传统流动性、动量和风险特征。
- 与市值(LNCAP)、账面市值比(BTOP)等存在小幅正相关,表示某些基础属性存在联系,但整体独立性较强。
---
表17:不同选股范围表现(页26)
- 在中证1000和创业板范围,策略整体表现更优,年化收益和收益信息比均超过全市场水平。
- 换手率维持高位,结合手续费敏感性考察显得尤为重要。
---
图26-28:手续费敏感性分析(页27)
- 费率从千一到千五逐级上升,策略净值曲线显著下降,千五扣费策略收益仍为正。
- 这表明策略适宜在低手续费环境中运作,以减少成本侵蚀。
---
4. 估值分析
本报告主要为因子研究性质,未涉及对具体股票的估值模型分析。因子收益通过信息系数(IC)、信息比率(IR)、超额收益率等指标量化因子有效性,而非直接DCF或市盈率估值。
---
5. 风险因素评估
- 市场环境风险:市场结构调整、监管政策变动可能导致因子失效。
- 模型风险:统计特征基于历史数据,未来可能不连续,导致预测失准。
- 交易成本风险:高换手率导致对手续费高度敏感,费用上升可能大幅压缩有效收益。
- 策略执行风险:实际操作中滑点、流动性等因素可能影响策略执行效果。
报告未提供具体缓解方案,提示用户需自行考虑策略适用环境。[page::28]
---
6. 批判性视角与细微差别
- 潜在偏见:
- 因子构造基于省份行政区划,这一划分可能掩盖部分经济连接的跨省特征。
- 选取月度频率以及等权加权方法可能忽略行业内权重差异及更细粒度的动态特征。
- 模型假设盲点:
- 相关系数在不同市场环境下的稳定性难以保证,报告中对2017年表现下滑有所反映。
- 高频数据优势被强调,但本报告因子以月度为周期,未直接探讨高频信息整合对因子的影响。
- 换手率与手续费敏感:
- 高换手意味着策略适用性限制,过度频繁交易影响成本效益,实战中需结合具体费用环境调整。
- 改进空间:
- 可考虑更细化的地理单位(地市、经济区)或行业细分权重,增强因子解释能力。
- 结合供应链和科技关联等其他经济关联信息进行复合因子构造,或增加机器学习非线性特征提取。
---
7. 结论性综合
本报告全面系统地介绍了一套基于地理关联度的多因子Alpha策略,覆盖了从理论依据、因子构造、统计特征、实证回测、多因子比较、选股范围敏感性到手续费影响的全链条分析。
- 以Parsons和Sabbatucci的领先滞后效应理论为根基,构建六种地理相关系数类因子,并对其进行了针对性优化(包括相关系数变动和拆解因子)。
- 实证结果表明,报告中的3个主推因子(𝐺𝐸𝑂𝐺𝐶𝑂𝑅𝑅、𝐺𝐸𝑂𝐺𝐶𝑂𝑅𝑅𝑃、𝐺𝐸𝑂𝐺𝐶𝑂𝑅𝑅𝐼𝑃)在A股市场均表现出稳定的正向IC,分档效应明显,截止2022年年化超额收益率均超过13%,信息比率超过1.5,证明该因子确实捕获了超额Alpha。
- 因子特征与BARRA经典因子相关性低,体现出其挖掘到了传统因子体系难以覆盖的增量信息,尤其是在成长性与动量等维度无明显重叠,表现出一定独立投资价值。
- 选股范围从大盘向中小盘切换时表现更佳,推荐中证1000及创业板作为优选池,换手率较高,增强收益的同时需控制交易成本。
- 收费敏感性测试显示,在千分之五手续费水平策略净值有所下滑,但整体仍维持正收益,交易费用水平影响不容忽视。
- 风险声明明确指出策略对市场与政策环境的依赖,尤其是策略的历史有效性不保证未来持续可行。
整体看,地理相关系数类因子成功地将个股间基于办公地经济内生联系的信息结构提炼为可交易因子,展现了极具创新性和应用前景的alpha挖掘路径。建议投资研究团队可将此因子纳入多因子模型框架,结合合适的交易成本控制策略,进行实际投资组合优化应用。
---
参考文献溯源
报告关键结论和分析均基于详尽的实证数据和现有研究文献,尤其重点引用Parsons和Sabbatucci (2018, 2020)对地理关联度领先滞后效应的研究成果,[page::0,5,6,28]。
---
总体评价
本报告结合理论和实证,清晰展示了基于地理信息构造多因子的可行性和有效性,体现了量化研究的严谨性和创新性,数据详实,方法论明确,结论具有一定的可复制性和实用性。唯换手率高的经营策略和手续费敏感度问题提示实际应用需谨慎设计交易执行流程。整体为多因子投资因子塑造提供了宝贵思路和实践样本。
---
附:重要图表示意(请见文中相应页码指引)
- 图1-3:省份上市公司数与收益差异
- 图4:基本地理关联度因子IC走势
- 图5-7:因子省份、行业、市值分布特征
- 图8:单只股票地理相关系数因子与月收益走势图
- 图9:全市场因子均值与中证全指月度收益走势
- 图11-16:六类地理相关系数因子分档表现柱状图
- 图17-25:三大因子IC及多空净值走势
- 图26-28:手续费敏感性多头策略净值











(以上仅为部分图表示意,报告中附表及细节更多,建议结合全文详细阅读,所有重要结论均标注了页码溯源。)
---
以上为本报告的详尽分析解读,涵盖了报告的所有核心内容体系、方法论、数据表现、图表解释以及批判性视角,是对该多因子Alpha最新研究成果的全面复刻与再剖析。[page::0-31]