Balancing Efficiency and Equity in Classroom Assignment under Endogenous Peer Effects
创建于 更新于
摘要
本报告提出一个基于中国教育面板调查数据的三步实证框架,用神经网络预测班级好友关系,利用工具变量方法测算内生同伴效应,并通过遗传算法设计最优班级分配策略。研究显示提升优良学生的受欢迎度可优化整体成绩,但纯效率最大化策略会严重损害不利学生公平性,提出带公平约束的遗传算法取得较好权衡[page::0][page::3][page::25][page::27]
速读内容
实证框架三步法概要 [page::0][page::1][page::2][page::8][page::9]
- 第一步,PeerNN神经网络模型用学生预设特征预测班级中学生之间的好友亲密度矩阵$\Omega$。
- 第二步,用工具变量方法测算好友加权的6年级班级排名对8年级认知测试分的因果影响$\beta$。
- 第三步,基于第一二步的估计结果,采用遗传算法(GA)及公平遗传算法(AFGA)搜索班级分配方案,最大化班级平均同伴效应。
PeerNN模型表现优异,捕捉好友网络特性[page::2][page::16][page::17]

- 显著性别同质性:男女学生更倾向于同性朋友圈,形成明显的好友群体。
- 存在节点中心性:部分学生受关注程度高,成为社交网络核心。
- 相比线性均值模型,PeerNN对好友特征的预测误差大幅降低(图6) 。
同伴效应实证结果,确认成绩良好学生的正向影响 [page::3][page::17][page::18]

- 好学生定义为6年级排名较高者,扰动学生为排名较低者。
- 好友排名提升10%,能提高8年级认知成绩约0.13标准差。
- 性别、户籍、父亲受教育程度均影响同伴效应异质性,低受教育家庭子女受益更明显。
- 具有较强的鲁棒性验证,采用班级等级分位、Persistence指标控制相关机制并未改变结论。
课堂分配优化策略与公平性权衡 [page::25][page::26][page::27]

- 遗传算法(GA)最大化平均同伴效应,平均提升1.9%,但形成少数扰动生被孤立遭受极差影响,严重不公平。
- 引入公平因子后构建公平遗传算法(AFGA),略降效率提升至1.2%,显著改善分配公平性,消除极端负面效果。
- 政策制定者可通过调整权重参数$\phi$和$\rho$实现公平与效率的个性化权衡。
深度阅读
金融研究报告深度解析报告
报告标题
Balancing Efficiency and Equity in Classroom Assignment under Endogenous Peer Effects
作者及机构
Lei Bill Wang, Zhenbang Jiao, Om Prakash Bedant, Haoran Wang
均来自美国俄亥俄州立大学,分别隶属于经济学系、统计学系和电子与计算机工程系
发布时间
2025年6月5日
研究主题
本报告聚焦于教育经济学领域,具体研究如何在学生的同伴效应(peer effects)及内生形成的友谊网络影响下,优化中学的班级学生分配,以在效率(促进学生成绩提升)和公平(避免弱势学生受损)之间寻求平衡。报告利用中国教育面板调查(CEPS)数据实证分析,并设计算法优化方案。
---
一、概览与核心论点
报告提出一套三步法实证框架:
- 建模友谊网络形成过程 — 设计了名为PeerNN的神经网络模型,基于个体预设特征预测友谊形成强度矩阵($\Omega$),反映学生间的“人气”,即友谊密切程度。
2. 估计同伴效应 — 探究通过$\Omega$加权的好友6年级排名对8年级认知测试成绩的影响,发现好友排名提升10%会使认知成绩提升0.13个标准差。
- 模拟政策trade-off及优化分配 — 通过遗传算法(GA)基于上述估计优化分班以最大化平均同伴效应,但结果显示单纯追求效率会造成弱势学生严重受损的公平性问题,故提出了算法公平遗传算法(AFGA),在获得1.2%的改善收益的同时兼顾公平。
核心结论强调,单纯效率导向的班级分配政策可能加剧教育不平等,建议政策设计纳入公平因素,兼顾内生溢出效应影响。[page::0][page::1][page::3][page::4]
---
二、逐节解读
2.1 引言
报告背景设定为中学校长需要基于学生初始信息(6年级成绩、性别等)安排班级。强调两大关键信念:
- 学生在班级内形成内生的友谊网络,"人气"不同的学生对整体同伴效应有差别。
- 同伴质量异质,优良学生带来正面影响,差生可能产生负面影响。
因此,校长希望设计方案使优良学生“人气”最大化,差生人气最小化,提高整体教学效果。
文中图1清晰表达了信念与三步法对应关系。[page::1]
2.2 友谊形成建模 Step 1
- 创新点是提出PeerNN,一种结合深度学习与微观经济学离散选择模型的新方法,独辟蹊径只用学生个体特征,规避了对真实友谊链路(难以获取)的依赖。
- PeerNN设计体现了同性倾向(homophily)、传递性(transitivity)等社会网络特征。
- PeerNN输出的$\Omega$捕捉到“中心节点”以及性别同质化,显著优于传统的线性均值模型中默认的均匀友谊分布假设。[page::2][page::16][page::17][page::44]
2.3 同伴效应估计 Step 2
- 衡量好友6年级排名加权平均数对8年级认知成绩的影响。支持好友优秀可促进学生认知成绩。
- 采用工具变量法(IV)解决内生性:用随机分班内的同班同学均值排名作为工具变量,以克服好友选择偏差。
- 改良后的友谊加权线性模型赋予了$\beta$更具政策意义,表现为“朋友”而非“平均同班同学”的影响。
- 主要回归结果显示:好友排名提升10%使认知测验分数提升0.13标准差,量化了同伴效应大小。[page::2][page::3][page::12][page::13][page::17][page::18]
2.4 优化班级分配 Step 3
- 采用遗传算法(GA)进行复杂的离散组合优化,因网络依赖个体特征导致优化问题非线性和NP-hard,传统线性规划无法适用。
- GA最大化平均预期同伴效应,模拟结果显示约1.9%提升。
- 然而GA产生严重公平性问题,少量差生被安排成排斥性朋友圈而深受负面影响。
- 设计算法公平遗传算法(AFGA),增设对班内及班间同伴效应方差的惩罚权重,权衡效率与公平,维持1.2%水平增益的同时保证更均衡的同伴效应分布。[page::3][page::15][page::16][page::25][page::26]
---
三、图表与数据深度解析
图表1 (页1) — 校长信念与步骤对应示意图
清晰梳理:
- 信念1“内生网络形成”对应预测谁受欢迎(Step 1)
- 信念2“同伴质量异质”对应识别好生与差生(Step 2)
- 校长策略基于上述两者设计分班方案(Step 3)
体现本研究结构性思路。[page::1]

图表2 (页7) — 分班随机性假设检验
利用似然比检验比较班级内学生特征分布和学校整体特征分布,无显著偏离,支持随机分配假设。
六个子图分别对:6年级成绩排名、户籍类型、户籍所在地、性别、父亲受教育水平和民族进行检验,绝大多数统计量低于临界值。
保证IV方法中的排除性假设有力支撑。[page::7]

图表3 (页9) — 三步法建模流程框架
图示PeerNN编码X至$\Omega$,通过IV回归估计$\beta$,再由遗传算法寻找最优分配$\pi$。
清楚展示模型信息流及算法流程,体现多学科融合。
[page::9]

图表5 (页17) — $\Omega$矩阵热力图示例
分别展现训练集与测试集中的两个班级。
红色深度表示同伴亲密度高。两块深色对角块验证显著性别同群效应。黑色竖条呈现“中心节点”现象(部分学生极获得同伴关注)。
直观体现PeerNN良好捕捉网络结构,符合社会网络规律。
[page::17]


图表6 (页18) — PeerNN vs 线性均值模型的预测误差对比
多组不同同伴特质下的预测误差分布对比,小体积的violin图表明PeerNN在九成指标上显著优于传统模型,唯一“勤奋”指标表现不及,合理解释为自评与他评差异。
数据强烈支持PeerNN的预测优势。
[page::18]

图表7 (页26) — 改进幅度的分布与效率-公平权重权衡
展示基于标准GA和三档AFGA ($\phi=\rho=0.5,1,1.5$)提升幅度的频率分布。
图中曲线左移趋势说明权重增加时,效率提升下降但公平性提高。
提供调节效率与公平平衡的重要工具。
[page::26]

图表8 (页27) — 各策略下同伴效应矩阵$Q$热力图
Raw Q2显示存在两名差生严重拉低同伴效应(深色格),GA策略成功打散该不良朋友圈减少负效应,但同时出现极端暗格,表明某群体被“放弃”,承受极端负面影响。
AFGA则在保证整体同伴效应略提升的同时去除黑暗格,显著提升公平性。
[page::27]

图表9 (页27) — 不同策略下学生同伴效应分布直方图
Raw策略产生三峰分布,左侧极低峰由差生负效应导致。
GA策略削弱左峰,提升整体均值,但产生数个极左尾不平等极端值。
AFGA显著缩减极端左尾,成更平滑对称分布。
反映AFGA在兼顾公平基础上不牺牲效果的重要性。
[page::27]

---
四、估值分析
本研究核心是估计同伴效应参数$\beta$,用以度量好友学业表现提升带来的认知成绩增益。
- 估值模型:
- 采用“线性均值模型”改进版本,即好友加权均值模型$y=\beta\Omega z + X\gamma + \theta + \mu + \epsilon$,$\Omega$由PeerNN预测(区别于均匀权重矩阵$W$)。
- 核心估计通过工具变量法两阶段最小二乘(2SLS),以同班同学未加权均值为工具变量解决$\Omega$选择性偏差。
- 关键假设:
- 分班随机性保证工具变量排除性;
- 内生网络形成通过$\Omega$体现,不同学生有不同影响力。
- 估值结果及政策含义:
- $\beta$显著正值,表明同伴的优秀学业表现正向提升学生成绩。
- $\beta$的大小表现为好友学业水平提升1个百分位,学生成绩可提升约0.013标准差;更符合实际的“朋友而非同班同学”视角。
- 强调“中心学生”在传播优异学业气氛中的关键作用,激发“好学生人气最大化”的分班策略。
- 线性均值模型$\beta$的政策参考价值有限,因其假设所有同学同等影响力,无法产生策略空间。
综上,本报告通过创新模型与深度机器学习工具对同伴效应进行了精确估计,为科学分班和优化教育资源配置提供了数据支撑和估值方法。[page::3][page::12][page::13][page::17][page::18]
---
五、风险因素分析
报告详细讨论了以下风险与局限:
- 内生性问题:
学生个体未观测特征(如IQ、学习态度)可能同时影响友谊选择$\Omega$和学业结果$y$,导致简单模型估计偏误。IV方法虽处理此风险,但对“非友谊途径的同伴影响”存在挑战。
- 相关机制混淆:
课堂竞争氛围、教师教学质量或课堂讨论水平等可能不通过$\Omega$传播影响,形成潜在混淆。报告通过引入班级层面协变量(6年级各分位数排名、学生持续性指标)缓解此类影响,但多重控制引入多重共线性,影响估计显著性。
- 方案推广风险:
本模型需要大量学生预设特征及复杂算法支持,实际推广时可能受到数据缺失或计算复杂性的限制。
- 公平与效率权衡风险:
遗传算法若无公平考量,极端优化可能造成少数学生群体长期受损,激化教育不公平。
- 模型假设限定性:
PeerNN基于特定微观经济模型和机器学习假设,有可能忽略其他交互复杂性和动态性,可能导致误判友谊强度。
报告通过设计AFGA部分缓解了公平性风险,整体风险意识较强,但对非友谊相关的同伴影响措置仍存在一定不确定性。[page::13][page::20][page::25]
---
六、批判性视角与细微差别
- 友谊矩阵预测的独立性假设较强:PeerNN仅用学生个体特征预测友谊形成,不利用已有网络邻居信息,虽兼顾了反事实情景下的可行性,但可能缺少对动态社交依赖的建模,损失复杂交互信息。
- 因工具变量的排除假设受非标准机制影响:相关非友谊机制难以完全通过控制变量排除,其对同伴效应估计的潜在影响未完全量化,可能导致偏差。
- 遗传算法非全局最优:作为启发式算法,GA结果依赖于初始值及参数设置,可能存在局部最优局限。AFGA权重的选择较为主观,缺少自动调参指引。
- 公平度量方式单一:公平性通过对同伴效应标准差加权惩罚实现,但未涉及其他公平维度(如长远生涯机会),公平目标具局限。
- 现实推广障碍:高复杂度的算法对资源有限教育系统的实操难度较大,规模扩展性需考量。
总体上,报告谨慎合理,创新性强但部分方法细节及假设仍需扩展验证。[page::10][page::37]
---
七、综合总结
本报告提出并实证验证了一种结合深度学习与经济计量学的创新框架,用于优化存在内生友谊网络和差异性同伴效应的中学分班策略。报告创新点包括:
- PeerNN:借助模型微观经济学基础设计,结合神经网络灵活性,无需访问全链路数据,实现对友谊强度的高效估计。
- 同伴效应估计:采用工具变量法精准测算好友6年级排名对8年级认知成绩的正向影响,具体量化同伴关系的教育溢出效应。
- 分班优化算法:基于遗传算法的启发式搜索最大化同伴效应,但发现效率最大化诱发严重的不公平结果,提出算法公平遗传算法(AFGA)平衡效率与公平。
报告以CEPS数据深入支持验证,且系统展开了对随机性假设、同伴效应异质性以及方案公平性的严密检验。
图表分析清楚显示:
- 性别同群是班级友谊网络的主要结构特征;
- 优秀学生集中成为影响力中心,是分班优化的重点目标;
- 传统均值模型无法捕捉同伴影响差异,而PeerNN提供更丰富网络刻画;
- AFGA相较单纯GA更有效避免极端负效应现象,提供更包容的教育公平方案。
论文最后建议教育政策设计必须兼顾效率与公平,尤其在存在复杂内生同伴效应结构时,应把公平纳入目标函数,避免弱势群体被边缘化。
整体来看,报告以严谨的方法论体系贯穿理论创新、实证检验、政策模拟与风险控制,既凸显同伴网络效应提升教育质量的潜力,也提醒政策制定需平衡社会公平以实现共享发展。
[page::0][page::1][page::3][page::17][page::25][page::26][page::27]
---
附:部分重要公式与术语说明
- PeerNN:神经网络模型,输入学生预设变量$X$,输出友谊强度矩阵$\Omega$,$\Omega{ij}$表示学生$i$选择学生$j$为好友的概率。基于离散选择理论,利用Softmax归一化行。
- 线性均值模型(Linear-in-means):
$$ y{ics} = \beta \tilde{W}{ics} + X{ics}\gamma + \thetas + \mu{cs} + \epsilon{ics} $$
其中$\tilde{W}{ics}$为不加权同班同学6年级成绩均值。假设所有同学的同伴影响均等。
- 加权同伴模型:
$$ y{ics} = \beta \tilde{\Omega}{ics} + X{ics} \gamma + \thetas + \mu{cs} + \epsilon{ics} $$
其中$\tilde{\Omega}{ics} = \sumj \Omega{ijcs} z{jcs}$,允许个体影响力异质,政策设计空间更大。
- 工具变量(IV)法:利用分班时同学未加权排名均值作为工具变量解决$\Omega$内生性,通过两阶段回归实现因果识别。
- 遗传算法(GA):启发式组合优化算法,通过选择、变异、交叉迭代改进班级分配,实现目标函数(平均同伴效应)最大化。
- 算法公平遗传算法(AFGA):在GA基础上融入同伴效应标准差惩罚项,限制同伴效应分布波动,兼顾个体公平与整体效率。
---
结语
本报告在教育经济学与机器学习交叉领域具有开创意义,为政府和学校优化班级分配策略提供科学依据。未来研究可聚焦扩展非友谊同伴效应机制,开发更丰富公平衡量指标,及探索大规模多班级场景下可行高效的优化算法。