Blog - Zeyu CHEN

论文分享合辑 ← 此处记录了我为一些很棒的论文写的介绍性文章。

城市经济学的前世今生

2024-09-27

碰巧看到这个，读这一段思想史不免心生感慨：https://x.com/Undercoverhist/status/1372999869204467718

论文版本：https://papers.ssrn.com/sol3/papers.cfm?abstract_id=4450141

沪港发展联合研究所重新整理翻译的中文版本：https://fddi.fudan.edu.cn/37/f7/c21253a276471/page.htm

感谢Prof. Cherrier与合作者的贡献！

主页完成！

2024-09-04

纪念主页建成的第一天！自己写网页还是有些折腾的，好在以前学爬虫的时候学过一点HTML。以后我可能会在这个页面中分享一些学术活动和日常生活，之后会抽空补档一些以前的记录。

一篇关于聚类稳健推断的使用指南

2023-07-18

文献：MacKinnon, James G., Morten Ørregaard Nielsen, and Matthew D. Webb, "Cluster-robust inference: A guide to empirical practice," Journal of Econometrics, 232 (2023), 272–299.

这是当时组会上分享过的文章，是关于聚类稳健推断在这几年形成的一些理论共识。在原文的基础上，我补充了不少以前读过的相关文献，汇总成了一个更丰富的[Slides](也有[中文版]，不过英文版有一些修订)，供大家参考。其中，重要结论已由下划线标注，可供大家快速浏览。此外我也标注了一些重要的推断方法如何在Stata中使用。

一些要点摘录于此：

如果选择考虑聚类的渐进标准误，那么当样本量较少时，尽量使用由jackknife法计算出的聚类渐进标准误，其具有更好的小样本性质且更保守。
随着样本量的增大，聚类标准误的缩小可能存在下界，因此大样本下，忽略聚类结构导致的标准误低估往往非常严重。
使用DD方法的时候，至少要聚类到接受处理的地理层级。
当处理组的聚类数量很少时，考虑聚类的渐进标准误可能会过度拒绝原假设，这时候最好用考虑聚类的原始自助法标准误。
在绝大多数情况下，加入固定效应不是不聚类的理由。
两种确定聚类层级的经验法则：
1. 最直接的方法：在聚类数量不至于太少的前提下，选择所有可行的聚类层级中最大的那一级。
2. 最保守的方法：对于感兴趣的系数，汇报所有可行的聚类层级中最大的那个标准误。
有一些用来判断聚类层级的预检验方法，但任何预检验方法如果没有与后续的统计推断一并进行联合假设检验，则均会导致过度拒绝原假设。建议以上述第ii个经验法则为准。
DD方法在国内研究者中流传甚广的“安慰剂检验”是用来辅助统计推断的(Chetty et al., 2009, AER)，而无法说明因果识别的好坏。(在国内，误用非常普遍！)
存在聚类结构时，决定中心极限定理效果好坏的关键在于聚类数量与聚类间的差异性，而非仅仅是样本数量。因此，一方面，不会有一个普适的最小聚类数量\( G^* \)能保证当我们的聚类数量比它大时便可高枕无忧；另一方面，研究者理应在文章中汇报聚类的数量及其异质性(比如样本在聚类间的分布、聚类杠杆值等等)
如果聚类数量很少或聚类之间差异很大，考虑聚类的渐进标准误就不太好用了，因为其依赖于中心极限定理成立。
除了汇报常用的渐进标准误，大多数情况下都建议大家另外再汇报由带约束条件的原始聚类自助法(restricted wild-cluster bootstrap)计算出的p值。

[2025.02.10 更新]
前面提到，在DD估计中，如果处理组的聚类数量很少，最好用原始聚类自助法来进行推断。最近有一篇新的研究出来："Standard Errors for Difference-in-Difference Regression" (Hansen, 2025, Journal of Applied Econometrics)，文章的模拟结果表明，在DD中使用jackknife法计算出的聚类渐进标准误是更好的。作者有与MacKinnon他们的研究进行对话，指出"One difference between our simulation and theirs is our investigation of the impact of treatment effect heterogeneity (which induces conditional heteroskedasticity), as MacKinnon, Nielsen, and Webb (2023b) only investigate homoskedastic designs. This explains the divergence between our findings and theirs concerning the Wild bootstrap. Our results show that the Wild bootstrap performs well under low treatment effect heterogeneity (e.g., homoskedasticity) but not under high treatment effect heterogeneity (e.g., heteroskedasticity)." 等到之后有时间，我会追加更新本文的相关内容。