功夫计量（Matering 'Metrics）阅读笔记

2015-11-16 21:10:20 | 来源：新浪微博 | 投稿：Shirley_Chia | 编辑：小柯

原标题：功夫计量（Matering 'Metrics）阅读笔记

我分享关于安神这本新书的笔记，其原因在于这本书并不特别值得一读。这本书的定位十分尴尬，鸡肋是对其最好的描述。Mostly Harmless Econometrics (MHE)的读者会觉得它太简单，而Freakonomics的读者则会觉得它太难。尽管用《功夫熊猫》和上古电视剧《功夫》包装了一下，但是显然A&P的文笔跟Levitt&Dubner相比，差距不可以道里计。所以如果没看过MHE，拿这本书作为计量功夫秘籍，很可能会觉得语焉不详，越看心儿越乱；而如果已经看过MHE，那幺再花时间来看这本书，就物不所值了。所以考虑到有些朋友可能还没来得及（或者不准备）看这本书，我贴出自己的读书笔记，聊供参考，或许能抵消一点我过去一年犯下的业障。需要说明的是，本笔记具有私人性质，只是要点的罗列，详略安排未见得满足不同读者需求；此外，错误之处难免，恳请好心告知。

本书正文部分共分六章，其中前五章分别介绍随机试验、回归、工具变量、断点回归、双重差分，所谓功夫计量的“盖世五侠”，第六章是对以上方法的综合应用。每一章都结合一个或数个实证案例来讲解，章节末尾有功夫大师介绍版块和附录版块。
第一章：随机试验
本章案例是医疗保险实验 (RAND Health Insurance Experiment, Oregon health insurance experiment)，结论是医疗保险覆盖使得医疗服务使用率上升，但并未明显改善健康水平。
本章有一句话是我读完全书感觉最有用的，抄录在这里：“Many lifestyle choices, such as low-fat diets and vitamins, have been shown to be unrelated to health outcomes when evaluated with random assignment.”
大师版块介绍发明RCT、ANOVA、MLE等等的远古大神R A Fisher。
附录是关于统计推断的基本知识。（拿此书当畅销书和消遣读物的到此处估计就已经丢失了。）
第二章：回归
本章案例是就读私立高校（vs. 公立高校）的经济回报。作者举了钱楠筠的例子——她同时收到了Harvard和UT-Austin的本科offer，但她选择了后者，因为UT-Austin给的奖学金更高。
所基于的文献是Dale and Krueger (2002), "Estimating the Payoff to Attending a More Selective College: An Application of Selection on Observables and Unobservables." QJE.
该文把申请了同一组学校、这些学校的招收标准也类似（基于SAT平均成绩）、申请结果也相同（即被同一组学校接受或拒绝）的学生匹配起来，发现选择就读私立高校的学生后来的收入水平和公立高校的学生差不多。
作者强调“回归只是一种特殊的匹配。”
然后讲遗漏变量偏误。提到经典文献Altonji, Elder, and Taber (JPE, 2005)，在此处的implication是，当控制了最重要的控制变量之后，如果关键解释变量的系数估计不再随着更多控制变量的加入而发生大幅变化，那幺就说明潜在的遗漏变量偏误可能很小了。
大师版块介绍提出回归概念的Galton和完善多元回归思想的Yule。
附录关于回归理论，是MHE第3章特别是3.1-3.2节的简写。
第三章：工具变量
案例一：charter school是不是更好（结论是肯定的），来自Angrist等关于某charter school的随机试验。由于是random lottery offer and non-random enrollment，所以需要用IV方法。
所基于的文献是Angrist et al (2010), "Inputs and Impacts in Charter Schools: KIPP Lynn." AER.
作者引出了LATE on compliers的概念，并提到经典文献Imbens and Angrist (1994, ECMA)以及Angrist, Imbens, and Rubin (1996, JASA)。
案例二：对施暴者从轻发落是否会助长家庭暴力的再发生（结论是肯定的），来自一项关于处置家庭暴力的实验，接警的警员随机收到关于是否对施暴者从轻发落（不予逮捕）的指示，但警员的实际行动可能与指示有出入。
所基于的文献是Angrist (2006), "Instrumental Variables Methods in Experimental Criminological Research: What, Why and How," Journal of Experimental Criminology.
这也是个nonrandom compliance的例子。该例子的特点是，由于不存在always-taker（即一旦警员收到逮捕指令，不会对施暴者从轻发落），LATE反映的就是ATT（因为treated group由complier和always-taker两部分组成）。
案例三：子女数量（family size）对长子/女受教育程度的影响（结论是并无负面影响），用来说明2SLS对简单的Wald估计在两方面的推广（多重IV以及控制变量）。
所基于的文献是Angrist, Lavy, and Schlosser (2010), "Multiple Experiments for the Causal Link between the Quantity and Quality of Children," JLE.
该文为family size找到了两个IV：

第二胎是否为双胞胎；
前两胎性别是否相同。

作者强调了一种检验exclusion restriction的方法：如果first stage effect很弱，那幺reduced form effect一定很弱，因为reduced form effect=first stage effect*LATE。反之，如果在first stage effect很弱的子样本中发现了较强的reduced form effect，则说明exclusion restriction很可能不成立。因此可以通过构造这样的子样本来进行检验。
大师版块介绍IV方法的提出者Philip G Wright。
附录关于IV理论。再次强调了考察reduced form effect的重要性：因为它只是OLS而已，不会受到弱工具变量有限样本偏误的影响，它若很弱，就能表明因果关系不存在。"If you can't see it in the reduced form, it ain't there."
第四章：断点回归
案例一（Sharp RD）：美国合法饮酒年龄是21岁以上，数据表明21周岁生日当月死亡率激增。对死因数据的分析也表明死亡率激增可能确实是由于饮酒所致。
所基于的文献是Carpenter and Dobkin (2009), "The Effect of Alcohol Consumption on Mortality: Regression Discontinuity Evidence from the Minimum Drinking Age," AEJ: Applied.
作者强调，RD的好处在于，treatment status由running variable唯一决定，因此不会发生遗漏变量偏误。
作者还强调，RD尽管也是一种回归，但与回归有重要差异：

回归的本质是conditional on controls，treatment近似随机，因此可以对treated和control outcomes进行对比；
而在RD中，在任何running variable取值下都无法同时观察到treated和control outcomes，因此其validity取决于extrapolation（局部性）。

案例二（Fuzzy RD）：peer effect。美国有一种exam school，需要进行入学考试。（该案例的fuzzy之处在于有些学生上了分数线但没入学，有些被一所es拒绝但去了其它es）。
所基于的文献是Abdulkadiroglu, Angrist, and Pathak, "The Elite Illusion: Achievement Effects at Boston and New York Exam Schools," ECMA.

被解释变量：中学数学成绩（Y）
解释变量：同班同学的小学数学成绩（X_bar，反映peer effect）
简单回归：将Y回归在X_bar和自己的小学数学成绩上，发现显着的peer effect。
fuzzy RD：结构方程右边包含X_bar和running variable（入学考试成绩）；第一阶段回归右边包含treatment status（是否超过分数线，即IV）和running variable。发现peer effect不显着。尽管此IV很有可能通过peer quality以外的渠道影响成绩（不满足exclusion restriction），但这倾向于高估真实效应，因此反而强化结论。

大师版块介绍RD的提出者心理学家Donald T Campbell。
第五章：双重差分
案例一：密西西比州北部属于第8联储区（圣路易斯联储），南部属于第6联储区（亚特兰大联储），大萧条时期两个联储的货币政策风格不同，结论表明在扩张性货币政策下，银行倒闭数更少。
所基于的文献是Richardson and Troost (2009), "Monetary Intervention Mitigated Banking Panics during the Great Depression: Quasi-Experimental Evidence from a Federal Reserve District Border, 1929-1933," JPE.
案例二：美国历史上不同州的最低合法饮酒年龄不同，再次考察其对死亡率的影响。
所基于的文献是Carpenter and Dobkin (2011), "The Minimum Legal Drinking Age and Public Health," JEP.
关键解释变量：每个州每年允许饮酒的18-20岁人群比例。发现该比例越高，死亡率越高。
作者强调了在此类研究中控制individual-specific linear trend的重要性。
大师版块介绍现代流行病学之父John Snow在1855年一项关于霍乱病因的研究，使用了DD方法。
附录介绍聚类标准误。
第六章：华山论剑之教育回报率
1. Mincer (1974)回归：控制experience及其平方项。
2. 能力引起的遗漏变量偏误可能为正，也可能为负。
3. Griliches (1977, ECMA)用IQ控制能力。
4. bad control问题（详见MHE 3.2.3）：

bad control（例如职业）上的效应也是教育回报率的一部分；
bad control会导致selection bias；
发生在treatment之后的变量往往是bad control（比如用考试成绩来作为能力的代理变量）。

5. Ashenfelter and Krueger (1994, AER)以及Ashenfelter and Rouse (1998, QJE)的双胞胎研究。但有可能因为受教育水平具有测量误差而导致attenuation bias，且（在双胞胎研究中）当被解释变量为差分时，这一偏误更为严重——这是更一般化结论的特例：控制变量越多，attenuation bias越严重。这组文献的解决办法是：数据中每对双胞胎各自报告了对方的教育水平，因此可以用对方报告的自己的受教育水平作为自己报告的受教育水平的IV。
6. Acemoglu and Angrist (2001), "How Large Are Human-Capital Externalities? Evidence from Compulsory-Schooling Laws," NBER Macroeconomics Annual 2000. 用各州童工法对义务教育年限的规定作为受教育水平的IV。（在此例中，first-stage和reduced-form回归都是DD型的。）
7. Angrist and Krueger (1991, QJE) 用出生季度作为教育水平的IV。
8. Clark and Martorell (2014), "The Signaling Value of a High School Diploma," JPE. 用fuzzy RD来研究学历的价值。