摘要: 回归分析在经济学中常被用于识别变量间的因果关系。然而,由于经济系统的复杂性与非线性,经典线性可加可分离的回归模型设定常被诟病。虽然非参数模型的假设更弱,但由于维度灾难的困扰,其较少应用于实证分析。除了线性可加可分离的回归模型和非参数模型外,机器学习算法提供了第三种灵活可行的建模方法。本文尝试梳理机器学习与传统计量经济学因果识别的交叉部分,并探讨了在控制混淆变量时的模型设定偏误问题。用于因果识别的双重机器学习方法极大放松了模型假设。源于回归树的因果树有望在异质性分析中带来更多新发现。最后仍需强调,相比于实验数据,通过观测数据识别获得的因果关系需要谨慎对待。