统计211
标题:
STATA数据处理技巧与计量分析十|面板回归分析(上)
[打印本页]
作者:
linhua83
时间:
2021-4-22 17:36
标题:
STATA数据处理技巧与计量分析十|面板回归分析(上)
什么是面板数据?
[attach]3461[/attach]
面板数据的分类:
长面板 VS 短面板
静态面板 VS 动态面板
平衡面板 VS 非平衡面板
面板数据优点:
可以解决遗漏变量问题(一般是由于不可观测的个体差异或“异质性”造成)
提供更多个体动态行为的信息。
样本容量较大,可以提高估计的精确度。
个体效应模型:
对于面板数据,我们有两种极端的数据处理方式:
第一种:忽略个体之间的差异,当成是横截面数据,采用OLS估计。
第二种:忽略个体之间的联系,对每一个个体的时间序列数据进行OLS估计。
[attach]3462[/attach]
其中,图片是不随时间而变的个体特征,如性别;图片可以随个体及时间而变。扰动项由图片两部分构成,称为“复合扰动项”,因此上述模型也称为“复合扰动项模型”。其中,不可观测的随机变量图片是代表个体异质性的截距项,因此,也可以称为“不可观测效应模型”。
如果个体效应与某个解释变量相关,则称为“固定效应模型”(Fixed effects model,FE);如果个体效应与x和z均不相关,则称为“随机效应模型”(Random effects model,RE)
面板数据的几种处理
混合回归
图片
Pooled regression. 简单说,就是忽略面板数据的特点,当成是横截面数据一样采用OLS进行估计,认为不同个体之间的截距无差异。
注意事项:
面板数据,可以假设不同个体之间扰动项相互独立,但是时间上的扰动项往往存在自相关。——采用聚类稳健标准误。(同一聚类观测值允许存在相关性,而不同聚类则不存在相关性)
混合回归的基本假设是“不存在个体效应”。因此需要进行相关的检验,如FE中的F检验(stata输出结果的底部)。
个体固定效应模型
[attach]3463[/attach]
对时间进行平均(每个个体单独进行)
[attach]3464[/attach]
减去原模型,得到离差形式
[attach]3465[/attach]
用新符号表示上述离差形式。可以用OLS进行估计。但是,个体效应没有了,同时反映个体特征的z变量也没有了!
去中心化!
消除个体观测效应和某个解释变量之间的相关性,则可以使用OLS进行估计。
注意事项:
优势:[attach]3466[/attach]也称为“固定效应估计量”图片,或者组内估计量。即使个体效应和解释变量相关,但只需要使用组内估计量,就可以得到一致性统计。
劣势:无法估计不随时间变化的个体特征,比如性别等。
最小二乘虚拟变量模型LSDV:FE估计量相当于OLS+个体虚拟变量。(线性模型和离差形式的一致性)
时间固定效应
[attach]3467[/attach]
类似于个体固定效应的LSDV,可以添加时间变量的虚拟变量到模型中,即为时间固定效应模型。
一阶差分法
[attach]3468[/attach]
通过减去滞后项达到消除个体效应的目的!
当T=2时,[attach]3469[/attach]
当T>2时,组内估计量一般比一阶差分估计量更有效率,因此实践中,常用FE而少用FD。
注意事项
优势:动态模型中,由于严格外生性假定无法满足,故会采用差分法。
随机效应模型
[attach]3470[/attach]
如果个体效应和解释变量不相关,则OLS是一致的,这个时候就可以采用随机效应模型进行估计。(大部分情况还是需要使用固定效应模型,因为假设很难满足)
组间估计量
[attach]3471[/attach]
组内估计量FE和组间估计量BE
(很少用!)因为在随机模型下,对个体进行平均值处理,损失较大信息量。
注意事项:仅反映了个体之间的差异,因此称为组间估计量。
欢迎光临 统计211 (http://www.tj211.com/)
Powered by Discuz! X3.2