统计211
标题:
虚拟变量
[打印本页]
作者:
style
时间:
2016-8-10 10:02
标题:
虚拟变量
虚拟变量
一、问题的提出
1、计量经济学模型,需要经常考虑属性因素的影响。例如,职业、战争与和平、繁荣与萧条、文化程度、灾害、季节;
2、属性因素往往很难直接度量它们的大小。只能给出它们的“Yes—D=1”或”No—D=0”、或者它们的程度或等级;
3、为了反映属性因素和提高模型的精度,必须将属性因素“量化”。通过构造0-1型的人工变量来量化属性因素。
二、虚拟变量的定义
1、虚拟变量是一用以反映质的属性的一个人工变量,通常记为D(Dummy)。
2、虚拟变量D只取0或1两个值
3、对基础类型或肯定类型设D=1
4、对比较类型或否定类型设D=0
三、模型中引入虚拟变量的必要性
现实经济生活错综复杂,往往要求人们按照经济变量的质或量的不同,分别进行处理。因此,回归模型中,往往有必要引入虚拟变量,以表示这些质的区别。例如,消费函数,对于平时与战时,萧条与繁荣,乃至性别、教育程度、季节性等等,都会因质的有不同表现出不同的差异。
四、模型中引入虚拟变量的作用
1、分离异常因素的影响,例如分析我国GDP的时间序列,必须考虑“文革”因素对国民经济的破坏性影响,剔除不可比的“文革”因素。
2、检验不同属性类型对因变量的作用,例如工资模型中的文化程度、季节对销售额的影响。
3、提高模型的精度,相当于将不同属性的样本合并,扩大了样本容量(增加了误差自由度,从而降低了误差方差)[
五、虚拟变量举例
QQ截图20160810095602.png
(5.5 KB, 下载次数: 0)
2016-8-10 10:00 上传
点击文件名下载附件
六、虚拟变量的引入
1、虚拟变量在模型中,可以作解释变量,也可以作因变量。
2、虚拟变量作解释变量时出现在方程的右端
3、虚拟变量作因变量(被解释变量)时出现在方程的左端
七、虚拟变量模型
引入虚拟变量后,回归方程中同时含有一般解释变量和虚拟变量,称这种结构的模型为虚拟变量模型或斜方差分析模型。虚拟变量作为因变量引入,D只取1或0,不能用OLS方法进行估计,但是可以采用Logit方法或Probit方法估计模型。例如,D=1(Clinton被罢免),D=0(Clinton不被罢免) 估计得到的模型,将给出D=1或D=0的概率。(Clinton被罢免和不被罢免的可能性)
八、模型中引入虚拟变量的作用
1、分离异常因素的影响,例如分析我国GDP的时间序列,必须考虑“文革”因素对国民经济的破坏性影响,剔除不可比的“文革”因素。
2、检验不同属性类型对因变量的作用,例如工资模型中的文化程度、季节对销售额的影响。
3、提高模型的精度,相当与将不同属性的样本合并,扩大了样本容量(增加了误差自由度,从而降低了误差方差)
九、虚拟变量设置的原则
在模型中引入多个虚拟变量时,虚拟变量的个数应按下列原则确定:
1、如果有 m 种互斥的属性类型,在模型中引入 m-1 个虚拟变量
2、例如,性别有2个互斥的属性,引用2-1=1个虚拟变量
3、再如,文化程度分小学、初中、高中、大学、研究生5类,引用4个虚拟变量。其具体设置方式如下表所示。
QQ截图20160810095704.png
(7.16 KB, 下载次数: 0)
2016-8-10 10:01 上传
点击文件名下载附件
Ocean,2016-08-07
如果您觉得本文不错,欢迎分享转发到朋友圈,谢绝任何形式的转载~
欢迎您邀请朋友关注微信号“统计211网( ID: tj211_com)”!
还可以扫一扫二维码关注我们哦~~
二维码.png.thumb.jpg
(26.78 KB, 下载次数: 0)
2016-8-10 10:02 上传
点击文件名下载附件
欢迎光临 统计211 (http://www.tj211.com/)
Powered by Discuz! X3.2