统计211

 找回密码
 立即注册

QQ登录

只需一步,快速开始

统计211 门户 查看主题

含有虚拟变量的回归分析

发布者: 211TJ欧老师 | 发布时间: 2016-8-16 16:03| 查看数: 4053| 评论数: 0|帖子模式

含有虚拟变量的回归分析
线性是回归分析的重要假设。在进行线性回归分析时,自变量必须是连续变量,如果将一个离散变量纳入预测变量中,则需要将这个离散变量转换为虚拟变量,以使离散变量能够与其他连续变量一同纳入自变量中进行预测。
上次的《虚拟变量》一文中提到,在虚拟变量转换方面,需要用“0”,“1”的方式表示,虚拟变量数等于水平数减1。如果是二分类变量,就用一个虚拟变量表示,此虚拟变量的两个水平数值直接用0、1表示即可。如果该离散变量有3个水平,则应用2个虚拟变量表示。此外分类变量转换为虚拟变量时,关于参照组的设定有学者提出以下几个原则:
(1)        参照组的定义应该非常明确。如果类别变量中的水平内容为“其他”,就不适宜作为参照组,因为“其他”内容的定义不明确。
(2)        分类变量若具有次序尺度(如学历),则有两种选择参照组的方法:一是选择等级最高或最低的类别,二是选择等级居中的类别。前者的方法,可以让研究者有次序地将各个类别的回归系数与参照组进行比较,后者的方法,可以让研究者有效地观察达到水平的系数。
(3)        参照组的样本量应该适中,选择样本观察值过少或较多的水平作为参照组,对于类别中各个水平回归系数的比较不适当。
下面通过一个实际案例采用SPSS来研究虚拟变量的回归分析。案例的部分数据如下图所示:

QQ截图20160816154934.png (183.61 KB, 下载次数: 0)

最新评论

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


免责声明|关于我们|小黑屋|联系我们|赞助我们|统计211 ( 闽ICP备09019626号  

GMT+8, 2018-4-25 16:40 , Processed in 0.246589 second(s), 30 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表