统计211

标题: 基于最优尺度变换的回归分析 [打印本页]

作者: style    时间: 2016-9-8 17:00
标题: 基于最优尺度变换的回归分析
基于最优尺度变换的回归分析
《含有虚拟变量的回归分析》一文中,详细讲解了虚拟变量的设置方法以及虚拟变量的回归分析等内容。从SPSS操作步骤上来看,大家可能会觉得有些繁琐,如果再继续增加虚拟变量的个数或增加某个虚拟变量的类别,那么虚拟变量的设置就显得很费时间,而且出错概率较高。为了解决这个问题,我今天给大家介绍最优尺度回归。
最优尺度变换专门用于解决在统计建模时如何对分类变量进行量化的问题,其基本思路是基于希望拟合的模型框架,分析各级别对因变量影响的强弱变化情况,在保证变换后各变量间的联系为线性的前提下,采用一定的非线性变换方法进行反复迭代,从而为原始分类变量的每一个类别找到最佳的量化评分,随后在相应模型中使用量化评分代替原始变量进行后续分析。这样就可将各种传统分析方法的适用范围一举扩展到全部的测量尺度,如对无序多分类变量、有序多分类变量和连续变量同时进行回归分析、因子分析等。为了详细说明最优尺度回归,仍然引用《含有虚拟变量的回归分析》一文中的数据来研究。
1、变量和数据如下:

QQ截图20160908165806.png (111.7 KB, 下载次数: 0)

2、SPSS操作步骤:
分析→回归→最佳刻度→因变量选入因变量列表框,并定义其测量尺度→所有自变量选入自变量列表框,并分别定义其测量尺度→确定
QQ截图20160908165849.png (24.06 KB, 下载次数: 0)
3、SPSS结果分析:
QQ截图20160908165922.png (12.62 KB, 下载次数: 0)
QQ截图20160908165954.png (24.64 KB, 下载次数: 0)
QQ截图20160908170004.png (19.06 KB, 下载次数: 0)
上述分析结果中输出的大部分表格和线性回归输出的表格基本一致,有所区别的是最优尺度回归多了一个相关性和容错表。此表中最主要的是重要性这一列的数据,它是根据标化系数和相关系数计算出的自变量在模型中的重要程度的百分比,所有变量的重要性加起来等于100%,数值越大表明该变量对因变量的预测越重要。可见,公司规模(SIZE)这个变量对高管薪酬(LnComp)的影响最大,其影响程度达到了88.7%,而其他自变量对高管薪酬(LnComp)的影响均不足10%,说明其他自变量对高管薪酬的影响极其微弱。显然,这与《含有虚拟变量的回归分析》一文中采用哑变量进行回归分析的结果是一致,读者可自行对比两者的结果。

Ocean
2016-9-2




如果您觉得本文不错,欢迎分享转发到朋友圈,谢绝任何形式的转载~
欢迎您邀请朋友关注微信号“统计211网( ID: tj211_com)”!

还可以扫一扫二维码关注我们哦~~

可见右侧二维码




二维码.png.thumb.jpg.thumb.jpg (26.78 KB, 下载次数: 0)




欢迎光临 统计211 (http://www.tj211.com/) Powered by Discuz! X3.2