统计211
标题:
数据变换
[打印本页]
作者:
linxiuquan001
时间:
2009-3-28 14:06
标题:
数据变换
作者:
wwy
时间:
2011-1-19 18:06
看到不到图,是我网速的原因吗?
呵呵,那我就分享下我的资料吧:
变量转换,就是将原始数据做某种函数转换,使得各组方差齐同,稳定,偏态资料正态化,以满足T检验或其他统计分析方法对资料的要求,但数据转换后,在结果的解释上,不如原始观测值方便。
1.对数变换(,对原始数据X采取对数(常用对数和自然对数),适合范围:对数正态分布各样本标准差与均数成例,或者变异系数是常数。
2.平方根变换,对原始数据X开算术平方根,适合范围:服从泊松分布的资料,轻度偏态分布资料;
3.平方根反正弦变换,将原始数据X的平方根取反正弦变换,适合二项分布资料,如疾病的发病率等。
4.倒数转换,将原始数据X取倒数,适合数据两端波动变化较大的资料。
注意:进行对数转换和平方根变换,平方根反正弦转换时,根号里的x不能为负数,对数或倒数里的x不能为0。如果你的x中有是负数或非正数,需要将其做线性转换成非负数。如果你的x中有是负数或非正数,需要将其做线性转换成非负数(即等于或大于0)或正数(大于0),如 COMPUTE nx = SQRT (x - min) 或 COMPUTE nx = LN (x - min + 1),其中的min是x的最小值(为一个非正数)。
P.S:不是任何分布形态的变量都可以转换的。例外之一是“双峰”或“多峰”分布(distribution with dual or multiple modality),没有任何公式可以将之转换成单峰的正态分布。
如果上述转换方法仍不能使转换后的数据服从正态分布,那么可以考虑秩和检验,因为秩和检验是对数据的秩次进行检验,对数据的总体分布要求不高.
欢迎光临 统计211 (http://www.tj211.com/)
Powered by Discuz! X3.2