统计211
标题:
怎么利用SAS处理实验获得的数据?
[打印本页]
作者:
275932488
时间:
2010-5-30 11:56
标题:
怎么利用SAS处理实验获得的数据?
【转帖】第一步:Examining Data for Analysis
这是是数据处理最重要的部分,因为异常值会影响到处理结果并误导你。在使用复杂数据分析步之前,花点时间检查你的数据。
Code 1: Getting to konw data
Proc contents data=mydata;
run;
使用contents过程步可以让你了解数据,告诉你:数据集名和保存位置;数据创建时间和最后修改时间;变量数和类型;
Code 2: Examination of numeric variables
Proc univariate data=mydata plot;
var height;
ID family;
run;
本过程步提供了数值变量最完整的信息:检验变量分布;描述统计;显示极端观测;绘制分布图。
plot选项提供了茎叶图、盒子图和正态分布图,可视化检查数据。
最重要的是可以提供Extreme Observations,方便排除异常值。
Code 3:Examination of character/discrete variables
Proc freq data=mydata ;
table block family/out=FreqTable nocol norow nocum nopercent;
run;
离散变量检查语句,本人用的较少。
Code 4: Data Summary
Proc means data=hbook.mydata mean std cv n maxdec=2;
var Height diameter;
run;
本语句提供数据汇总功能,在排除异常值后,以手里的数据做个全面的了解。
第二步:推断统计
经过第一步的预处理后,可以保证数据通过正态检验和齐次性检验,具体方法可以查阅本人的其它帖子。
Code5: analysis of variance
Proc Anova;
Proc GLM;
Proc MIXED
上面的三个语句功能各异,均用于进行方差分析。Proc MIXED国内用的较少,外文期刊常能见到。
Code 6 : Correlation and regression
Proc corr;
Proc Reg;
Proc nlin;
上述两个语句可以计算相关系数和回归方程,以及线性和非线性拟合,具体方法可参考本人的其它帖子。
第三步:Plotting
SAS绘图有PLOT和GPLOT,前者只是简单的绘图,后者可以得到高质量的绘图。。
上述三步可以满足大部分人的需求,切记第一步是不能省的。
欢迎光临 统计211 (http://www.tj211.com/)
Powered by Discuz! X3.2