SAS中文论坛

标题: 如何找到在单因素众多水平里对变量有显著影响的水平? [打印本页]

作者: shiyiming    时间: 2006-2-27 22:14
标题: 如何找到在单因素众多水平里对变量有显著影响的水平?
本人菜鸟,有个问题,想请教诸位
有一个单因素A,有八个水平1-8,有一个数值变量B,B不满足正态分布. 我想找出哪一个水平对B是有显著影响 (每一个水平都有一个对应p value,而不是总共只有一个p value)。哪位能告诉我怎么实现呢?bow~
作者: shiyiming    时间: 2006-2-28 17:13
标题: 回复
用NPAR1WAY的WILCOXON???
作者: shiyiming    时间: 2006-2-28 17:56
标题: 谢谢
谢谢回答,我本来用的就是Wilcoxon score,但这样只有一个p value,不能知道到底哪个因素对变量B有显著的影响。在我这种情况下(B数据集合不正态,也不能转变成正态)能否作多元线性回归分析来解决这个问题?多谢各位了
作者: shiyiming    时间: 2006-3-1 15:32
标题: 回复
你可以尝试用REG 来拟和模型~~~~~~~~
作者: shiyiming    时间: 2006-3-2 20:51
标题: 能不能从相关系数矩阵上看和B显著的有哪些?
能不能从相关系数矩阵上看和B显著的有哪些?
作者: shiyiming    时间: 2006-3-2 21:59
标题: to GESAS
这样的话,你不能确定那些更为显著,用p值看更好一些吧
作者: shiyiming    时间: 2006-3-8 11:22
标题: 多谢回答
godensjj, 但是REG是用多元线形回归法,我的数据不符合正态分布,能用这个吗??
作者: shiyiming    时间: 2006-3-8 13:17
标题: 回复
可以的,但是总觉得用reg来看哪个影响力大好象不太好~~~``
作者: shiyiming    时间: 2006-3-8 15:34
标题: 多重比较
你说的这个属于方差分析中的多重比较。可以用Duncan和Tukey等方法。关于多重比较的详细介绍可以参考相关的资料。SAS中anova过程也带了多重比较的option。如果你的数据确实不满足正态性条件,则需用非参数方差分析Kruskal-Wallis。一般来说,参数要比非参数方法好。
作者: shiyiming    时间: 2006-3-8 20:49
标题: 好久不弄统计了
非正态用参数检验可能不怎么合适。
1。先用Kruskal-Wallis检验8个水平有无显著差异
2。如果显著,再用wilcoxion两两检验看两个水平是否存在显著差异,反正有p-value,全当多重比较吧
作者: shiyiming    时间: 2006-3-8 22:13
标题: 谢谢大家的回复,我是第一次在这个论坛上发帖子,能得到这么多人
大家说得对,我现在的问题有两个,一个是调正态问题,我不想用非参数分析法,得出的结果也确实不好,但是200多个样本数据就是调不成正态,真是费解。二,多重比较的问题。
我会去了解一下如何估计多重比较,谢谢啦,有大家的帮忙让我觉得很有动力
作者: shiyiming    时间: 2006-3-10 21:38
标题: 非参数分析可以用Duncan, Tukey吗?
在网上查了查,好像没有一个非参数分析用Duncan, Tukey等多重检验法。数据是用各种方法都不能转换成正态的,哪位再给支个招,谢啦
作者: shiyiming    时间: 2006-3-11 21:15
标题: Re: 非参数分析可以用Duncan, Tukey吗?
个人认为改正态不太可能,你可以看一下非正态检验里NPAR1WAY什么过程中那些选象可以做啊
作者: shiyiming    时间: 2006-3-11 22:26
标题: 非参数方法的两两比较问题
此问题为非参数方法的两两比较问题,教科书上有关非参数检验的两两比较有可以采用的方法,但在软件中没有现成的操作途径。

当然,根据教科书上的方法,可以通过编制相应的程序来实现。

另外,比较笨一些的方法就是调整名义检验水准,然后进行多次Wilcoxon秩和检验。
作者: shiyiming    时间: 2006-3-13 18:44
标题: 非参的计算方法
首先,Duncan和Tukey法只能用于方差分析的多重比较,而不能在非参中使。SAS中有Kruskal-Wallis法的计算过程。对于非参的多重比较,可以用Nemenyi检验。不过Nemenyi检验在SAS中没有,需要你自己算。

下面我给一个K-W法的SAS sample:

[code:a8633]
data nonparameter;
input type$ day;
cards;
A 2
A 2
A 2
A 3
A 4
A 4
A 4
A 5
A 7
A 7
B 5
B 5
B 6
B 6
B 7
B 8
B 10
B 12
C 3
C 5
C 6
C 6
C 6
C 7
C 7
C 9
C 10
C 11
C 11
;
run;
proc npar1way wilcoxon data=nonparameter;
class type;
var day;
run;
[/code:a8633]

[quote:a8633]
                                     The NPAR1WAY Procedure

                                  Wilcoxon Scores (Rank Sums) for Variable day
                                          Classified by Variable type

                                          Sum of      Expected       Std Dev          Mean
                      type       N        Scores      Under H0      Under H0         Score
                      --------------------------------------------------------------------
                      A         10         82.00         150.0     21.630148      8.200000
                      B          8        148.50         120.0     20.339362     18.562500
                      C         11        204.50         165.0     22.080824     18.590909

                                       Average scores were used for ties.


                                               Kruskal-Wallis Test

                                            Chi-Square         9.8833
                                            DF                      2
                                            Pr > Chi-Square    0.0071
[/quote:a8633]

此程序DATA步写的很烂,不要学我。你把程序改一下,换上你的数据就可以算了。程序里虽然写的wilcoxon,但是SAS当发现分类变量有3个以上的值,就会自动用K-W法。

下面把Nemenyi的公式列在附件中,你可以自己计算。
作者: shiyiming    时间: 2006-3-14 08:57
标题: to maurice
search一下,我记得我以前贴过Nemenyi检验的程序。
作者: shiyiming    时间: 2006-3-14 10:02
标题: to student
调整名义检验水准,嗯,这个想法不错.不过有一点得请教一下.各水平两两比较的事件似乎大概彼此不是独立的.似乎不能简单的计算而得到调整到哪一个值更合适,不知STUDENT大侠有何妙计?
作者: shiyiming    时间: 2006-3-14 14:19
标题: to student
以前没有听说过名义检验水平,查了一下,好像属于sequential experiment design的范畴。不知能否给解释一下?
作者: shiyiming    时间: 2006-3-17 09:35
标题: 这样可以吗
其实我的目的并不需要两两水平比较,是想知道哪个水平对因素B有显著影响。能否考察水平A1时,把其余的7个水平当作一个整体,这样再用k-w测试,得到一个p value,随后再考察水平A2,。。。直到水平A8
这样就得到了8个p value,就知道了哪个水平对因素有影响?
作者: shiyiming    时间: 2006-3-17 15:20
标题: to sophiayama
其实我一开始就不想回答这个问题(原因是看了你的标题),因为我发觉很多人都是学统计学得走火入魔了.
一个因素中哪个水平对因变量影响大(这个提法就是错误的,影响大自然是指变化大了,但你以什么为比较基础也不提,鬼才知道哪个影响大,退一步讲,你提的影响大就是指结果变量的值最大,那分析也没有什么奇怪的),做一个以该因素为CLASS的对结果变量的均数比较就可以看出来,哪一个组的均数或者中位数大,哪一个当然就是影响最大的了.,唯一要做的只是检验各水平有无统计学效应,做一个方差分析或者秩和检验结果也就出来了.并无多少神秘的东西.
现在越讨论越搞得很神秘.这样是不是不太好?统计学是为了简化了解事物的手段,现在我个人觉得很多的人把它变成了复杂事物的手段了.寒心啊.




欢迎光临 SAS中文论坛 (http://mysas.net/forum/) Powered by Discuz! X3.2