SAS中文论坛
标题:
紧急求问:多元回归的截距问题
[打印本页]
作者:
shiyiming
时间:
2004-4-18 15:36
标题:
紧急求问:多元回归的截距问题
作多元回归的时候,
加截距项和不加截距项的回归结果有时相差比较大。
请问,加或者不加截距项需要什么理由吗?
我现在做一个多元回归,
无截距项的时候,R2和自变量的显著性均比有截距项的回归结果要好。
好像一般回归都要有截距的。
请问,需要作什么检验来说明可以不需要加截距比加截距要好?怎么做?
呜呜,偶是菜鸟。
作者:
shiyiming
时间:
2004-4-18 16:55
加和不加截距项是进行多元回归的两种类型,谁比谁好是不一定的,实际效果(R2和自变量的显著性)很依赖于做回归的数据源。实际应用时可以将两种都试一下,选则较好的一个。
个人见解,仅供参考!
作者:
shiyiming
时间:
2004-4-18 17:59
做回归分析,对某个变量的取舍(包括截距项),是由估计系数的t值决定的,若显著(一般大于2)都应保留,对整个模型的取舍应考虑F检验和R2
供参考
作者:
shiyiming
时间:
2004-4-18 23:33
我把结果贴上来给大家看看。
1、有截距项的
方差分析
Source DF 平方和 均方 F Value Pr > F
Model 5 0.00465 0.00093065 0.74 0.5960
Error 33 0.04127 0.00125
Corrected Total 38 0.04592
Root MSE 0.03536 R-Square 0.1013
Dependent Mean 0.06077 Adj R-Sq -0.0348
Coeff Var 58.18866
参数估计
参数 标准
变量 标签 DF 估计 误差 t 值 Pr > |t|
Intercept Intercept 1 0.04879 0.03027 1.61 0.1165
MOWNPER Mownper 1 7.66692 5.74913 1.33 0.1915
COUPER Couper 1 -0.00030052 0.00043312 -0.69 0.4926
CAPPER Capper 1 -0.00002680 0.00039676 -0.07 0.9466
OUTPER outper 1 -0.00898 0.09493 -0.09 0.9252
H H 1 0.10044 0.07426 1.35 0.1854
2、没有截距项的
方差分析
Source DF 平方和 均方 F Value Pr > F
Model 5 0.14544 0.02909 22.22 <.0001
Error 34 0.04452 0.00131
Uncorrected Total 39 0.18996
Root MSE 0.03618 R-Square 0.7657
Dependent Mean 0.06077 Adj R-Sq 0.7312
Coeff Var 59.54025
参数估计
参数 标准
变量 标签 DF 估计 误差 t 值 Pr > |t|
MOWNPER Mownper 1 10.31587 5.63718 1.83 0.0760
COUPER Couper 1 -0.00000858 0.00040257 -0.02 0.9831
CAPPER Capper 1 0.00017629 0.00038496 0.46 0.6499
OUTPER outper 1 0.12951 0.04129 3.14 0.0035
H H 1 0.10593 0.07590 1.40 0.1719
ps,有人说可以检验截距在统计上是否显著异于0,这个怎么做?
呜呜,望大家谅解,我老是问比较弱的问题:(
作者:
shiyiming
时间:
2004-4-19 02:20
加不加截矩没有绝对的规定,一般拟和中都会加截矩。如果仅仅是为发现自变量和因变量之间的结构和影响的程度关系,可以去除截矩,进行变量标准化回归。至於截矩的检验是否非零,并不重要。如果模型检验合理,变量也显著,不用在意截矩的显著性,仍然放在模型内。
对模型的判断不能只看R,F,如果要使用模型预测,即使R,F相差一些也没有关系。象你第二个加入截矩的模型,虽然F高,P低,但是自变量除一个外几乎都不显著,很可能有多重共线性,应该加入截矩重新拟和。
作者:
shiyiming
时间:
2004-4-19 10:03
其实你的问题对应的是该让系统计算截距,还是自己设置截距。
你不要有截距就是设置截距为0。而不设置就是系统自动拟合出截距。
该不该自己设置截距应该根据你自己对模型的认识来自己决定。
作者:
shiyiming
时间:
2004-4-20 20:26
如果你根据经济理论或其他方面的理论确切的知道你要拟合的模型应该不包含截距的话就拟合不含截距的回归方程;如果你不能确定,还是加的好。因为如果实际上方城是包含截距项而你拟合不含截距的回归时,所得的结果是有偏的,即估计的回归系数的期望不等于实际的回归系数(总体的回归系数)
正如onon所说,可能是变量之间存在共线,你可以用逐步回归的方法,或求变量之间的协方差矩阵,保留相关系数较大一对变量中的一个,或用主成分方法,可以将变量转化为互不相关,但主成分方法的弱点是不容易对模型做解释。
作者:
shiyiming
时间:
2004-4-21 00:36
要命啊!!!
截距并不是想要就加,或是想不要就可以去除的。我打个最简单比方,
固定设备成本+产品成本*产品个数(x)=总成本(y),没有产品产出的时候,如果出现以上计算结果,难道要总成本为0,固定设备的钱你付?有的时候还是要牺牲拟合效果,尊重实际情况的,总不能以书本公式来左右客观世界。再如果拟合不好,只能说明模型思路有问题,除了线形模型,还有非线形模型呢!
学统计的,不要被公式,指标框死,越活越**了。
作者:
shiyiming
时间:
2004-4-21 16:54
对统计是要经济理论知识指导的,如willon的例子,截距是不能不加的。如果微观经济理论指示模型应有截距,而你拟合不含截距的回归,结果是有偏的。
作者:
shiyiming
时间:
2004-4-22 09:40
一般说来,多元回归模型应该有截距项的,除非你有特殊的理由,比如你自己定义的模型或推倒出的模型里没有截距项。就数据本身来看,你可以先画一张你感兴趣的自变量和因变量的图,看看是不是没有截距。实际的数据一般都会有截距的,除非是你自己做的数据。而就截距项本身来说,它是“1”,代表的是一种恒定的因素对因变量的影响,在大多数的研究设计中,这种恒定的因素是不能忽略的。
欢迎光临 SAS中文论坛 (http://mysas.net/forum/)
Powered by Discuz! X3.2