SAS中文论坛

标题: 紧急求问:多元回归的截距问题 [打印本页]

作者: shiyiming    时间: 2004-4-18 15:36
标题: 紧急求问:多元回归的截距问题
作多元回归的时候,
加截距项和不加截距项的回归结果有时相差比较大。
请问,加或者不加截距项需要什么理由吗?
我现在做一个多元回归,
无截距项的时候,R2和自变量的显著性均比有截距项的回归结果要好。
好像一般回归都要有截距的。
请问,需要作什么检验来说明可以不需要加截距比加截距要好?怎么做?
呜呜,偶是菜鸟。
作者: shiyiming    时间: 2004-4-18 16:55
加和不加截距项是进行多元回归的两种类型,谁比谁好是不一定的,实际效果(R2和自变量的显著性)很依赖于做回归的数据源。实际应用时可以将两种都试一下,选则较好的一个。
个人见解,仅供参考!
作者: shiyiming    时间: 2004-4-18 17:59
做回归分析,对某个变量的取舍(包括截距项),是由估计系数的t值决定的,若显著(一般大于2)都应保留,对整个模型的取舍应考虑F检验和R2
供参考
作者: shiyiming    时间: 2004-4-18 23:33
我把结果贴上来给大家看看。
1、有截距项的
                                                             方差分析

                          Source                   DF         平方和           均方    F Value    Pr > F

                          Model                     5        0.00465     0.00093065       0.74    0.5960
                          Error                    33        0.04127        0.00125
                          Corrected Total          38        0.04592


                                       Root MSE              0.03536    R-Square     0.1013
                                       Dependent Mean        0.06077    Adj R-Sq    -0.0348
                                       Coeff Var            58.18866


                                                            参数估计

                                                               参数           标准
                        变量         标签         DF           估计           误差       t 值    Pr > |t|

                        Intercept    Intercept     1        0.04879        0.03027       1.61      0.1165
                        MOWNPER      Mownper       1        7.66692        5.74913       1.33      0.1915
                        COUPER       Couper        1    -0.00030052     0.00043312      -0.69      0.4926
                        CAPPER       Capper        1    -0.00002680     0.00039676      -0.07      0.9466
                        OUTPER       outper        1       -0.00898        0.09493      -0.09      0.9252
                        H            H             1        0.10044        0.07426       1.35      0.1854


2、没有截距项的
                                                            方差分析

                          Source                   DF         平方和           均方    F Value    Pr > F

                          Model                     5        0.14544        0.02909      22.22    <.0001
                          Error                    34        0.04452        0.00131
                          Uncorrected Total        39        0.18996


                                       Root MSE              0.03618    R-Square     0.7657
                                       Dependent Mean        0.06077    Adj R-Sq     0.7312
                                       Coeff Var            59.54025


                                                            参数估计

                                                               参数           标准
                        变量         标签         DF           估计           误差       t 值    Pr > |t|

                        MOWNPER      Mownper       1       10.31587        5.63718       1.83      0.0760
                        COUPER       Couper        1    -0.00000858     0.00040257      -0.02      0.9831
                        CAPPER       Capper        1     0.00017629     0.00038496       0.46      0.6499
                        OUTPER       outper        1        0.12951        0.04129       3.14      0.0035
                        H            H             1        0.10593        0.07590       1.40      0.1719


ps,有人说可以检验截距在统计上是否显著异于0,这个怎么做?
呜呜,望大家谅解,我老是问比较弱的问题:(
作者: shiyiming    时间: 2004-4-19 02:20
加不加截矩没有绝对的规定,一般拟和中都会加截矩。如果仅仅是为发现自变量和因变量之间的结构和影响的程度关系,可以去除截矩,进行变量标准化回归。至於截矩的检验是否非零,并不重要。如果模型检验合理,变量也显著,不用在意截矩的显著性,仍然放在模型内。

对模型的判断不能只看R,F,如果要使用模型预测,即使R,F相差一些也没有关系。象你第二个加入截矩的模型,虽然F高,P低,但是自变量除一个外几乎都不显著,很可能有多重共线性,应该加入截矩重新拟和。
作者: shiyiming    时间: 2004-4-19 10:03
其实你的问题对应的是该让系统计算截距,还是自己设置截距。
你不要有截距就是设置截距为0。而不设置就是系统自动拟合出截距。
该不该自己设置截距应该根据你自己对模型的认识来自己决定。
作者: shiyiming    时间: 2004-4-20 20:26
如果你根据经济理论或其他方面的理论确切的知道你要拟合的模型应该不包含截距的话就拟合不含截距的回归方程;如果你不能确定,还是加的好。因为如果实际上方城是包含截距项而你拟合不含截距的回归时,所得的结果是有偏的,即估计的回归系数的期望不等于实际的回归系数(总体的回归系数)

正如onon所说,可能是变量之间存在共线,你可以用逐步回归的方法,或求变量之间的协方差矩阵,保留相关系数较大一对变量中的一个,或用主成分方法,可以将变量转化为互不相关,但主成分方法的弱点是不容易对模型做解释。
作者: shiyiming    时间: 2004-4-21 00:36
要命啊!!!

截距并不是想要就加,或是想不要就可以去除的。我打个最简单比方,
固定设备成本+产品成本*产品个数(x)=总成本(y),没有产品产出的时候,如果出现以上计算结果,难道要总成本为0,固定设备的钱你付?有的时候还是要牺牲拟合效果,尊重实际情况的,总不能以书本公式来左右客观世界。再如果拟合不好,只能说明模型思路有问题,除了线形模型,还有非线形模型呢!

学统计的,不要被公式,指标框死,越活越**了。
作者: shiyiming    时间: 2004-4-21 16:54
对统计是要经济理论知识指导的,如willon的例子,截距是不能不加的。如果微观经济理论指示模型应有截距,而你拟合不含截距的回归,结果是有偏的。
作者: shiyiming    时间: 2004-4-22 09:40
一般说来,多元回归模型应该有截距项的,除非你有特殊的理由,比如你自己定义的模型或推倒出的模型里没有截距项。就数据本身来看,你可以先画一张你感兴趣的自变量和因变量的图,看看是不是没有截距。实际的数据一般都会有截距的,除非是你自己做的数据。而就截距项本身来说,它是“1”,代表的是一种恒定的因素对因变量的影响,在大多数的研究设计中,这种恒定的因素是不能忽略的。




欢迎光临 SAS中文论坛 (http://mysas.net/forum/) Powered by Discuz! X3.2