SAS中文论坛

 找回密码
 立即注册

扫一扫,访问微社区

查看: 868|回复: 7
打印 上一主题 下一主题

一个统计问题

[复制链接]

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
楼主
 楼主| 发表于 2009-4-22 00:14:36 | 只看该作者

一个统计问题

在一个线性的模型里,你想要估计吸烟和癌症的关系。关于吸烟有两个变量1 是否吸烟 2 如果吸烟,吸烟的数量。我总觉得把这两个变量同时放在模型里有问题。因为他们并不独立。否则应该怎么办呢?

大家有什么意见呢?
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
沙发
 楼主| 发表于 2009-4-22 09:37:43 | 只看该作者

Re: 一个统计问题

你就只放数量啊,为零就等于不吸烟啊。你们这些木鱼脑壳,我看到就生气。
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
板凳
 楼主| 发表于 2009-4-22 10:07:05 | 只看该作者

Re: 一个统计问题

你先别生气。
如果用数量的话,不吸烟为零。数据就是0,1,2,3,。。。。有两个问题你要解决:1。在线形模型里,变化从0 到1相当于1 到 2。等距离。比如说系数是0.1。意思是每多吸烟一根,应变量的变化为10%。更具体的说吸烟一根相对于不吸烟的的危害等同于吸烟两根相对于吸烟一根的危害。这是不符合实际的。2。因为所有不吸烟设定为零。于是用许多的零来估计模拟线上的一个点,听起来也有问题。
所以不同意你的答案。
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
地板
 楼主| 发表于 2009-4-22 10:19:01 | 只看该作者

Re: 一个统计问题

1.如果你认为数量不是线性的,就不要把数量作为线性因子,用CLASS作为分类因子就行了。
2.按你的说法,多加一个0,1变量那不是不单单用零来估计模拟线上的一个点而且还要用[color=#FF4000:37d965cp]更多的1[/color:37d965cp]来估计模拟线上的一个点,听起来也不是大大的有问题? (你这句话说得有点不知所云-(什么叫估计模拟线上的一个点?),我只是引用一下。。。。。。。)



所以不同意你的答案
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
5#
 楼主| 发表于 2009-4-22 10:39:00 | 只看该作者

Re: 一个统计问题

我们把问题简单化以避免纠缠。假设我知道对于吸烟的人,某种疾病和吸烟的具体数量由线形关系。我想要知道1吸烟相对于不吸烟的危害2如果吸烟的话,告诉我吸烟数量和疾病可能的斜率。
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
6#
 楼主| 发表于 2009-4-27 21:26:33 | 只看该作者

Re: 一个统计问题

用LOGISTIC模型吧,因变量(是否得癌证)是2项变量。
你用普通线形回归模型拟合效果绝对差。
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
7#
 楼主| 发表于 2009-4-27 23:11:35 | 只看该作者

Re: 一个统计问题

您老可不能跟我们晚辈一般见识~~~
这里还有好多都是本科生~~~,还是社科类的~~
搞统计计量的还是少数~~~,清华的贴子上更~~~~
<!-- s:D --><img src="{SMILIES_PATH}/icon_biggrin.gif" alt=":D" title="Very Happy" /><!-- s:D --> 您老消消火儿~~(本来有红双喜就不给您点了~~等火灭了再说,,赫赫)
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
8#
 楼主| 发表于 2009-4-29 21:21:47 | 只看该作者

Re: 一个统计问题

to Harich: agree. on the other hand, sometimes we  called logistic model as logistic linear regression model, because we did measure the linear relationship bewteen the response ( probability or a transformed count) and covariates.
to Ahuige: I am not angry!
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|手机版|Archiver|SAS中文论坛  

GMT+8, 2026-2-5 14:07 , Processed in 0.196534 second(s), 20 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表