SAS中文论坛

 找回密码
 立即注册

扫一扫,访问微社区

查看: 823|回复: 5
打印 上一主题 下一主题

请教成分数据的问题

[复制链接]

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
楼主
 楼主| 发表于 2004-5-13 16:16:07 | 只看该作者

请教成分数据的问题

X和Y分别代表一组比重,每一个case代表一年的纪录。现在需要对它们建立回归模型。请问需要进行怎样的预处理,怎么判断数据服从何种分布。谢了
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
沙发
 楼主| 发表于 2004-5-22 21:41:52 | 只看该作者

???

直接做回归不就行了吗?干吗还要预处理啊???
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
板凳
 楼主| 发表于 2004-5-23 08:29:42 | 只看该作者
如果讲的是比重,也许问题不是那么简单.如果我理解的是对的,比重应当是一组百分比,而百分比分布在0-1之间,不是正态分布的.一般要采用对数变换.建议读一读ATCHINSON的一本书,Statistical analysis of the compositional data.
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
地板
 楼主| 发表于 2004-5-24 10:36:19 | 只看该作者

xic说得对

我看过埃克逊和张尧庭的著作,但是不太明白。主要问题是
1)如何判断资料是否服从加法logit分布还是狄氏分布
2)资料不满足回归模型的LINE中的I的前提怎么办?
即在case之间有可能不独立的情况下如何建立模型
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
5#
 楼主| 发表于 2004-5-25 23:33:27 | 只看该作者
Well, I think it is a topic beyond the discussion here, and it can not be explained in a short message.  In my understanding, the choice of L-dist and D-dist is not based on which distribution describe the data better, but what kind of statistics do you want to derive.  If data does not meet the basic requirements of the regression model, you have to go deeper in statistics to derive a more appropriate model.  You may think of mixed model or Baysian analysis, if they are appropriate for your purpose.
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
6#
 楼主| 发表于 2004-5-27 13:36:53 | 只看该作者

谢谢!

看来我还是书没有看透,需要再下功夫才行。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|手机版|Archiver|SAS中文论坛  

GMT+8, 2025-1-10 16:07 , Processed in 0.170284 second(s), 20 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表