SAS中文论坛

 找回密码
 立即注册

扫一扫,访问微社区

查看: 751|回复: 3
打印 上一主题 下一主题

关于cluster的一个疑问

[复制链接]

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
楼主
 楼主| 发表于 2004-10-27 09:54:27 | 只看该作者

关于cluster的一个疑问

想问一个关于cluster的一个问题.
在用cluster做聚类分析时,若碰到含缺失值的样本也能够得到分类的结果,不知道含缺失值的样本是怎样参与分类的,比方说是按什么来计算距离的.

本来的数据是很大的,在此我只是列举一个小数据,并用fastclus 来进行分类,
data a;
input x y z@@;
cards;
712977        146892        314303
473415        118100        197342
228367        58280        98224
185149        45968        84613
  .        48997        65149
  .        43891        61210
  .        37346        40230
337381        84689        148404
304941        70857        128411
run;
proc fastclus maxclusters=4 out=out1;
var x y z;
run;
此时在数据out1中对每条记录都有cluster的值,不知道对第 5,6,7条记录是怎么样来分类的?请高手指点.谢谢!

___________________________________

交流是有利于更好的学习
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
沙发
 楼主| 发表于 2004-10-27 13:21:45 | 只看该作者

re

对某行来说,先计算非缺失值变量与其seed的差的平方和,然后计算该平方和的均值,用这个均值来替代缺失值那里的差值平方。然后再求平方和开方。。。

应该是这样。。。
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
板凳
 楼主| 发表于 2004-10-28 09:46:50 | 只看该作者

answer

老兄说是用“均值来替代缺失值那里的差值平方”,你能不能确定?
关于SAS中聚类分析这一块,距离公式很多,但是很多的参考书中并没有提到处理缺失数据的聚类,所以在下表示很大的困惑,望高手再指点,谢谢!
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
地板
 楼主| 发表于 2004-10-28 12:21:37 | 只看该作者

re

关于fastclus中的missing value,还是看看SAS自己的技术文档吧
<!-- m --><a class="postlink" href="http://www.id.unizh.ch/software/unix/statmath/sas/sasdoc/stat/chap27/sect13.htm">http://www.id.unizh.ch/software/unix/st ... sect13.htm</a><!-- m -->

我想不是高手也可以看懂的。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|手机版|Archiver|SAS中文论坛  

GMT+8, 2025-1-11 06:01 , Processed in 0.733026 second(s), 22 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表