|
楼主
楼主 |
发表于 2004-10-27 09:54:27
|
只看该作者
关于cluster的一个疑问
想问一个关于cluster的一个问题.
在用cluster做聚类分析时,若碰到含缺失值的样本也能够得到分类的结果,不知道含缺失值的样本是怎样参与分类的,比方说是按什么来计算距离的.
本来的数据是很大的,在此我只是列举一个小数据,并用fastclus 来进行分类,
data a;
input x y z@@;
cards;
712977 146892 314303
473415 118100 197342
228367 58280 98224
185149 45968 84613
. 48997 65149
. 43891 61210
. 37346 40230
337381 84689 148404
304941 70857 128411
run;
proc fastclus maxclusters=4 out=out1;
var x y z;
run;
此时在数据out1中对每条记录都有cluster的值,不知道对第 5,6,7条记录是怎么样来分类的?请高手指点.谢谢!
___________________________________
交流是有利于更好的学习 |
|