SAS中文论坛
标题:
请教编程问题
[打印本页]
作者:
shiyiming
时间:
2006-5-12 22:16
标题:
请教编程问题
一个新的聚类算法。sas中没有可以直接应用的。所以拿到这里向大家请教。
数据如下,是17x4维的一组数,每一行表示一个数,以第一个数(也就是第一行)作为起始数据点,这个数代表这个聚类,顺序取其他各数与该数作欧氏距离运算,如果差值小于4则把这个数与第一个数看为一类,同时取该类内各数的均值作为该类的代表点。以后取到的数与各聚类代表点作距离运算,如果距离小于4,则将该数归入距离最近的那个类中,如果差值大于4则令该数为新的数据点,同时聚类数增加1。然后继续顺序向下取数据。说明:当聚类的数目大于1之后,后面的数据需要与已有聚类都做距离运算,若距离有小于4的则选择并入距离最近的类,否则聚类数加1。
3.2 4.2 8.1 3
2.2 6.3 11.1 4
4.2 8.2 12.0 5
3.0 7.3 9.0 5
5.2 7.3 7.9 4
2.3 6.0 8.8 7
3.3 6.6 12.2 3
3.3 6.7 9.1 9
8.5 5.5 9.1 3
7.6 3.1 8.7 6
4.0 3.1 10.1 3
7.8 3.7 11.3 6
3.2 7.7 3.0 7
9.1 4.6 8.0 3
4.4 4.0 5.5 9
1.5 5.0 2.7 3
7.8 5.5 2.1 1
作者:
shiyiming
时间:
2006-5-13 20:51
标题:
明晰
请介绍一下所述聚类规则的实际背景,SAS的系统聚类和变量聚类为什么不适合你的问题,阈值为什么必须是4,用欧氏距离聚类为什么还要改变“数”用均值代表该“数”?
作者:
shiyiming
时间:
2006-5-13 22:30
标题:
to wangyushun
这种聚类算法是新见到的,应该说不是sas本身聚类方法不能应用到我的问题中,而是我希望用该新算法来实现聚类。至于阈值我说是4,这样该是在编程实验中确定的一个值,是很重要的一个值。用均值代表该“数”,是聚类中心在不断的改变,是算法的要求。
你的问题好犀利,很高兴能有人讨论。
欢迎光临 SAS中文论坛 (http://mysas.net/forum/)
Powered by Discuz! X3.2