SAS中文论坛

 找回密码
 立即注册

扫一扫,访问微社区

查看: 751|回复: 2
打印 上一主题 下一主题

请教编程问题

[复制链接]

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
楼主
 楼主| 发表于 2006-5-12 22:16:50 | 只看该作者

请教编程问题

一个新的聚类算法。sas中没有可以直接应用的。所以拿到这里向大家请教。
数据如下,是17x4维的一组数,每一行表示一个数,以第一个数(也就是第一行)作为起始数据点,这个数代表这个聚类,顺序取其他各数与该数作欧氏距离运算,如果差值小于4则把这个数与第一个数看为一类,同时取该类内各数的均值作为该类的代表点。以后取到的数与各聚类代表点作距离运算,如果距离小于4,则将该数归入距离最近的那个类中,如果差值大于4则令该数为新的数据点,同时聚类数增加1。然后继续顺序向下取数据。说明:当聚类的数目大于1之后,后面的数据需要与已有聚类都做距离运算,若距离有小于4的则选择并入距离最近的类,否则聚类数加1。
3.2        4.2                8.1        3
2.2        6.3                11.1        4
4.2        8.2                12.0        5
3.0        7.3                9.0        5
5.2        7.3                7.9        4
2.3        6.0                8.8        7
3.3        6.6                12.2        3
3.3        6.7                9.1        9
8.5        5.5                9.1        3
7.6        3.1                8.7        6
4.0        3.1                10.1        3
7.8        3.7                11.3        6
3.2        7.7                3.0        7
9.1        4.6                8.0        3
4.4        4.0                5.5        9
1.5        5.0                2.7        3
7.8        5.5                2.1        1
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
沙发
 楼主| 发表于 2006-5-13 20:51:44 | 只看该作者

明晰

请介绍一下所述聚类规则的实际背景,SAS的系统聚类和变量聚类为什么不适合你的问题,阈值为什么必须是4,用欧氏距离聚类为什么还要改变“数”用均值代表该“数”?
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
板凳
 楼主| 发表于 2006-5-13 22:30:01 | 只看该作者

to wangyushun

这种聚类算法是新见到的,应该说不是sas本身聚类方法不能应用到我的问题中,而是我希望用该新算法来实现聚类。至于阈值我说是4,这样该是在编程实验中确定的一个值,是很重要的一个值。用均值代表该“数”,是聚类中心在不断的改变,是算法的要求。
你的问题好犀利,很高兴能有人讨论。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|手机版|Archiver|SAS中文论坛  

GMT+8, 2025-6-10 05:48 , Processed in 0.067157 second(s), 20 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表