SAS中文论坛

 找回密码
 立即注册

扫一扫,访问微社区

查看: 1580|回复: 2
打印 上一主题 下一主题

请教:数据挖掘中training data、validation data、test data和score data有何

[复制链接]

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
楼主
 楼主| 发表于 2008-1-19 16:06:02 | 只看该作者

请教:数据挖掘中training data、validation data、test data和score data有何

数据挖掘中training data、validation data、test data和score data有何区别
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
沙发
 楼主| 发表于 2008-1-22 17:27:41 | 只看该作者

Re: 请教:数据挖掘中training data、validation data、test data和score data有何

我也是初学。所谓training data就是训练数据,即常说的训练样本,在数据挖掘中,数据描述和挖掘的模型需要这部分数据来产生和验证。validation data 顾名思义,有效数据是经过数据清理之后所得到的数据。test data 和training data 相似,用来验证模型拟合程度。score data,我认为是得分函数操作的数据。寥寥鄙薄言辞,不堪为信,仅供参考。
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
板凳
 楼主| 发表于 2008-1-25 21:33:39 | 只看该作者

Re: 请教:数据挖掘中training data、validation data、test data和score data有何

楼主所说training data大致没错,但顾名思义validation data就偏了。validation data也是在训练中用的,作用有,防止过拟合,选择合适的模型等,在具体的算法中,比如在决策树模型中,也在帮忙生成子树。score data跟上面不同,就是它只有输入没有输出,它的输出由前面的训练模型给出。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|手机版|Archiver|SAS中文论坛  

GMT+8, 2026-2-4 12:15 , Processed in 0.069346 second(s), 20 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表