SAS中文论坛

 找回密码
 立即注册

扫一扫,访问微社区

查看: 1076|回复: 0
打印 上一主题 下一主题

请教几个SAS数据挖掘的基本问题?——关于regression和assessment

[复制链接]

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
楼主
 楼主| 发表于 2008-5-20 01:57:16 | 只看该作者

请教几个SAS数据挖掘的基本问题?——关于regression和assessment

初次用SAS做模型,问一些比较白的问题,请大家不吝赐教。

我在EM里做了个简单的logit模型,

流程:data-->data set attributes-->data partition-->regression-->assessment-->report

其中,partition部分我将数据分为:train 60%, validation 40%。

问题:

1.如果说train data是用来生成模型的,那么validation data和test data用途上有什么区别呢?assessment里应该用哪个data做评估?

2.我知道regression节点会根据回归结果生成一个scored data set,那么这个set是仅包括train data的score还是所有数据的score?我从哪里能看到这些score?

3.运行后report里面说:

Train data set is selected for assessment.
Validation data set is not selected for assessment.

如果要用validation data来做assessment,在哪里可以设置?

看了一下SAS帮助,里面貌似说assessment界面上的options tab可以设置"active data set (training, validation (default), test)",但我打开assessment的options后发现里面全都是阴影字,不让选的。问题出在哪里了呢?
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|手机版|Archiver|SAS中文论坛  

GMT+8, 2026-2-4 18:16 , Processed in 0.089786 second(s), 20 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表