SAS中文论坛
标题:
数据挖掘求助
[打印本页]
作者:
shiyiming
时间:
2008-6-26 20:03
标题:
数据挖掘求助
最近在阅读sas数据挖掘em方面的官方教材。有些问题不懂请教大家。
1.缺失值的处理,一种办法是用平均值代替,或者用众数代替,但这种作法是有偏的,书上介绍了一种加入一个inpute节点然后使用决策树的方法求出缺失值的最佳替代值,看了不懂。书上说是用分类后的叶子来代替的,可是不太懂。
2.sas node最终比较时用sas编程的方法产生了各种图形,能讲解一下吗
3.模型比较的问题:书上说lift图是比较的工具之一,lift值上点越靠左上越好,还有一个eer值可以用着两个图比较,但它们的结论不统一。能讲一下eer图的含义吗sas有一个统一的工具只要比较那一个图形较高或者说那一个围成的面积越大就越好的工具。
能讲一下他的含义吗,那一大堆英语把我弄晕了。
3.如何判别哪个模型好坏,如果一个模型在train和validation上面都一致较好,虽然validation上面的值没有train上面好,是不是可以判断这个模型就是最优的。会不会出现过分拟合。是不是还要用test来判断。
4.能否归纳一下防止神经网络过分拟合的办法
5.能否归纳一下防止决策树过分拟合的办法
6.如何挑选合适的变量,书上说可以用线性回归的逐步回归挑选候选变量,也可以用决策树,用决策树时该如何做。
欢迎光临 SAS中文论坛 (https://mysas.net/forum/)
Powered by Discuz! X3.2