最近我在“统计之都”贴了一篇假设检验的读书笔记(在[url:6w2cilpn]http://cos.name/2010/11/hypotheses-testing/[/url:6w2cilpn]),统计学的入门知识了,但写出来、解释清楚都觉得不易。啥都是路漫漫啊。按我这速度,要写到你博客里的那些高深算法,5年都打不住。作者: shiyiming 时间: 2010-12-23 07:19 标题: Re: 胡江堂的THINK SAS只写了1就没了下文了啊? Totally agree, that is Mission Impossible
Think about PROC FREQ alone, it covers almost all fields in traditional categorical data analysis. The 700-page classic book Categorical Data Analysis by Agresti goes through the theories behind briefly....A graduate student takes 1-2 semester for this class [that is effectively 4--8 month]
And that is just the tip of iceberg.作者: shiyiming 时间: 2010-12-23 21:44 标题: Re: 胡江堂的THINK SAS只写了1就没了下文了啊? 那为神马SAS要人花那么多时间去搞懂他呢 ?
SAS自己的HELP就是所有算法的集成啊,不过要看的肯定不止是HELP了。SAS的帮助文档里面的细节部分主要是起一个索引介绍的作用,详细了解算法还是要看很多专业书籍才行,另外加上很多年的经验总结才能知道各类算法在具体应用中的效果。其实利用SAS把那些统计知识串起来,基本能把经典的统计融会贯通,学透彻了。我一直在准备写一个SAS COMPANION FOR THE ELEMENTS OF STATISTICAL LEARNING,但是进展太慢了。我目前才搞到第四章,discriminant analysis,时间真不够用。我明年在公司R&D有三个讲座,分别讲PROTOTYPE METHODS,flexible discriminant analysis和SVM,希望能借此加快点进度。
关于写书,我目前的策略是依托某一本书籍展开,主要以讲解如何用SAS实现书里面的算法为主线,并且提供一些模拟案例探索算法的优缺点,当然这需要参考很多其他书籍。这样的话工作量就大大降低了,不过仍然不小。也许我选ELEMENTS OF STATISTICAL LEARNING比较失算,这本书是神作巨著啊。另外一本可以依托的书籍是MATRIX METHODS FOR DATA MINING AND PATTERN RECOGNITION,这本比较深入浅出,覆盖的内容也比较少,本身也是用MATLAB讲解基本算法。里面的东西除了TENSOR还有NMF我都搞出来了。TENSOR我原来写过一些代码,太烂了,呵呵。作者: shiyiming 时间: 2010-12-30 16:24 标题: Re: 胡江堂的THINK SAS只写了1就没了下文了啊? 趁着休假,整了一些。幸亏是一个系列,随写随止。欢迎大伙拍砖: