SAS中文论坛

 找回密码
 立即注册

扫一扫,访问微社区

楼主: shiyiming
打印 上一主题 下一主题

胡江堂的THINK SAS只写了1就没了下文了啊?

[复制链接]

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
11#
 楼主| 发表于 2010-12-24 01:51:57 | 只看该作者

Re: 胡江堂的THINK SAS只写了1就没了下文了啊?

to jthu
我觉得写得很好啊

你的think in SAS section 2 可以先发在圈子里让SAS同僚们先尝尝鲜嘛
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
12#
 楼主| 发表于 2010-12-24 08:42:27 | 只看该作者

Re: 胡江堂的THINK SAS只写了1就没了下文了啊?

赞同oloolo,真的写的很好。想看抢先版2。
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
13#
 楼主| 发表于 2010-12-24 09:58:44 | 只看该作者

Re: 胡江堂的THINK SAS只写了1就没了下文了啊?

很受启发,mark一下
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
14#
 楼主| 发表于 2010-12-24 18:10:42 | 只看该作者

Re: 胡江堂的THINK SAS只写了1就没了下文了啊?

to oloolo, 这样看来,SAS帮助是个shortcut,尽管仅仅是个shortcut,也是那么的巨大。梳理SAS里面的统计元素,对于统计知识不连续的SASor来说,确实一大福音。这是个NB的想法,当然,这也是个苦差事。料太多,不知道什么时候才能面世。要不先来个简版,试试反应。


学习SAS是个大工程。据我所知,会SAS编程不会统计的人,存在;会统计不会SAS编程的,也大有人在;这些最终反应到实际应用中业务水平的深度和广度上。胆子大的就号称精通,哈哈。

目前,我也在初步规划下以后的方向,业务第一位,统计原理为辅,SAS仅仅是个使用工具。当然也希望能把SAS的运用水平达到一定的度。
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
15#
 楼主| 发表于 2010-12-25 04:10:51 | 只看该作者

Re: 胡江堂的THINK SAS只写了1就没了下文了啊?

作为个人甚至一个小团队来讲,不可能完全梳理SAS/STAT里面的统计算法及其之间的联系,这个工程太庞大了,光是要把那么多材料看完并且消化就是要花十年功夫的努力。想想结构模型,缺失值分析,主成因分析,混合模型,哪一个不是做了博士也才入了皮毛的东西,哪一个不是本身就值得写一个大部头的内容?I.T.Jolliffe经典的PCA那本书就写了500多页,就这还是只覆盖了截止上世纪90年代末的内容,你说要是写个在SAS语言下用PCA工具分析时间序列,分析具备特定内在结构的数据,对eigenvectors做旋转,再加个Kernel PCA,从介绍到程序写个150页不算多吧。就这四个方面也才占SAS/STAT里面内容的十分之一,算法之间的深入联系更是考功夫。光是RKHS和Penalized LS之间的关系就可以写一本书了【这个倒是开辟了用SAS/STAT做特定loss function的SVM的一个蹊径】。

那些说SAS是恐龙的其实走入了一个误区,只专注编程和新方法去了,这就走入了一个误区。毕竟在实业界,就算是IT公司,码农的发展前途也是堪忧的,以业务为核心才是硬道理,无论统计还是编程都是为具体业务服务的,在北美的很多搞技术的老中还没有领会这条精神,当了一辈子统计码农,呵呵。另外,在实业界,对统计分析,要的是稳健,实用和可解释性,而不是新奇,尖端,在实业界这种例子比比皆是。很多R的推手也许忽略了这个,他们倒是要问问自己,有没有真正静下心来把SAS的每一个统计过程都研究透彻了。一味追求新方法而忽视深入挖掘经典方法就是本末倒置,因为新方法都是从经典方法发展而来的。真正理解了经典方法,搞新方法就不是问题。看看斯坦福的hastie,tibshirani,friedman等人的学生,这20年里把经典统计重新犁了一遍,结果搞出来几十种新数据挖掘方法。再比如比如NMF,常用算法之一就是一个基于SVD初始化的ALS,而SVD是PCA的计算核心,所以这些都是可以利用SAS现成的PROC搞出来的,只是一般人觉得很别扭,绕了一大圈。但是没有理解这些联系的人只会一味指责SAS太恐龙,连个PROC NMF都没有之类的,呵呵。当然,我不是说利用SAS能把所有新玩意儿都玩出来,毕竟SAS的自由度还是小了点,比如要在SAS/STAT里面做CART就不是很容易,不过我觉得已经够用了。

关于写书,我目前的策略是依托某一本书籍展开,主要以讲解如何用SAS实现书里面的算法为主线,并且提供一些模拟案例探索算法的优缺点,当然这需要参考很多其他书籍。这样的话工作量就大大降低了,不过仍然不小。也许我选ELEMENTS OF STATISTICAL LEARNING比较失算,这本书是神作巨著啊。另外一本可以依托的书籍是MATRIX METHODS FOR DATA MINING AND PATTERN RECOGNITION,这本比较深入浅出,覆盖的内容也比较少,本身也是用MATLAB讲解基本算法。里面的东西除了TENSOR还有NMF我都搞出来了。TENSOR我原来写过一些代码,太烂了,呵呵。
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
16#
 楼主| 发表于 2010-12-30 16:24:39 | 只看该作者

Re: 胡江堂的THINK SAS只写了1就没了下文了啊?

趁着休假,整了一些。幸亏是一个系列,随写随止。欢迎大伙拍砖:

[url:18geup7f]http://cos.name/2010/12/think-sas-2/[/url:18geup7f]
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
17#
 楼主| 发表于 2010-12-31 23:35:40 | 只看该作者

Re: 胡江堂的THINK SAS只写了1就没了下文了啊?

一年又已过去,拜读完各位大师的牛贴,心情愈发沉重。jthu大师小了猪头十年,却有这么强悍的大局观。oloolo大师说的一切,不仅那些高科技猪头闻未所闻,就连码农的标准也不是猪头所从事的一切所能企及的。似乎每日的劳作,只能让自己离主所望越来越远;每多存活一天,只是为了背下更多的业债。明年的最后一天不能再上这个论坛了。
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
18#
 楼主| 发表于 2011-1-1 15:51:18 | 只看该作者

Re: 胡江堂的THINK SAS只写了1就没了下文了啊?

听老猪的话好伤感啊 <!-- s:cry: --><img src="{SMILIES_PATH}/icon_cry.gif" alt=":cry:" title="Crying or Very sad" /><!-- s:cry: -->
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
19#
 楼主| 发表于 2011-1-1 20:41:32 | 只看该作者

Re: 胡江堂的THINK SAS只写了1就没了下文了啊?

老猪,别这样,  新年新开始!
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
20#
 楼主| 发表于 2011-1-3 12:31:17 | 只看该作者

Re: 胡江堂的THINK SAS只写了1就没了下文了啊?

猪兄言重了
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|手机版|Archiver|SAS中文论坛  

GMT+8, 2025-6-13 18:47 , Processed in 0.076073 second(s), 19 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表