SAS中文论坛

标题: 请教一个dataset option: compress=binary. [打印本页]

作者: shiyiming    时间: 2011-5-4 16:34
标题: 请教一个dataset option: compress=binary.
背景:原始数据集太大,在读取的时候需要的时间太久,我想把原来目录(rawdata)的一些数据,在另一个目录下(stddata)重新生成一次,在这个过程中把compress=选项加上,减小数据集的大小,从而节约数据的读取时间。
data stddata.dataset1(compress=yes);
    set rawdata.dataset1;
run;
  

我的问题如下:
(1): compress=yes与compress=binary有什么区别?(请用中文阐述)。
(2): 上面的option之后,对数据集里面的数据的值会有什么影响吗?在使用的过程中需要特别注意什么问题 (请用中文阐述)?
(3): 若再加上option: resue=yes|no,对经过compress的数据集的操作,会有什么影响 (请用中文阐述)?

谢谢各位大师的指导。
作者: shiyiming    时间: 2011-5-18 16:32
标题: Re: 请教一个dataset option: compress=binary.
(1)sas默认用compress=char,就是compress=yes和compress=char的作用一样,就是把连续的字符进行压缩,如aaaa压缩成a*4
(2)对数据没有影响,如果有影响不就有问题了。需要注意的就是你的数据集是什么类型的变量占主导。
(3)reuse就是压缩出来的空间是否可以重用,如果你想把新加的记录加到该压缩文件结尾就用reuse=no,否则用yes。
        如果你对该压缩文件增加或者删除很多记录,reuse=no会浪费很多空间哦。




欢迎光临 SAS中文论坛 (http://mysas.net/forum/) Powered by Discuz! X3.2