SAS中文论坛

 找回密码
 立即注册

扫一扫,访问微社区

查看: 2638|回复: 1
打印 上一主题 下一主题

请教一个dataset option: compress=binary.

[复制链接]

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
楼主
 楼主| 发表于 2011-5-4 16:34:42 | 只看该作者

请教一个dataset option: compress=binary.

背景:原始数据集太大,在读取的时候需要的时间太久,我想把原来目录(rawdata)的一些数据,在另一个目录下(stddata)重新生成一次,在这个过程中把compress=选项加上,减小数据集的大小,从而节约数据的读取时间。
data stddata.dataset1(compress=yes);
    set rawdata.dataset1;
run;
  

我的问题如下:
(1): compress=yes与compress=binary有什么区别?(请用中文阐述)。
(2): 上面的option之后,对数据集里面的数据的值会有什么影响吗?在使用的过程中需要特别注意什么问题 (请用中文阐述)?
(3): 若再加上option: resue=yes|no,对经过compress的数据集的操作,会有什么影响 (请用中文阐述)?

谢谢各位大师的指导。
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
沙发
 楼主| 发表于 2011-5-18 16:32:40 | 只看该作者

Re: 请教一个dataset option: compress=binary.

(1)sas默认用compress=char,就是compress=yes和compress=char的作用一样,就是把连续的字符进行压缩,如aaaa压缩成a*4
(2)对数据没有影响,如果有影响不就有问题了。需要注意的就是你的数据集是什么类型的变量占主导。
(3)reuse就是压缩出来的空间是否可以重用,如果你想把新加的记录加到该压缩文件结尾就用reuse=no,否则用yes。
        如果你对该压缩文件增加或者删除很多记录,reuse=no会浪费很多空间哦。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|手机版|Archiver|SAS中文论坛  

GMT+8, 2025-6-10 09:09 , Processed in 0.096506 second(s), 22 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表