SAS中文论坛

 找回密码
 立即注册

扫一扫,访问微社区

查看: 628|回复: 1
打印 上一主题 下一主题

请教,对于大量数据的抽取

[复制链接]

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
楼主
 楼主| 发表于 2009-8-5 20:01:18 | 只看该作者

请教,对于大量数据的抽取

请教各位,如果一个表每天都会新增几万条数据,那么在对这个表进行抽取的时候有没有什么优化方法,或者是能提高些许效率的办法,谢谢!
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
沙发
 楼主| 发表于 2009-8-7 08:17:30 | 只看该作者

Re: 请教,对于大量数据的抽取

1. assign a sequencial number to the record in your data set (e.g. 100 records);
data myData;
set originalData;
rec=_N_;
run;
2. create a data set which contains the randomly selected records (e.g. 20);
data pickup_rec(drop=i);
do i=1 to 100;
rec=int(100*ranuni(12345)); /*you have to make decision of selection with replacement or without replacement*/
output;
end;
run;
3. merging
proc sql;
create table Result as
select a.* from myData as a, pickup_rec as b;
where a.rec=b.rec
order by a.rec;
quit;
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|手机版|Archiver|SAS中文论坛  

GMT+8, 2026-2-5 21:30 , Processed in 0.091143 second(s), 20 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表