SAS中文论坛

 找回密码
 立即注册

扫一扫,访问微社区

查看: 617|回复: 0
打印 上一主题 下一主题

输入过程的优化

[复制链接]

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
楼主
 楼主| 发表于 2010-10-28 14:58:55 | 只看该作者

输入过程的优化

这是仍然在困扰我的一个数据导入问题,为了避免数值缺失等种种问题,我把一个文件夹中的每个文件用proc import都导入成字符型,然后再改成需要的类型,最后用data步写入到一个文件中。现在问题是这样做每次运行到“data file; set file file1; run; ”这一步的时候就会非常慢,特别是我的数据量还比较大,文件夹中大约有200个左右的数据文件,每个文件包含5w条observations。

请大家帮我看看如何优化这个程序,能使这个过程快一点?谢谢!


我的程序如下:

[code:qcsqoz5d]
data file; run;
filename folder pipe 'dir f:\DATA /b';
data filelist;
infile folder truncover;
input fname $15.;
filename=scan(fname,1,'.');
run;

%macro imp(filename);
proc import datafile="f:\DATA\&filename..tsv" out=file1 dbms=tab replace;
         getnames=no;
     DATAROW=2;
     GUESSINGROWS=1000;
RUN;
data file1;
        date=&filename.;
        set file1;
******************************************************
including some steps to revise the variables
******************************************************;
run;
data file; set file file1; run;  *把每个file1写到一个总file中;
%mend;

data _null_;
        set filelist;
        call execute('%imp('||filename||')');
run;

[/code:qcsqoz5d]
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|手机版|Archiver|SAS中文论坛  

GMT+8, 2026-2-3 20:13 , Processed in 0.068542 second(s), 22 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表