SAS中文论坛

 找回密码
 立即注册

扫一扫,访问微社区

查看: 992|回复: 8
打印 上一主题 下一主题

数据导入问题

[复制链接]

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
楼主
 楼主| 发表于 2010-10-19 13:19:32 | 只看该作者

数据导入问题

import数据是个大问题啊!!!

我需要导入的数据是tsv格式的,文件名是日期,而数据中不含日期。
即文件名:20060918.tsv,里面数据为var1 var2 ...
我想要导入到SAS后为下列格式
date            var1 var2 ...
20060918

另外,我的文件夹里有几百个这样的tsv文件,日期是不连续的,如何能快速导入?谢谢!
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
沙发
 楼主| 发表于 2010-10-19 15:36:18 | 只看该作者

Re: 数据导入问题

导过CSV的,稍微改了一下,假设文件都在d:\data\test 文件夹下
[code:1r2afbmm]
filename folder pipe 'dir d:\data\test /b';
data filelist;
infile folder truncover;
input fname $15.;
filename=scan(fname,1,'.');
run;

%macro imp(filename);
data ds&filename;
infile "d:\data\test\&filename..tsv" delimiter='09'x dsd firstobs=2;
input var1 var2;
date=&filename.;
run;
%mend;

data _null_;
set filelist;
a=cats('%imp(',filename,')');
file "d:\data\port.txt";
put a;
run;

%include "D:\data\port.txt";
[/code:1r2afbmm]
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
板凳
 楼主| 发表于 2010-10-19 16:04:30 | 只看该作者

Re: 数据导入问题

<!-- s:D --><img src="{SMILIES_PATH}/icon_biggrin.gif" alt=":D" title="Very Happy" /><!-- s:D -->   Thanks a lot!!!

前两部分看明白了,后面data _null_; 之后是什么意思啊?能解释一下么?谢谢啊!
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
地板
 楼主| 发表于 2010-10-19 16:24:16 | 只看该作者

Re: 数据导入问题

这么写就好理解了

[code:fb29c5sd]
data _null_;
set filelist;
call execute('%imp('||filename||')');
run;
[/code:fb29c5sd]
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
5#
 楼主| 发表于 2010-10-26 12:05:06 | 只看该作者

Re: 数据导入问题

to nobodyknows
明白了,这里是把每一个tsv导入后生成一个sas data file。那么我想把文件夹里所有的tsv导入之后生成一个sas data file应该怎么做啊?
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
6#
 楼主| 发表于 2010-10-26 15:20:05 | 只看该作者

Re: 数据导入问题

还有个大问题,我用上述code导入tsv文件时,中间有几个变量有missing value,这样missing value之后的数据导入之后就全乱套了,但是用excel打开看起来是没问题的,这可咋办?
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
7#
 楼主| 发表于 2010-10-26 15:43:12 | 只看该作者

Re: 数据导入问题

如果是想多个文件生成同一个数据集
[code:2h67twsj]
data dsn;
set filelist;
fullname=cats(&quot;d&#58;\data\test\&quot;,fname);
do until(lastobs);
infile temp filevar=fullname  delimiter='09'x  dsd firstobs=2 end=lastobs;
input var1 var2;
output;
end;
keep var1 var2;
run;

[/code:2h67twsj]
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
8#
 楼主| 发表于 2010-10-27 10:07:52 | 只看该作者

Re: 数据导入问题

missing数据的问题解决了,在dsd前面加了一个missover就好了。但是又出现了新问题,如果两行后面几个variables数据相同的话,第二行的数据导入的时候就报error,然后后面这个variables就没被导入。

sigh......问题咋这么多呢,头疼ing......

大虾们有啥比较好的解决方案?
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
9#
 楼主| 发表于 2010-10-27 12:58:16 | 只看该作者

Re: 数据导入问题

最后向大家报告一下我找到的解决方案,把所有的variables按照字符型导入,然后再挨个改成数值型。工作量大增......
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|手机版|Archiver|SAS中文论坛  

GMT+8, 2026-2-3 18:29 , Processed in 0.082925 second(s), 20 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表