SAS中文论坛
标题:
连续数据的个数计算
[打印本页]
作者:
shiyiming
时间:
2011-8-16 16:44
标题:
连续数据的个数计算
一组贸易数据
Reporter Partner Product year
1 003 30303 1995
1 004 99284 1995
1 003 30303 1996
1 003 30303 1997
1 003 30303 2000
2 .....................................
2 ...................................
. ....................................................
例如按照Reporter-Partner-Product分组,(1-003-30303)。对于年份连续的,1995,1996和1997,生成新变量“贸易时间=3”。如果数据只为某一年,例如2000,与之前不连续,生成“贸易时间=1”.
数据是从1995到2010年的。所以有可能对于每个分组来说,可能有两个以上的时间段,比如1995-1997是三年连续的,2000是单独一年的,还有可能有2003-2005, 2006-2008等等的数据段,我如果能够把这些都分别表示出来呢?
如何SAS编程?等高手解答。。
作者:
Qiong
时间:
2011-8-23 10:30
标题:
Re: 连续数据的个数计算
[code:2vodcc79]
data v ;
input Reporter Partner Product year ;
cards;
1 003 30303 1995
1 004 99284 1995
1 003 30303 1996
1 003 30303 1997
1 003 30303 2000
1 003 30303 2001
1 003 30303 2003
1 004 99284 1996
1 004 99284 1998
;
proc sort data=v;
by Reporter Partner Product year;
data v;
retain cnt _group 0 ;
set v;
_p1=lag(Reporter);
_p2=lag(Partner);
_p3=lag(Product);
_y=lag(year);
if _p1=Reporter and _p2=Partner and _p3=Product and year-_y=1 then cnt+1;
else do;cnt=1;_group+1;end;
proc sql;
create table v(drop=_:) as select max(cnt) as cnt,*
from v
group by Reporter, Partner, Product ,_group
order by Reporter, Partner, Product ,year;
quit;
proc print;
run;
[/code:2vodcc79]
欢迎光临 SAS中文论坛 (http://mysas.net/forum/)
Powered by Discuz! X3.2