SAS中文论坛

标题: 连续数据的个数计算 [打印本页]

作者: shiyiming    时间: 2011-8-16 16:44
标题: 连续数据的个数计算
一组贸易数据
Reporter Partner Product       year
1                003      30303      1995
1                004      99284      1995
1                003       30303     1996
1                003      30303      1997
1                003      30303      2000
2                .....................................
2                ...................................
. ....................................................
例如按照Reporter-Partner-Product分组,(1-003-30303)。对于年份连续的,1995,1996和1997,生成新变量“贸易时间=3”。如果数据只为某一年,例如2000,与之前不连续,生成“贸易时间=1”.
数据是从1995到2010年的。所以有可能对于每个分组来说,可能有两个以上的时间段,比如1995-1997是三年连续的,2000是单独一年的,还有可能有2003-2005, 2006-2008等等的数据段,我如果能够把这些都分别表示出来呢?
如何SAS编程?等高手解答。。
作者: Qiong    时间: 2011-8-23 10:30
标题: Re: 连续数据的个数计算
[code:2vodcc79]
data v  ;
input Reporter Partner Product year ;
cards;
1 003 30303 1995
1 004 99284 1995
1 003 30303 1996
1 003 30303 1997
1 003 30303 2000
1 003 30303 2001
1 003 30303 2003
1 004 99284 1996
1 004 99284 1998
;
proc sort data=v;
by Reporter Partner Product year;
data v;
retain cnt _group 0 ;
set v;
_p1=lag(Reporter);
_p2=lag(Partner);
_p3=lag(Product);
_y=lag(year);
if _p1=Reporter and _p2=Partner and _p3=Product and year-_y=1 then  cnt+1;
else  do;cnt=1;_group+1;end;  
proc sql;
create table v(drop=_:) as select max(cnt) as cnt,*
from v
group by  Reporter, Partner, Product ,_group
order by   Reporter, Partner, Product ,year;
quit;
proc print;
run;
[/code:2vodcc79]




欢迎光临 SAS中文论坛 (http://mysas.net/forum/) Powered by Discuz! X3.2