SAS中文论坛

 找回密码
 立即注册

扫一扫,访问微社区

查看: 681|回复: 1
打印 上一主题 下一主题

有谁知道hash用法?多谢指导!

[复制链接]

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
楼主
 楼主| 发表于 2009-5-11 18:33:22 | 只看该作者

有谁知道hash用法?多谢指导!

假设有两张表:
data user;
input user_id leaf$;
cards;
101 leaf1
102 leaf1
;
run;

data leaf;
input leaf$ age$ cnt;
cards;
leaf1 a 10
leaf1 b 20
leaf1 c 30
;
run;
用SQL过程可以很容易得到如下一个表:

proc sql;
create table out as
select
a.*
,b.age
,b.cnt

from user as a
join leaf as b
on a.leaf=b.leaf
;
quit;

这里涉及到many-to-many的映射,需求就是这样,没有办法,但是如果user表非常大,这种many-to-many的join效率很低下,听说sas的hash方法能解决这个问题,哪位达人能给出方法吗?
诚谢赐教!
回复 支持 反对

使用道具 举报

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
沙发
 楼主| 发表于 2009-5-11 21:40:59 | 只看该作者

Re: 有谁知道hash用法?多谢指导!

去查SUGI,有至少5篇这样的文章,同时参考帮助的appendix..
需要注意的是hash中,key的特征:如果有重复,那么会出现覆盖。换句话说,必须保证key的唯一性。
还有一个就是必须保证足够的内存来保存你的hash table..
32bit win2003, 4G内存;两个各12byte的variable, 当超过25,000,000时,就内存不足。 (尽管理论上不应当如此,但是实际如此~~)。以上仅供参考。。
补充说明:proc SQL引擎会自动选择使用何种方法进行join..其中一种就是hash join..这跟oracle等的编译器也相似。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|手机版|Archiver|SAS中文论坛  

GMT+8, 2026-2-5 14:06 , Processed in 0.088278 second(s), 20 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表