标题: 关于merge by name的问题 [打印本页] 作者: shiyiming 时间: 2009-11-8 22:02 标题: 关于merge by name的问题 我有两组数据需要merge by name,但是问题是两组数据中的name不太一样,比如一组里面是abc corporation,另一组的名字是abc corp. 类似这样的情况,我试图用substr提取前三位比较,但是发现有些公司名字差别要到10位以后,而有些公司名字用缩写才3个字母。还一个比较大的问题是,一组名字是用的大写,另一组名字是用的小写,请问有没有什么好办法merge?作者: shiyiming 时间: 2009-11-9 10:59 标题: Re: 关于merge by name的问题 我简化一下我的问题吧。我已经用upcase把所有名字改成了大写,并用compress把名字中的空格去掉了。
比如:
dataset1-name: 3M, American Standard Com, Consolidated edison com
而相对应的dataset2里面
dataset2-name: 3M Corp, American Standard Inc, Consolidated edison inc