我现在需要根据已有的变量的值,生成新变量的值。例如:
age_code entry_code
A N
A S
B D
B E
B M
B Y
在数据集里,有1000个观测 age_code=A. 我需要按照95%, 5%的比例设置entry_code的值,也就是当age_code=A时,让95%的观测的entry_code=N, 另外5%的观测到entry_Code=S。
类似的,如果有5000个观测 age_code=B ,我就对这些观测按照10%,5%, 20%, 65%的比例让它们的entry_code分别等于D, E, M. Y。