SAS中文论坛
标题:
统计问题求助
[打印本页]
作者:
shiyiming
时间:
2008-6-26 19:37
标题:
统计问题求助
自己在看一些sas统计的书,有几个问题不懂,请教一下大家。
1。用主成分分析时有良种变量一种是原始的数据,另外一种是减去均值除以标准差的变换后的值。
通常主成分会产生一个个向量。p1=a1*x1+a2*x2+a3*x3 其中x1,x2,x3是变换后的变量,a1,a2,a3是系数,
那么a1,a2,a3都是对应的特征向量吗?如果我有了主成分p1和p2,那么它们是不存在多重共线性的如果我用它作模型的线性拟合的到y=b1*p1+b2*p2那么有什么办法得到y=c1*z1+c2*z2+c3*z3,z1z2z3是最原始的未经过变换的变量呢?即如何得到最终的模型。
2.线性回归如何做回归诊断,是不是vif《10就不存在多重共线性,反之就存在多重共线性。如果dw检验的值符合要求,不存在残擦的一介自相关,就说明残差没问题。一般要作哪些检验可以保证模型的假设满足。
3.聚类分析中如何判别分成几类合适。书上说的我不太明白。p半峰最高值的前一个,p峰值的那一个,好像还要看ccc什么的,不太懂,用的计算距离的方法有什么讲究吗。
4.如果线性回归中遇到多重共享性如何办?比如y=v1*x1+v2*x1^2+c前两个变量之间是平方的关系,如何办。
5.如果聚类分析中遇到大量缺失值有办法吗?(样本聚类,变量值有缺失)
欢迎光临 SAS中文论坛 (https://mysas.net/forum/)
Powered by Discuz! X3.2