SPSSPRO 5.0
win 7/8/10
示例:为了了解贷款客户的信用程度,评价客户的信用等级,采用信用评级常用的5C(能力,品格 ,担保 ,资本,环境)方法, 说明客户违约的可能性。为了了解贷款客户的信用程度,评价客户的信用等级,采用信用评级常用的5C(能力,品格 ,担保 ,资本,环境)方法, 说明客户违约的可能性。品格:指客户的名誉;能力:指客户的偿还能力;资本:指客户的财务实力和财务状况;担保:指对申请贷款项担保的覆盖程度;环境:指外部经济政策环境对客户的影响
Step1:新建项目;Step2:上传数据;Step3:选择对应数据打开后进行预览,确认无误后点击开始分析;
step4:选择【主成分分析】;step5:查看对应的数据数据格式,【主成分分析】要求输入数据为放入 [定量] 自变量X(变量数≥2)。step6:选择主成分个数(注意:主成分个数的选择,依赖于个人能接受的最大主成分个数,而特征根选择则是根据设定的阈值为界限,以大于该界限对应的主成分个数作为选取的主成分个数,默认为1。)step7:点击【开始分析】,完成全部操作。
输出结果1:KMO检验和Bartlett的检验图表说明: KMO检验的结果显示,KMO的值为0.796,同时,Bartlett球形检验的结果显示,显著性P值为0.000***,水平上呈现显著性,拒绝原假设,即表明各变量间具有相关性,主成分分析的结果是有效的,结果可靠程度为一般。
输出结果2:方差解释表格图表说明: 上表为总方差解释表格,主要是看主成分对于变量解释的贡献率(可以理解为究竟需要多少主成分才能把变量表达为100%),一般都要表达到90%以上才可以,否则就要调整主成分数量。由表可知,前三个主成分累积解释的贡献率达到93.192%(一般情况下大于90%即可),说明使用前三个主成分就能够很好地评价客户的信用等级。
输出结果3:碎石图图表说明: 当折线由陡峭突然变得平稳时,陡峭到平稳对应的因子个数即为参考提取因子个数。由图可知,从第三个主成分开始,主成分的特征根值开始缓慢的下降,且在满足主成分累积解释的贡献率达到90%的情况下,我们可以选择三个主成分。
输出结果4:因子载荷系数表图表说明: 上表为因子载荷系数表,可以分析到每个主成分中隐变量的重要性。 第一个主成分与能力、品格、资本、担保这四个变量的相关程度较大,可以概括为“个人信用品质”;第二个主成分主与环境这一个变量的相关程度较大,可以概括为“外部政策影响”。(注意:因子载荷矩系数表在主成分分析的意义不大)
输出结果5:因子载荷矩阵热力图图表说明:下图为载荷矩阵热力图,可以分析到每个主成分中隐变量的重要性,热力图颜色越深说明相关性越大。第一个主成分与能力、品格、资本、担保这四个变量的相关程度较大,第二个主成分主与环境这一个变量的相关程度较大。(注意:因子载荷矩阵热力图在主成分分析的意义不大)
输出结果6:因子载荷象限分析图表说明:因子载荷图通过将多因子降维成双主成分或者三主成分,通过象限图的方式呈现主成分的空间分布。 如果提取3个主成分时,则呈现三维载荷因子散点图。(注意:因子载荷象限分析在主成分分析的意义不大)。
输出结果7:成分矩阵表图表说明:由上表可得到主成分分析降维后的计算公式:模型的公式:F1=0.249×资本+0.257×能力+0.259×品格+0.253×担保+0.152×环境F2=-0.22×资本-0.28×能力-0.224×品格+0.121×担保+1.014×环境F3=1.164×资本+0.438×能力-0.693×品格-1.096×担保+0.351×环境由上可以得到: F=(0.708/0.932)×F1+(0.164/0.932)×F2+(0.06/0.932)×F3
输出结果8:因子权重分析图表说明: 主成分分析的权重计算结果显示,主成分1的权重为76.007%、主成分2的权重为17.589%、主成分3的权重为6.405%,其中指标权重最大值为主成分1(76.007%),最小值为主成分3(6.405%)。
输出结果9:综合得分表图表说明:由综合得分可知,其中第15位客户的综合得分最高,也就是他的信用等级最高,其次是第75位客户。(注意:综合得分在主成分分析的意义不大)
主成分要求变量之间的共线性或相关关系比较强,否则不能通过KMO检验和Bartlett球形检验;
主成分分析倾向于降维,从而达到简化系统结构,抓住问题实质的目的。(可侧重于输出结果2、输出结果3、输出结果8);
主成分分析时通常需要综合自己的专业知识,以及软件结果进行综合判断,即使是特征根值小于1,也一样可以提取主成分;
KMO值为null不存在可能导致的原因为: (1)样本量过少容易导致相关系数过高,一般希望分析样本量大于5倍分析项个数; (2)各个分析项之间的相关关系过高或过低。