有时候我们在使用Python的时候,想进行相关性分析,怎么分析呢,下面来分享一下方法
工具/原料
1
Python
2
相关性分析方法
方法/步骤
1
第一步我们首先需要知道相关性主要有两个方向,一个是正方向一个是负方向,相关性系数是衡量两个变量之间影响程度,如下图所示:
2
第二步下面通过公式计算两个变量之间相关性系数,代码如下:import numpyimport pandasX = [52,19,7,33,2]Y = [162,61,22,100,6]#公式计算#均值XMean = numpy.mean(X)YMean = numpy.mean(Y)#标准差XSD = numpy.std(X)YSD = numpy.std(Y)#z分数ZX = (X-XMean)/XSDZY = (Y-YMean)/YSD#相关系数r = numpy.sum(ZX*ZY)/(len(X))print(r)
3
第三步运行程序,可以得到相关性系数r ,r的值是0.999674,相关性非常高,如下图所示:
4
第四步我们也可以通过numpy的corrcoef方法计算相关性系数,输入代码t=numpy.corrcoef(X,Y)print(t)可以看到X与Y和Y与X的相关性系数,如下图所示:
5
第五步我们也可以通过pandas的corr方法计算相关性系数,代码data = pandas.DataFrame({'X':X,'Y':Y})t2=data.corr()print(t2)得到了相同的结果,如下图所示:
注意事项
如果你觉得这篇对你有用的话,请投一下票
下一篇:如何使用SPSS做线性回归?