多语言展示
当前在线:1231今日阅读:23今日分享:25

判断异常值方法1:箱型图

箱型图,SPSS,判断异常值
工具/原料

SPSS

方法/步骤
1

箱型图,是利用数据中的五个统计量:最小值、第一四分位数、中位数、第三四分位数与最大值来描述数据的一种方法,它也可以粗略地看出数据是否具有有对称性,分布的分散程度等信息,特别可以用于对几个样本的比较。

2

箱型图无需对数据进行正态分布要求。适用范围广。(判断异常的其他方法比如3西伽马,z分数方法都要求数据服从正态分布。)

3

识别箱型图数据异常值,如下图所示。

4

箱型图SPSS操作步骤:分析→描述统计→探索。

5

绘制图形→茎叶图 不分组 → 选择图形等,如下所示,见标红部分。

6

分析结果如下图所示:异常值显示为对应日期。此样本数据而且服从正态分布。

7

箱型图的局限:1.不能提供关于数据分布偏态和尾重程度的精确度量;2.对于批量比较大的数据批,反应的形状信息更加模糊;3.用中位数代表总体评价水平有一定的局限性;

推荐信息