多语言展示
当前在线:126今日阅读:145今日分享:20

【Excel数据挖掘】如何清除离群值(极值)

在数据挖掘之前,我们首先要查看数据并清除掉离群值,离群值就是非常大和非常小的值,这些值可能是因为误差带来的,也可能不是误差,但是因为这些数据很少,不具有代表性,所以就将其删掉,以免影响后面的数据挖掘。下面是清除离群值的方法:在菜单栏上执行:数据挖掘--清除数据--离群值打开了离群值对话框,我们直接点击下一步选择数据源,通常我们选择一个表作为数据源,如图你的表格里数据有很多,只有一部分需要进行清理,可以选择数据区域,点击下一步在这里选择你要清除离群值的列,假如我们要清理收入的离群值,点击下一步输入最大值和最小值,这里你要预先想哪个范围的值是你可以接受的,输入最大值和最小值以后,你会看到图中多出了一些阴影部分,那就是离群值点击下一步,你会看到让你选择如何处理这些离群值,你可以有四个选择,如图所示,这很好理解点击下一步,你会看到要怎样放置新的列,我们有三个选择,通常第一个选项是最常用的,它既可以保留原始数据,又可以产生清除离群值以后的数据,点击完成即可
推荐信息