如何利用SPSS中的分盒函数将连续数据离散化？

时间：2021-08-03 来源：互联网编辑：宝哥软件园浏览：64次

“盒子法”相信是学过统计学的小伙伴所熟悉的。其主要功能是消除噪声数据，离散处理连续数据。在模型分析开始之前，我们经常需要使用box方法来处理和清理数据。下面小编就带大家一起学习！

操作方法：

图1显示了我们将要装箱的数据。我们会按照每10岁的标准，把年龄一栏框起来。

SPSS中怎么使用分箱功能将连续数据离散

图1:点击“转换”中的“可视化分箱”，进入分箱设置界面。

SPSS中怎么使用分箱功能将连续数据离散

图2:视觉宁滨将“年龄”拉进“要入库的变量”，然后点击“继续”。

SPSS中怎么使用分箱功能将连续数据离散

图3:拉入要入库的变量在图4所示的界面中，我们可以看到有34个要扫描的案例，其中最大变量值为67，最小值为22，也就是说，要入库的数据的年龄在22岁到67岁之间。

我们在“宁滨变量”中填写“年龄组”作为新生成的变量，然后点击“生成分割点”按钮。

SPSS中怎么使用分箱功能将连续数据离散

图4:根据我们对宁滨变量的目的，需要每10岁分组一次，最小的年龄是22岁，所以需要在第一个分界点填写“20”，然后在宽度处填写“10”。这时，点击键盘的Tap键，SPSS会自动生成分界点的值为“5”，如图5所示。

这样，SPSS会自动帮助我们将20到30岁、30到40岁、40到50岁、50到60岁、60到70岁的年龄组分为5组。

SPSS中怎么使用分箱功能将连续数据离散

图5:点击“应用”生成分割点，然后返回“可视化分箱”界面。我们可以在图6中的红色框中看到后续的框间距值。标签栏默认为空，我们可以通过定义来填写，比如将盒子分隔标签设置为20:2。

SPSS中怎么使用分箱功能将连续数据离散

图6:设置自定义标签。最后，点击“确定”按钮开始数据宁滨。宁滨之后的新数据结果如图7所示，并生成了一个新的“年龄组”列。数据的入库也非常正确。例如，年龄为27岁的数据行在标签为2的宁滨中设置正确。

SPSS中怎么使用分箱功能将连续数据离散

图7:以上结果是用IBM SPSS Statistics将演示数据中的年龄指标按照每10岁的标准分为所有教程。以上演示是等距除法，小伙伴可以自己在IBM SPSS Statistics中尝试不等除法。

热门手游排行榜