SPSS k-means聚类算法是一种偏模糊性的聚类,最早由加利福尼亚大学贝尔斯利·贝克曼在1966年提出,迄今为止也是最常用的聚类分析算法。SPSS是统计分析软件,它的K-means聚类算法具有很强的稳定性,将K个随机抽取的原始数据点聚成K个聚类,每个聚类都有一个样本点,这些点被称为聚类中心或者均值点。
spss k均值聚类算法的执行步骤大致如下:
1. 选择K个对象,用作聚类中心。
2. 计算每个对象到每个聚类中心的距离,将对象归类到最近的聚类中心。
3.重新计算每一类的聚类中心,根据估计当前距离最小。
4. 迭代重复2~3步,直至满足某一最大化标准即可得到K个聚类簇。
SPSS K均值聚类算法精确地给出了大数据的细节分类,对于文本分类、图像识别和搜索引擎进行文档标记都有很好的效果。它是基于表达式之间的夹角余弦方法进行计算的,它更快,更准确,由于它的可靠性,它值得用户一试。