SPSS K均值聚类算法解析

日期： 2023-05-13 17:22:38 栏目：大数据算法阅读：0

SPSS k-means聚类算法是一种偏模糊性的聚类，最早由加利福尼亚大学贝尔斯利·贝克曼在1966年提出，迄今为止也是最常用的聚类分析算法。SPSS是统计分析软件，它的K-means聚类算法具有很强的稳定性，将K个随机抽取的原始数据点聚成K个聚类，每个聚类都有一个样本点，这些点被称为聚类中心或者均值点。

spss k均值聚类算法的执行步骤大致如下：

1. 选择K个对象，用作聚类中心。

2. 计算每个对象到每个聚类中心的距离，将对象归类到最近的聚类中心。

3.重新计算每一类的聚类中心，根据估计当前距离最小。

4. 迭代重复2~3步，直至满足某一最大化标准即可得到K个聚类簇。

SPSS K均值聚类算法精确地给出了大数据的细节分类，对于文本分类、图像识别和搜索引擎进行文档标记都有很好的效果。它是基于表达式之间的夹角余弦方法进行计算的，它更快，更准确，由于它的可靠性，它值得用户一试。