SPSS K均值聚类算法解析

日期: 栏目:大数据算法 阅读:0
SPSS K均值聚类算法解析

SPSS k-means聚类算法是一种偏模糊性的聚类,最早由加利福尼亚大学贝尔斯利·贝克曼在1966年提出,迄今为止也是最常用的聚类分析算法。SPSS是统计分析软件,它的K-means聚类算法具有很强的稳定性,将K个随机抽取的原始数据点聚成K个聚类,每个聚类都有一个样本点,这些点被称为聚类中心或者均值点。

spss k均值聚类算法的执行步骤大致如下:

1. 选择K个对象,用作聚类中心。

2. 计算每个对象到每个聚类中心的距离,将对象归类到最近的聚类中心。

3.重新计算每一类的聚类中心,根据估计当前距离最小。

4. 迭代重复2~3步,直至满足某一最大化标准即可得到K个聚类簇。

SPSS K均值聚类算法精确地给出了大数据的细节分类,对于文本分类、图像识别和搜索引擎进行文档标记都有很好的效果。它是基于表达式之间的夹角余弦方法进行计算的,它更快,更准确,由于它的可靠性,它值得用户一试。

标签: