目标:将数据样本划分为若干个通常不相交的“簇”

聚类性能度量

原型聚类

原型=簇中心

K-Means算法

Untitled

一直迭代直至所有的簇的中心不再发生改变,数学上一定能够保证收敛

Untitled

若不知道数据的计算方式,则可更改为K-Medoids算法:将每次迭代中簇的新中心点改为距离中心点最近的样本点

高斯混合聚类 Gaussian Mixture Model (GMM)

采用高斯概率分布来表达聚类原型

密度聚类