solution

K聚类算法

过程

  1. 随机选取k个样本作为聚类中心
  2. 计算各个样本与各个聚类之间的欧式距离
  3. 将各样本回归于预知最近的聚类中心
  4. 求各个类之间的样本的均值,作为新的聚类中心。(通过求误差平方和的方式)
  5. 判定:若类中心不再发生变动或达到迭代次数,算法结束,否则回到第二步

定K——随意定质心——计算点心距离——回归聚类中心——计算新聚类中心——判定

原理

在合理范围内,使得误差平方和最小或者组内平方和最小

K值

可以使用手肘法(The Elbow Method):

在合理范围内,对WCSS组内平方和生成的图像进行选点

K设置的越大,样本划分越细致,每个聚类聚合程度越高,WCSS组内平方和越小

K设置的越小,样本划分越梳离,每个聚类聚合程度越低,WCSS组内平方和越大

截屏2022-05-28 00.34.36.png

要求