图解机器学习/第十四章 聚类

聚类是无监督机器学习方法的一种。

K均值聚类

K均值聚类的算法流程:

  1. 给各个簇中心$\mu_1,\dots,\mu_c$以适当的初值

  2. 更新样本$x_1,\dots,x_n$对应的簇标签$y_1,\dots,y_n$

  3. 更新各个簇中心$\mu_1,\dots,\mu_c$

    上式中,$n_y$为属于簇$y$的样本总数

  4. 直到簇标签达到收敛精度为止,重复上述2、3步的计算。

Read More