10.1 无监督学习的定义

监督学习：我们有一些列标签，然后用假设函数去拟合它

无监督学习：给出的数据不带任何标签。对于无监督学习来说，需要做的就是将数据输入到算法中，让算法找到一些隐含在数据中的结构，通过图中的这些数据，能通过算法找到一个结果就是这个数据集中的点可以分成两组分开的点集（簇）。这种能分出来的簇的算法被称为聚类算法。

10.2 K-means算法（K均值）

在聚类问题中，会给定一组未加标签的数据集，会希望有一个算法能够自动地将这些数据分成有紧密关系的子集或是簇。K-means算法是比较热门的最为广泛运用的聚类算法。

对于没有标签的数据来说，第一步随机生成两点（下图的红蓝两个×），也叫做聚类中心。随机两点是因为想把下图的数据聚类成两类（首先根据划分聚类的个数，随机设置聚类中心的位置）。然后遍历所有的数据，把每个数据分配到离它最近的坐标，对于同一个簇的数据计算它们坐标的中心位置，并设置为新的聚类中心，以此不断的迭代。

K-means算法接受两个输入，一个是参数K，表示想从数据中聚类出的簇的个数；另一个就是一系列无标签的只用x来表示的数据集，并且约定 $x^{(i)}$ 是一个n维实数向量。

K-means算法步骤：

随机初始化K个聚类中心，记作 $\mu _{1},\mu_{2},...,\mu_{K}\in \mathbb{R}^{n}$
K-means的内循环，簇分配步骤：对每个训练样本，使用变量 $c^{(i)}$ 来表示第1到第K个最接近 $x^{(i)}$ 的聚类中心；移动聚类中心：对于每个聚类中心，也就是对于k=[1,K]， $\mu_{k}$ 就表示这个簇中所有点的均值。

假设有 $x^{(1)},x^{(3)},x^{(5)},x^{(6)}$ ，对应得 $c^{(1)}=c^{(3)}=c^{(5)}=c^{(6)}=2$ ，表示都被分配给了聚类中心2，这个时候要算 $\mu_{2}$ ，就是把 $x^{(1)},x^{(3)},x^{(5)},x^{(6)}$ 相加除以4。得到的结果就是聚类中心2移动的结果。