本次我们聚焦算法的部分。这篇论文的算法之所以效果高于其他组别,核心思想就在于:1)从多个角度加权计算了用户之间的相似度;2)根据两两之间的相似度进行了Graph Clustering。最终的效果就是有相同偏好的用户被聚在了同一组,那么既然大家兴趣类似,你喜欢的自然大概率也是我喜欢的。
接下来我们就介绍一些关于Clustering的知识,尤其会详细介绍经典的算法,最后我们再推荐几篇相关的论文。
一、聚类的两种类型
对已知的“点”进行聚类,我们首先要判断这些“点”是建立在什么数学结构上的,一般来说如果这些点存在“类别”,那么用两种结构来描述都是自然的: