Weka中使用Cluster标签页来处理聚类问题。
页面中各项的使用方法与Classify几乎一样。
不同之处:
(1)Cluster标签页左侧Clusterer mode(聚类器模式)选项组中Classes to clusters evaluation(类别作为簇的评估准则):比较所选择的簇与预先指定的数据类别的匹配程度。选项下方有一个下拉列表框,其操作与Classify标签页选择类别属性的操作一样。
Store clusters for visualization(可视化保存簇):选中此复选框,在训练完成后,保存簇以供可视化使用。当处理很大的数据集遇到内存不足的问题时,取消选中此选项可能会有帮助,默认选中。
通常情况下,在聚类过程中可以设置忽略一些数据属性。单击Ignore attributes(忽略属性)按钮,会弹出一个小窗,让用户选择要忽略的属性。
FilteredClusterer元聚类器是一种特殊的聚类器,它为用户提供在聚类器学习之前先应用过滤器的方式。使用这种方法,当不需要再Preprocess标签页中手动应用过滤器时,可以在学习的同时进行数据处理。