weka机器学习-05-聚类

news/2024/11/9 2:10:46/

Weka中使用Cluster标签页来处理聚类问题。
在这里插入图片描述
页面中各项的使用方法与Classify几乎一样。
不同之处:
(1)Cluster标签页左侧Clusterer mode(聚类器模式)选项组中Classes to clusters evaluation(类别作为簇的评估准则):比较所选择的簇与预先指定的数据类别的匹配程度。选项下方有一个下拉列表框,其操作与Classify标签页选择类别属性的操作一样。
Store clusters for visualization(可视化保存簇):选中此复选框,在训练完成后,保存簇以供可视化使用。当处理很大的数据集遇到内存不足的问题时,取消选中此选项可能会有帮助,默认选中。
通常情况下,在聚类过程中可以设置忽略一些数据属性。单击Ignore attributes(忽略属性)按钮,会弹出一个小窗,让用户选择要忽略的属性。
FilteredClusterer元聚类器是一种特殊的聚类器,它为用户提供在聚类器学习之前先应用过滤器的方式。使用这种方法,当不需要再Preprocess标签页中手动应用过滤器时,可以在学习的同时进行数据处理。


http://www.ppmy.cn/news/538958.html

相关文章

香港科大EMBA校友黄立伟冠名两位商学院教授

香港科技大学举行第五届冠名教授席就职典礼,向11位杰出教授颁授冠名教授席及表扬各捐赠者对大学的热心支持。 因应2019冠状病毒的最新发展,使本次就职典礼移至网上举行。香港科大校董会主席廖长城先生和校长史维教授担任就职典礼的主礼嘉宾,各…

一场VR大赛引发的元宇宙“狂飙”

319个团队、480人参赛,第三届华为云VR开发应用大赛盛况空前,而新设立的“人气数字人形象奖”“人气虚拟偶像奖”等,让大赛又一次“破圈”,人气直升。通过大赛,我们看到虚拟现实、数字人、元宇宙等正“脱虚向实”&#…

线性表的详解

目录 1 线性表的定义 2 线性表的逻辑特性 3 线性表的存储结构 4 顺序表 4.1 顺序表的定义 4.2 顺序表的存储 4.3 顺序表的特点 4.4 顺序表的基本操作 (1)初始化顺序表 (2)查找操作 (3)插入操作 …

聚合函数04

一、聚合函数 1、conut() 计数 select cno count(sno) from sc2、sum() 求和 -- 每名学生的总成绩 select cno ,sum(grade) from sc group by cno;3、avg() 求平均值 -- 每名学生的总成绩 select cno ,sum(grade) from sc group by cno;二、分组 1、group by #求某课的选…

高内聚、低耦合

按照惯例,先来个图镇楼(图片源自网络,侵权立删): 高内聚、低耦合是为了解决:接口开发规范,实现可插拔 起因:模块独立性指每个模块只完成系统要求的独立子功能,并且与其他…

高耦合,低内聚

对于编程的一些小伙伴在编程的时候,会发现许多的代码,代码的重复度非常的高,所以对于代码的精简,封装这词应运而生,对于封装,常常使用的就是对功能的封装,封装成一个函数,但是对于一…

聚合

聚合就是指mysql中的 Avg、Sum、Max、… 聚合函数 aggregate()是QuerySet 的一个终止子句,意思是说,它返回一个包含一些键值对的字典。 键的名称是聚合值的标识符,值是计算出来的聚合值。键的名称是按照字段和聚合函数的名称自动生成出来的。…

11.7 聚合函数

11.7 聚合函数 聚合函数是一类对数据库中的数据进行聚合统计的函数。MySQL中提供的聚合函数主要包括COUNT函数、MAX函数、MIN函数、SUM函数和AVG函数。 每个函数的作用不同,COUNT函数可以用来计算符合条件的数据表中的记录条数,MAX函数可以用来计算符合条件的最大值,MIN函…