k均值聚类算法考试例题_k means聚类算法实例

news/2024/10/24 1:59:41/

所谓聚类问题,就是给定一个元素集合D,其中每个元素具有n个可观察属性,使用某种算法将D划分成k个子集,要求每个子集内部的元素之间相异度尽可能低,而不同子集的元素相异度尽可能高。其中每个子集叫做一个簇。

与分类不同,分类是示例式学习,要求分类前明确各个类别,并断言每个元素映射到一个类别,而聚类是观察式学习,在聚类前可以不知道类别甚至不给定类别数量,是无监督学习的一种。目前聚类广泛应用于统计学、生物学、数据库技术和市场营销等领域,相应的算法也非常的多。

K-Means算法实例

例:以下是一组用户的年龄数据,将K值定义为2对用户进行聚类。并随机选择16和22作为两个类别的初始质心。

Data_Age = [15,15, 16, 19, 19, 20, 20, 21, 22, 28, 35, 40, 41, 42, 43, 44, 60, 61, 65];

CenterId1 =16, CenterId2 = 22

(1)、计算距离并划分数据

通过计算所有用户的年龄值与初始质心的距离对用户进行第一次分类。计算距离的方法是使用欧式距离。距离值越小表示两个用户间年龄的相似度越高。

第一次迭代:

Data_Age = [15,15, 16, 19, 19, 20, 20, 21, 22,


http://www.ppmy.cn/news/130824.html

相关文章

社区内放自助打印机,赚钱吗?

这几天看到社区投放了2台自助打印机,因为社区是刚需房,孩子普遍都是幼儿园和小学,打印需求量比较大。 小区里本身也有了3家图文印刷店,打印是5毛一张。很多人都加了老板,有要打印的直接发过去,打好了就去拿…

【数据库查询--计算机、电脑系列】--查询价格最高的打印机型号。

分析:涉及到printer这个表 注意**>all 的用法** 在查找最大值时很有用 上代码: select distinct model from printer where price > all (select price from printer )

如何查看打印机ip地址

本方法仅适用于win7 1.点击网络,右击打开,会看到一系列的设备 2.右击EPSON4DE4FD (L565 Series),点击菜单中的属性 3.属性窗口最下方为ip地址 (注:如果打印机的ip是乱码的话,可以点击网络窗口上方的添加…

网上二百多的打印机怎么样

现在市面上的打印机是比较多的,各式各样型号的打印机都有,价格也高低不同,很多人在首次购买打印机时会选择一些价格相对比较便宜的打印机,网上二百多的打印机怎么样呢? 一分价钱一分货,价格相对比较便宜的…

家用打印机费用成本高怎么办?

伴随着人们生活水平的不断提高,在经常有需要打印的学习资料时,为了减少一趟趟去打印店跑,也为了减少去寻找打印店的时间,很多家庭干脆直接买一台家用打印机,可是家用打印机买来没多久就会开始后悔。 虽然一台家用打印…

打印机多少钱一台?购买打印机打印速度快吗

很多人冲动之下会直接购买一台打印机,目的为方便自己打印资料,可是购买打印机后的很多人都会后悔,因为打印机的损耗也是一笔不小的费用,打印机购买后,还需要单独额外购买打印纸、打印墨盒等。 而打印机长时间闲置后&a…

java中人民币的符号怎么打_打印机打印人民币符号¥

1、打印机打印人民币符号¥ 标准字库中的全角字符(双字节)的人民币符号为单羊角符“¥”,编码为“a3 a4”,没有双羊角符。而半角字符(单字节)没有人民币符号,只有美元符号“$”,编码为“0x24”。而实际上人民币符号一般都…

专用打印机的全球与中国市场2022-2028年:技术、参与者、趋势、市场规模及占有率研究报告

报告页数: 150 图表数: 100 报告价格:16800 本文研究全球与中国市场专用打印机的发展现状及未来发展趋势,分别从生产和消费的角度分析专用打印机的主要生产地区、主要消费地区以及主要的生产商。重点分析全球与中国市场的主要厂商产品特点、产品规格、不…