python代码实现kmeans对鸢尾花聚类

ops/2024/9/23 7:00:27/

导入第三方库和模型

python">from sklearn import datasets
import numpy as np
import matplotlib.pyplot as plt
from sklearn.cluster import KMeans

2、创建画图函数

python">def draw_result(train_x, labels, cents, title):n_clusters = np.unique(labels).shape[0]#获取类别个数color = ["red", "orange", "yellow"]plt.figure()#创建一个新的图形窗口并开始绘图plt.title(title)for i in range(n_clusters):#range(3)=range(0,3):0,1,2current_data = train_x[labels == i]#把标签一致得所有样本点全拿出来plt.scatter(current_data[:, 0], current_data[:,1], c=color[i])#只显示鸢尾花第一个指标和第二个指标的值plt.scatter(cents[i, 0], cents[i, 1], c="blue", marker="*", s=100)#显示中心的的样本return plt
""" 画出聚类后的图像
labels: 聚类后的label, 从0开始的数字
cents: 质心坐标
n_cluster: 聚类后簇的数量
color: 每一簇的颜色
"""

3、主函数调用kmeans

python">if __name__ == '__main__':iris = datasets.load_iris()#加载鸢尾花数据集iris_x = iris.data#数据部分,不带标签clf = KMeans(n_clusters=3, max_iter=10,n_init=10, init="k-means++",algorithm="full", tol=1e-4,n_jobs= -1,random_state=1)#创建聚类模型clf.fit(iris_x)#把样本150数据全部应用于聚类函数print("SSE = {0}".format(clf.inertia_))#inertia_ 属性表示聚类效果的评估指标,也称为簇内离差平方和(within-cluster sum of squares, WCSS)。它表示每个样本点到其所属簇的质心的距离的总和,该值越小表示样本点越接近于自己的簇中心,聚类效果越好。draw_result(iris_x, clf.labels_, clf.cluster_centers_, "kmeans").show()#plt.show() 显示图形'''iris_x:样本数据clf.labels_聚类聚出来的标签clf.cluster_centers_聚类出来的中心点"kmeans" 画图的标题''' 

在这里插入图片描述

4、算法优缺点

优点

简洁明了,计算复杂度低。 K-means 的原理非常容易理解,整个计算过程与数学推理也不是很困 难。
收敛速度较快。通常经过几个轮次的迭代之后就可以获得还不错的效果。

缺点

结果不稳定。 由于初始值随机设定,以及数据的分布情况,每次学习的结果往往会有一些差异。 无法解决样本不均衡的问题。
对于类别数据量差距较大的情况无法进行判断。 容易收敛到局部最优解。 在局部最优解的时候,迭代无法引起中心点的变化,迭代将结束。
受噪声影响较大。 如果存在一些噪声数据,会影响均值的计算,进而引起聚类的效果偏差。


http://www.ppmy.cn/ops/22917.html

相关文章

web前端学习笔记4

4. 盒子模型 4.0 代码地址 https://gitee.com/qiangge95243611/java118/tree/master/web/day044.1 什么是盒子模型(Box Model) 所有HTML元素可以看作盒子,在CSS中,"box model"这一术语是用来设计和布局时使用。 CSS盒模型本质上是一个盒子,封装周围的HTML元素,…

使用mmdetection来训练自己的数据集(visdrone)(一)

环境: 创建虚拟环境 conda create -n mmdet python3.8 -y安装torch https://pytorch.org/get-started/previous-versions/ pip install torch2.1.0 torchvision0.16.0 torchaudio2.1.0 --index-url https://download.pytorch.org/whl/cu121torch …

OpenHarmony语言基础类库【@ohos.util.HashMap (非线性容器HashMap)】

HashMap底层使用数组链表红黑树的方式实现,查询、插入和删除的效率都很高。HashMap存储内容基于key-value的键值对映射,不能有重复的key,且一个key只能对应一个value。 HashMap和[TreeMap]相比,HashMap依据键的hashCode存取数据&…

Midjourney与waifu2x双剑合璧:完美打造超高清动漫图像

在追求完美的动漫图像时,质量和分辨率是两个关键因素。Midjourney(一个神秘而强大的AI图像生成工具)与waifu2x(一个专门用于放大动漫风格图像的AI工具)的结合使得创造超高清的动漫图像变得触手可及。本文将引导您如何使…

2024.4.28力扣每日一题——负二进制转换

2024.4.28 题目来源我的题解方法一 进制转换方法二 模拟进位 题目来源 力扣每日一题;题序:1017 我的题解 方法一 进制转换 对于以-2为基数的系统,可以这样理解:在-2进制中,每一位的权重是-2的幂。这与传统的二进制表…

Web前端开发之CSS_1

CSS选择器字体属性背景属性文本属性表格属性 1. CSS 1.1 CSS简介 CSS(Cascading Style Sheets)层叠样式表,又叫级联样式表,简称样式表。CSS文件后缀名为 .css 。CSS用于HTML文档中元素样式的定义。使用CSS可以让网页具有美观一致…

linux运行jar

安装Java环境 下载Java安装包 首先,需要从Oracle官网或其他可信渠道下载适用于Linux系统的Java安装包。根据系统架构(32位或64位)选择合适的安装包。 安装Java 下载完成后,通过终端进入安装包所在目录,使用tar命令…

第三部分 Vue讲解(22-25)(代码版)

22.自定义指令 22.1 自定义指令基本语法 22.1.2 自定义指令.vue <template><div id"app"><!-- v-model相当于:value"XXX" input"msgXXX"--><input v-model"msg" type"text"><input :value…