【机器学习】机器学习学习笔记 - 无监督学习 - k-means/均值漂移聚类/凝聚层次聚类/近邻传播聚类 - 05

ops/2025/3/19 13:12:01/

pdf在线免费转word文档 https://orcc.online/pdf

不限次数、免费不需要注册。

无监督学习 (聚类)

  • 聚类是一种无监督学习方法,是将数据划分为若干个簇,使得簇内的点尽可能相似,簇间尽可能不相似。

k-means 聚类

  • k-means 聚类算法是一种迭代算法,它会不断地寻找最佳的 k 值,然后将数据分配到这些簇中。
  • 聚类算法的优点是简单,易于实现,并且对数据维度的要求不高。
from sklearn.cluster import KMeansnum_clusters = 4
kmeans = KMeans(init='k-means++', n_clusters=num_clusters, n_init=10)
kmeans.fit(data)

均值漂移聚类

  • 把数据点的分布看成是概率密度函数, 希望在特征空间中根据函数分布特征找出数据点的"模式"(mode)
  • 优点是不需要事先确定集群的数量
import numpy as np
from sklearn.cluster import MeanShift, estimate_bandwidth# Estimating the bandwidth
# 设置带宽参数 quantile : 0.1 代表数据集中10%的样本作为聚类中心
# n_samples : 样本数
bandwidth = estimate_bandwidth(X, quantile=0.1, n_samples=len(X))# Compute clustering with MeanShift
# bin_seeding : 随机种子
# 随机种子,保证每次聚类结果一致
meanshift_estimator = MeanShift(bandwidth=bandwidth, bin_seeding=True)
meanshift_estimator.fit(X)# 提取标记
labels = meanshift_estimator.labels_
# 聚类中心
centroids = meanshift_estimator.cluster_centers_
num_clusters = len(np.unique(labels))print("Number of clusters in input data =", num_clusters)

凝聚层次聚类

  • 层次聚类算法可以是自下而上的,也可以是自上而下
  • 自下而上: 每个数据点都被看作一个簇,然后将簇进行合并,直到所有簇合并为一个簇
  • 自上而下: 先将所有数据点看作一个簇,然后将簇进行分裂,直到所有簇分裂为一个簇
from sklearn.cluster import AgglomerativeClusteringplt.figure()
model = AgglomerativeClustering(linkage=linkage,connectivity=connectivity, n_clusters=num_clusters)
model.fit(X)# extract labels
labels = model.labels_

近邻传播聚类

  • 找出数据点的相似度,然后根据相似度进行聚类
  • 优点是不需要事先确定簇的数量
from sklearn.cluster import AffinityPropagation# 使用亲和传播聚类算法构建聚类模型
# edge_model.covariance_可以获取到股票之间的协方差矩阵,该矩阵表示了不同股票之间的相关性和波动性
_, labels = cluster.affinity_propagation(edge_model.covariance_)
num_labels = labels.max()# 打印聚类结果
for i in range(num_labels + 1):print("Cluster", i+1, "-->", ', '.join(names[labels == i]))

http://www.ppmy.cn/ops/19934.html

相关文章

css中新型的边框设置属性border-block

border-block 是 CSS 中的一个属性,主要用于在样式表中一次性设置元素的逻辑块向边框的属性值。这个属性是简写属性,可以同时设置 border-block-width、border-block-style 和 border-block-color。其中,border-block-start 用于设置元素的开…

Python项目开发实战:动物分拣器的实现

注意:本文的下载教程,与以下文章的思路有相同点,也有不同点,最终目标只是让读者从多维度去熟练掌握本知识点。 下载教程:Python项目开发实战_动物分拣器的实现_编程案例解析实例详解课程教程.pdf 1、步骤 一、项目背景与目标 在生物研究、动物园管理以及动物保护等领域中…

SpringCloud系列(11)--将微服务注册进Eureka集群

前言:在上一章节中我们介绍并成功搭建了Eureka集群,本章节则介绍如何把微服务注册进Eureka集群,使服务达到高可用的目的 Eureka架构原理图 1、分别修改consumer-order80模块和provider-payment8001模块的application.yml文件,使这…

Java、Android面试高频系列文章合集

本人今年参加了很多面试,也有幸拿到了一些大厂的offer,整理了众多面试资料,后续还会分享众多面试资料。 整理成了面试系列,由于时间有限,每天整理一点,后续会陆续分享出来,感兴趣的朋友可关注收…

ESBMC代码阅读笔记

文档描述 本文档为对ESBMC模型检测工具进行代码阅读随手写的文档,该文档针对工具ESBMC version 7.5.0 64-bit x86_64 linux 的BMC框架进行代码阅读,主要关注其BMC算法框架,数据结构以及如何从BMC得到的中间数据结构进行SMT编码的过程。本文档…

elment-table实现行滚动效果

通过获取dom &#xff0c;来控制表格滚动 <template><div class"scroll_table"><div style"display: inline-block; width: 100%"><el-table:data"tableData"ref"table"borderheight"100%"highlight-c…

OpenCV直方图计算

返回:OpenCV系列文章目录&#xff08;持续更新中......&#xff09; 上一篇&#xff1a;OpenCV实现直方图均衡 下一篇 :OpenCV系列文章目录&#xff08;持续更新中......&#xff09; 在本教程中&#xff0c;您将学习如何&#xff1a; 使用 OpenCV 函数 cv::split 将图像划分…

一则 TCP 缓存超负荷导致的 MySQL 连接中断的案例分析

除了 MySQL 本身之外&#xff0c;如何分析定位其他因素的可能性&#xff1f; 作者&#xff1a;龚唐杰&#xff0c;爱可生 DBA 团队成员&#xff0c;主要负责 MySQL 技术支持&#xff0c;擅长 MySQL、PG、国产数据库。 爱可生开源社区出品&#xff0c;原创内容未经授权不得随意使…