【数据挖掘】Matplotlib

ops/2025/3/3 16:54:16/

Matplotlib 是 Python 最常用的 数据可视化 库之一,在数据挖掘过程中,主要用于 数据探索 (EDA)趋势分析模式识别结果展示


📌 1. Matplotlib 基础

1.1 安装 & 导入

# 如果未安装 Matplotlib,请先安装
# pip install matplotlibimport matplotlib.pyplot as plt
import numpy as np

1.2 基本绘图

x = np.linspace(0, 10, 100)  # 生成 100 个 0-10 之间的等距点
y = np.sin(x)plt.plot(x, y)  # 画图
plt.xlabel("X 轴")  # X 轴标签
plt.ylabel("Y 轴")  # Y 轴标签
plt.title("Sine Wave")  # 图标题
plt.grid(True)  # 添加网格
plt.show()  # 显示图像

📌 输出: 绘制 正弦曲线 📈


📌 2. 常见图表类型

2.1 折线图 (Line Plot)

x = np.arange(1, 11)
y = np.random.randint(10, 100, size=10)plt.plot(x, y, marker="o", linestyle="-", color="b", label="数据趋势")
plt.legend()
plt.show()

📌 适用场景: 用于 趋势分析时间序列数据


2.2 散点图 (Scatter Plot)

x = np.random.rand(50)
y = np.random.rand(50)plt.scatter(x, y, color="g", alpha=0.7)  # 透明度 alpha 控制点的透明度
plt.title("Scatter Plot")
plt.show()

📌 适用场景: 适合用于 关系分析、聚类分析


2.3 柱状图 (Bar Chart)

categories = ["A", "B", "C", "D", "E"]
values = [10, 25, 15, 30, 20]plt.bar(categories, values, color="orange")
plt.title("Bar Chart Example")
plt.show()

📌 适用场景: 适用于 类别数据分析


2.4 直方图 (Histogram)

data = np.random.randn(1000)  # 生成 1000 个随机数plt.hist(data, bins=30, color="purple", alpha=0.75)
plt.title("Histogram Example")
plt.show()

📌 适用场景: 适合 分布分析,如 正态分布检验


2.5 盒须图 (Box Plot)

data = [np.random.rand(100) * i for i in range(1, 5)]plt.boxplot(data, patch_artist=True)
plt.title("Box Plot Example")
plt.show()

📌 适用场景: 适合 异常值分析、数据分布分析


📌 3. 进阶绘图技巧

3.1 子图 (Subplot)

fig, axes = plt.subplots(2, 2, figsize=(10, 8))x = np.linspace(0, 10, 100)
axes[0, 0].plot(x, np.sin(x))
axes[0, 0].set_title("Sine Wave")axes[0, 1].scatter(np.random.rand(50), np.random.rand(50))
axes[0, 1].set_title("Scatter Plot")axes[1, 0].bar(["A", "B", "C"], [10, 20, 30])
axes[1, 0].set_title("Bar Chart")axes[1, 1].hist(np.random.randn(1000), bins=30)
axes[1, 1].set_title("Histogram")plt.tight_layout()  # 自动调整子图间距
plt.show()

📌 适用场景:一个画布上同时绘制多个图表


3.2 统计相关性分析

import seaborn as sns
import pandas as pd# 生成随机数据
df = pd.DataFrame(np.random.rand(10, 4), columns=["A", "B", "C", "D"])# 计算相关性
correlation_matrix = df.corr()# 相关性热图
plt.figure(figsize=(8, 6))
sns.heatmap(correlation_matrix, annot=True, cmap="coolwarm", linewidths=0.5)
plt.title("Correlation Matrix Heatmap")
plt.show()

📌 适用场景: 特征工程、变量相关性分析


3.3 动态更新数据

import timeplt.ion()  # 开启交互模式
fig, ax = plt.subplots()x = []
y = []for i in range(10):x.append(i)y.append(np.random.randint(1, 10))ax.clear()ax.plot(x, y, marker="o", linestyle="-", color="b")plt.pause(0.5)plt.ioff()  # 关闭交互模式
plt.show()

📌 适用场景: 实时数据可视化,如股市走势


📌 4. Matplotlib 在数据挖掘中的应用

数据挖掘任务适用图表
数据探索 (EDA)直方图、盒须图、散点图
趋势分析折线图
相关性分析热图、散点图
异常值检测盒须图
分类数据分析柱状图
数据分布分析直方图

📌 5. 总结

Matplotlib 在数据挖掘中的核心作用: ✅ 数据可视化:帮助理解数据的分布、趋势、相关性
异常值检测:通过箱线图、散点图检测异常点
模式识别:发现数据中的模式或聚类结构
结果展示:清晰直观地展示数据分析和挖掘结果


http://www.ppmy.cn/ops/162818.html

相关文章

网站内容更新后百度排名下降怎么办?有效策略有哪些?

转自 网站内容更新后百度排名下降怎么办?有效策略有哪些? 网站内容更新是促进网站优化的关键环节,但是频繁修改网站内容会对网站的搜索引擎排名造成很大的影响。为了保持网站排名,我们需要采取一些措施来最小化对百度排名的影响。…

计算机毕业设计SpringBoot+Vue.js常规应急物资管理系统(源码+文档+PPT+讲解)

温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 作者简介:Java领…

MybatisPlus详细使用

文章目录 一、Mybatis Plus的使用步骤二、常见注解三、常见配置四、核心功能4.1、条件构造器4.2、自定义sql4.3、Service接口 五、LambdaQueryWrapper常用方法详解 一、Mybatis Plus的使用步骤 1、引入MybatisPlus的起步依赖 MyBatisPlus官方提供了starter,其中集成…

基于Spring Boot的乡村养老服务管理系统设计与实现(LW+源码+讲解)

专注于大学生项目实战开发,讲解,毕业答疑辅导,欢迎高校老师/同行前辈交流合作✌。 技术范围:SpringBoot、Vue、SSM、HLMT、小程序、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、安卓app、大数据、物联网、机器学习等设计与开发。 主要内容:…

Ubuntu下QT安装和调试的常见问题(一)__could_not_dertermine_which_make

前言 Ubuntu下QT的安装会有一些奇怪的问题出现,并没有像Windows下Visual Studio的安装那么直接就可以使用那么方便,本文就“make”挂接的问题,给出一些小的感受。 1、问题的提出 很多问题的解答,AI无论是上文心一言,还…

江协科技/江科大-51单片机入门教程——P[2-2] LED闪烁P[2-3] LED流水灯

本节实现LED周期闪烁和LED流水灯。 目录 一、LED闪烁 二、LED流水灯 一、LED闪烁 首先来实现让一个 LED 以 1 秒为周期闪烁。下面是具体步骤。 首先,新建一个工程,在外面再次新建一个名为 “2 - 2 led 闪烁” 的文件夹,工程名设为 “pro…

Eureka的缓存原理分析

上一篇介绍了Eureka的缓存机制,Eureka的缓存机制就像个"善意的谎言"——它为了让系统更抗压,会悄悄把服务信息藏在小本本里。咱们今天就扒开它的口袋,看看里面到底揣着什么秘密~ 扒开Eureka的缓存小棉袄:源码里的温柔陷…

Android Studio2024版本安装环境SDK、Gradle配置

由于许多学友在看此教程还是出许多错误,特此录制教程👉视频教程 若觉得自己不用看教程,直接往下翻👇 一、软件版本,安装包附上 👉android-studio-2024.1.2.12-windows.exe👈 👉百…