(七)机器学习 - 散点图

server/2024/12/16 3:04:26/

散点图(Scatter Plot)是一种用于展示两个变量之间关系的图表类型。它通过在二维平面上绘制点来表示数据的分布情况,每个点的横坐标(x轴)和纵坐标(y轴)分别对应数据集中的两个变量的值。散点图的主要目的是观察和分析两个变量之间是否存在某种相关性,例如正相关、负相关或无相关。

 

散点图的一些关键特点: 

  1. 数据点:每个数据点在图表上的位置由其对应的两个变量值决定。

  2. 变量关系:通过观察数据点的分布模式,可以判断两个变量之间是否存在相关性。如果数据点大致沿着一条直线分布,这可能表明两个变量之间存在线性关系。

  3. 趋势和模式:散点图可以揭示数据的趋势和模式,如点的分布是否集中、分散,是否存在聚集区域或异常值。

  4. 正相关和负相关

    • 正相关:如果一个变量的值增加时,另一个变量的值也倾向于增加,这种关系称为正相关。
    • 负相关:如果一个变量的值增加时,另一个变量的值倾向于减少,这种关系称为负相关。
  5. 无相关:如果数据点在图表上随机分布,没有明显的模式,这可能表明两个变量之间没有明显的相关性。

  6. 异常值:散点图可以直观地显示异常值,即那些与其他数据点明显偏离的点。

  7. 多变量分析:在三维空间中,可以使用三维散点图来展示三个变量之间的关系。

1、使用Python 的Matplotlib 模块绘制散点图:

// 它需要两个长度相同的数组,一个数组用于 x 轴的值,另一个数组用于 y 轴的值
import matplotlib.pyplot as pltx = [5,7,8,7,2,17,2,9,4,11,12,9,6]
y = [99,86,87,88,111,86,103,87,94,78,77,85,86]plt.scatter(x, y)
plt.show()

结果:

 

2、随机数据分布 

机器学习中,数据集可以包含成千上万甚至数百万个值。

测试算法时,您可能没有真实的数据,您可能必须使用随机生成的值。

实例:

创建两个数组,它们都填充有来自正态数据分布的 1000 个随机数。

第一个数组的平均值设置为 5.0,标准差为 1.0。

第二个数组的平均值设置为 10.0,标准差为 2.0:

// 有 1000 个点的散点图:
import numpy
import matplotlib.pyplot as pltx = numpy.random.normal(5.0, 1.0, 1000)
y = numpy.random.normal(10.0, 2.0, 1000)plt.scatter(x, y)
plt.show()

结果: 

 

散点图在各个领域中都有广泛的应用,包括经济学、社会学、生物学、工程学和医学等,它们是探索变量之间关系的重要工具。通过散点图,研究者可以直观地观察数据的分布特征,为进一步的统计分析提供初步的线索。 

END. 


http://www.ppmy.cn/server/150512.html

相关文章

ansible自动化运维(一)简介及清单,模块

相关文章ansible自动化运维(二)playbook模式详解-CSDN博客ansible自动化运维(三)jinja2模板&&roles角色管理-CSDN博客ansible自动化运维(四)运维实战-CSDN博客 ansible自动化运维工具 1.什么是自…

汽车保养系统+ssm

摘 要 由于APP软件在开发以及运营上面所需成本较高,而用户手机需要安装各种APP软件,因此占用用户过多的手机存储空间,导致用户手机运行缓慢,体验度比较差,进而导致用户会卸载非必要的APP,倒逼管理者必须改…

故障013:易忘的NULL表达式

故障013:易忘的NULL表达式 一、问题引入二、探索之路2.1 数据准备2.2 回顾NULL表达式2.3 重现问题2.3.1 分析原因2.3.2 如何化解预期? 三、知识总结 一、问题引入 某单位开发人员理直气壮抛出一张截图,以红色醒目地标记问题,好似…

Redis02 SpringBoot整合Redis

使用方式 1.创建boot项目引入Web(Spring Web)NoSQl(Spring Data Redis(AccessDriver)) 2.修改配置文件 spring:redis:host: 127.0.0.1port: 6379password: 123456lettuce:pool:max-active: 8 #最大连接max-idle: 8 #最大空闲连接min-idle: 0 #最小空闲连接max-wait: 1000ms #…

vscode免密ssh登录ubantu 配置ubantu静态ip

1.vscode免密ssh登录ubantu 1、windows创建秘钥, 有秘钥就不用创建 ssh-keygen -t rsa2、将id_rsa.pub文件内的内容追加到ubantu的authorized_keys即可 2.配置ubantu静态ip 之前ubantu一直用的是动态ip,ubantu的ip变一次我就要从新配置一次ssh十分…

Python 程序与 Java 系统集成:通过 FastAPI 实现 HTTP 接口

要将你的 Python 程序封装为一个 API 服务,使得前后端 Java 系统能够通过 HTTP 调用,你可以使用 FastAPI 框架来实现。这是一个现代的、快速的 Web 框架,特别适合用于构建 APIs。FastAPI 支持自动生成 OpenAPI 文档,且性能非常高&…

linux下的posix信号量

目录 引言 信号量背景知识 PV操作 信号量接口 基于环形队列的PC模型 代码实现 demo模型 具体实现 引言 在多线程编程领域,同步机制是确保数据一致性和避免竞态条件的关键技术。Linux操作系统作为开源软件的杰出代表,提供了多种同步原语&#xf…

scala的Array

特性 类型安全:Scala 中的数组是类型安全的,这意味着一旦声明了数组的类型,就只能存储该类型的元素。 大小固定:数组的大小在创建时确定,之后不能改变。 零索引:Scala 数组与 Java 数组一样,都…