Pandas库:从入门到应用(四)--数学函数

news/2024/11/16 2:58:28/
一、测试数据
import numpy as np
import pandas as pd## 5行3列 0到100的数据
df = pd.DataFrame(data=np.random.randint(0, 100, size=(5, 3)))
df

在这里插入图片描述

二、基础聚合函数
2.1、count()函数
df.count()  # 统计每列的行数(非空),默认axis=0
df.count(axis=1) # 统计每行的列数(非空)

在这里插入图片描述

2.2、max()与min()函数
df.max()  # 默认求在每一列中不同行之间的最大值
df.min()  # 默认求在每一列中不同行之间的最小值df.max(axis=1) # 默认求在每一行中不同列之间的最大值
df.min(axis=1) # 默认求在每一行中不同列之间的最小值

在这里插入图片描述

在这里插入图片描述

2.3、median() 中位数
df.median()  # 求每列中位数
df.median(axis = 1)  # 求每行中位数

在这里插入图片描述

2.4、sum() 求和
df.sum()  # 求每列和
df.sum(axis=1) #求每行和
df.values.sum()  # 求所有元素的和

在这里插入图片描述

2.5、mean() 求平均值
df.mean() # 求每列平均值
df.mean(axis=1) # 求每行平均值

在这里插入图片描述

2.6、value_counts() 统计元素出现次数
df[1].value_counts()  # 统计第1列元素出现次数
##添加参数 normalize=True
df[1].value_counts(normalize=True)  # 统计元素出现占比

在这里插入图片描述

2.7、cumsum() 累加
df.cumsum()  # 累加 默认axis = 0 是列

在这里插入图片描述

2.8、cumprod() 累乘
df.cumprod()  # 累乘 默认axis = 0 是列

在这里插入图片描述

三、高阶函数
  • ​ 方差:
    • ​ 当数据分布比较分散(即数据在平均数附近波动较大)时,各个数据与平均数的差的平方和较大,方差就较大;
    • ​ 当数据分布比较集中时,各个数据与平均数的差的平方和较小。
    • ​ 因此方差越大,数据的波动越大;方差越小数据的波动就越小
  • ​ 标准差
    • ​ 标准差 = 方差的算术平方根
3.1、var()方差
df.var()  # 方差
df.var(axis = 1)  # 方差

在这里插入图片描述

3.2、std()标准差
df.std()  # 标准差
df.std(axis = 1)  # 标准差

在这里插入图片描述

  • ​ 协方差
  • ​ 两组数值中每对变量的偏差乘积的平均值
  • ​ 协方差>0 : 表式两组变量正相关
    • ​ 如果两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值时另外一个也大于自身的期望值,那么两个变量之间的协方差就是正值;
  • ​ 协方差<0 : 表式两组变量负相关
    • ​ 如果两个变量的变化趋势相反,即其中一个变量大于自身的期望值时另外一个却小于自身的期望值,那么两个变量之间的协方差就是负值。
  • ​ 协方差=0 : 表式两组变量不相关
3.3、cov() 协方差
df.cov()  # 协方差
df[0].cov(df[1])   # 第0列和第1列的协方差

在这里插入图片描述

  • 相关系数r
  • 相关系数 = X与Y的协方差 / (X的标准差 * Y的标准差)
  • 相关系数值的范围在-1和+1之间
  • r>0为正相关,r<0为负相关。r=0表示不相关
  • r 的绝对值越大,相关程度越高
3.4、corr() 所有特征相关系数
df.corr()  # 所有特征相关系数
df.corrwith(df[2])  # 单一特征相关系数

在这里插入图片描述


http://www.ppmy.cn/news/977756.html

相关文章

Pytorch个人学习记录总结 06

目录 神经网络-卷积层 torch.nn.Conv2d 神经网络-最大池化的使用 torch.nn.MaxPool2d 神经网络-卷积层 torch.nn.Conv2d torch.nn.Conv2d的官方文档地址 CLASS torch.nn.Conv2d(in_channels, out_channels, kernel_size, stride1, padding0, dilation1, groups1, biasTrue,…

面试算法题

1 使用栈实现队列 #include <iostream> #include <stack> class MyQueue { public:MyQueue() {}void push(int x){in.push(x); // 直接将元素push入in栈}int pop(){int data peek(); // 先查一遍&#xff0c;就是更新一遍out栈out.pop();return data;}// 查找队…

linux 驱动开发常用知识点与API

linux 驱动开发常用知识点与API 前言笔记正文最后 前言 之前的读书笔记&#xff0c;以.c 文件的方式记录&#xff0c;在这里也以代码的方式记录 笔记正文 /***************************************中断常用API****************************************/ /* flags 是中断处…

Transformer+医学图像最新进展【2023】

Transformer主要用于自然语言处理领域。近年来,它在计算机视觉(CV)领域得到了广泛的应用。医学图像分析(MIA,Medical image analysis)作为机器视觉(CV,Computer Vision)的一个重要分支,也极大地受益于这一最先进的技术。 机构:新加坡国立大学机械工程系、中山大学智能系…

php套用Iframe访问导致cookie跨域session失效问题

一.背景 a网站&#xff08;www.aa.com&#xff09;嵌入b网站 (www.bb.com) 网站&#xff0c;因为跨域原因&#xff0c;其实如果b网站是以aa.com后缀结尾的话是正常的 二.博客参考 https://juejin.cn/post/7123652955282079751 1.上面的试了这个IE的没什么用&#xff08;有可能…

AI Chat 设计模式:9. 命令模式

本文是该系列的第九篇&#xff0c;采用问答式的方式展开&#xff0c;问题由我提出&#xff0c;答案由 Chat AI 作出&#xff0c;灰色背景的文字则主要是我的一些思考和补充。 问题列表 Q.1 介绍下命令模式A.1Q.2 详细说说命令模式适用于啥场景呢A.2Q.3 举一个命令模式的例子&a…

linux LVM磁盘管理

Linux运维过程中经常会遇到扩容的场景&#xff0c;下面做一点简单笔记&#xff0c;所谓好记性不如烂笔头。 1、新建磁盘挂载 &#xff08;1&#xff09;先看看主机上有没有挂载磁盘或挂载的磁盘有没有剩余的。 如下图可以看到这台机器挂了两个盘&#xff0c;一个/dev/sda,这…

Form Generator 扩展子表单组件之表单校验(超详细)

一、form-generator是什么?✨ ⭐️ 🌟 form-generator的作者是这样介绍的:Element UI表单设计及代码生成器,可将生成的代码直接运行在基于Element的vue项目中;也可导出JSON表单,使用配套的解析器将JSON解析成真实的表单。 但目前它提供的组件并不能满足我们在项目中的…