Python酷库之旅-第三方库Pandas(116)

目录

一、用法精讲

pandas.DataFrame.to_csv%E5%87%BD%E6%95%B0-toc" style="margin-left:120px;">511、pandas.DataFrame.std方法

511-1、语法

511-2、参数

511-3、功能

511-4、返回值

511-5、说明

511-6、用法

511-6-1、数据准备

511-6-2、代码示例

511-6-3、结果输出

pandas.DataFrame.var%E6%96%B9%E6%B3%95-toc" style="margin-left:120px;">512、pandas.DataFrame.var方法

512-1、语法

512-2、参数

512-3、功能

512-4、返回值

512-5、说明

512-6、用法

512-6-1、数据准备

512-6-2、代码示例

512-6-3、结果输出

pandas.DataFrame.nunique%E6%96%B9%E6%B3%95-toc" style="margin-left:120px;">513、pandas.DataFrame.nunique方法

513-1、语法

513-2、参数

513-3、功能

513-4、返回值

513-5、说明

513-6、用法

513-6-1、数据准备

513-6-2、代码示例

513-6-3、结果输出

pandas.DataFrame.value_counts%E6%96%B9%E6%B3%95-toc" style="margin-left:120px;">514、pandas.DataFrame.value_counts方法

514-1、语法

514-2、参数

514-3、功能

514-4、返回值

514-5、说明

514-6、用法

514-6-1、数据准备

514-6-2、代码示例

514-6-3、结果输出

pandas.DataFrame.add_prefix%E6%96%B9%E6%B3%95-toc" style="margin-left:120px;">515、pandas.DataFrame.add_prefix方法

515-1、语法

515-2、参数

515-3、功能

515-4、返回值

515-5、说明

515-6、用法

515-6-1、数据准备

515-6-2、代码示例

515-6-3、结果输出

二、推荐阅读

1、Python筑基之旅

2、Python函数之旅

3、Python算法之旅

4、Python魔法之旅

5、博客个人主页

一、用法精讲

pandas.DataFrame.to_csv%E5%87%BD%E6%95%B0">511、pandas.DataFrame.std方法
511-1、语法
python">511、pandas.DataFrame.std方法
pandas.DataFrame.std(axis=0, skipna=True, ddof=1, numeric_only=False, **kwargs)
Return sample standard deviation over requested axis.Normalized by N-1 by default. This can be changed using the ddof argument.Parameters:
axis{index (0), columns (1)}
For Series this parameter is unused and defaults to 0.WarningThe behavior of DataFrame.std with axis=None is deprecated, in a future version this will reduce over both axes and return a scalar To retain the old behavior, pass axis=0 (or do not pass axis).skipnabool, default True
Exclude NA/null values. If an entire row/column is NA, the result will be NA.ddofint, default 1
Delta Degrees of Freedom. The divisor used in calculations is N - ddof, where N represents the number of elements.numeric_onlybool, default False
Include only float, int, boolean columns. Not implemented for Series.Returns:
Series or DataFrame (if level specified)
NotesTo have the same behaviour as numpy.std, use ddof=0 (instead of the default ddof=1).
511-2、参数

511-2-1、axis(可选,默认值为0){0 或 'index', 1 或 'columns'},计算标准差的轴,0或'index'表示按列计算标准差,1或'columns'表示按行计算标准差。

511-2-2、skipna(可选,默认值为True)布尔值,是否忽略 NaN 值,如果为True,则在计算标准差时会跳过NaN值。

511-2-3、ddof(可选,默认值为1)整数,delta degrees of freedom,计算标准差时用到的自由度调整,默认值1表示计算样本标准差(n-1),如果设置为0,则计算总体标准差(n)。

511-2-4、numeric_only(可选,默认值为False)布尔值,如果为True,则只计算数值型数据的标准差;如果为False,则会尝试计算所有类型的数据,即使它们不是数值类型(在某些情况下可能会引发错误)。

511-2-5、**kwargs(可选)其他关键字参数,为后续扩展功能做预留。

511-3、功能

        用于计算DataFrame中沿指定轴(行或列)的标准差。

511-4、返回值

        返回一个Series或标量值,表示指定轴上数据的标准差。

511-5、说明

        无

511-6、用法
511-6-1、数据准备
python">无
511-6-2、代码示例
python"># 511、pandas.DataFrame.std方法
import pandas as pd
# 创建一个示例DataFrame
data = {'A': [1, 2, 3, 4, 5],'B': [5, 6, 7, None, 9],'C': [None, None, None, None, None]
}
df = pd.DataFrame(data)
# 计算每列的标准差
std_dev = df.std(axis=0)
print(std_dev)
# 计算每行的标准差
std_dev_rows = df.std(axis=1)
print(std_dev_rows)
511-6-3、结果输出
python"># 511、pandas.DataFrame.std方法
# A    1.581139
# B    1.707825
# C         NaN
# dtype: object
# 0    2.828427
# 1    2.828427
# 2    2.828427
# 3         NaN
# 4    2.828427
# dtype: object
pandas.DataFrame.var%E6%96%B9%E6%B3%95">512、pandas.DataFrame.var方法
512-1、语法
python"># 512、pandas.DataFrame.var方法
pandas.DataFrame.var(axis=0, skipna=True, ddof=1, numeric_only=False, **kwargs)
Return unbiased variance over requested axis.Normalized by N-1 by default. This can be changed using the ddof argument.Parameters:
axis{index (0), columns (1)}
For Series this parameter is unused and defaults to 0.WarningThe behavior of DataFrame.var with axis=None is deprecated, in a future version this will reduce over both axes and return a scalar To retain the old behavior, pass axis=0 (or do not pass axis).skipnabool, default True
Exclude NA/null values. If an entire row/column is NA, the result will be NA.ddofint, default 1
Delta Degrees of Freedom. The divisor used in calculations is N - ddof, where N represents the number of elements.numeric_onlybool, default False
Include only float, int, boolean columns. Not implemented for Series.Returns:
Series or DataFrame (if level specified).
512-2、参数

512-2-1、axis(可选,默认值为0){0 或 'index', 1 或 'columns'},指定计算方差的轴,0或'index'表示按列计算方差(即每一列的数据),1或'columns'表示按行计算方差(即每一行的数据)。

512-2-2、skipna(可选,默认值为True)布尔值,是否忽略缺失值(NaN)。如果设置为True,NaN值将被排除在计算之外;如果为False,如果存在任何NaN值,结果将返回NaN。

512-2-3、ddof(可选,默认值为1)整数,Delta Degrees of Freedom,用于计算方差时的自由度调整。ddof=1表示计算样本方差,ddof=0表示计算总体方差。

512-2-4、numeric_only(可选,默认值为False)布尔值,当设置为True时,仅计算数值类型的列的方差;如果为False,则尝试计算所有可以进行计算的列。

512-2-5、**kwargs(可选)其他可选关键字参数,通常不常用,具体取决于数据框的其他功能。

512-3、功能

        计算DataFrame中指定轴的方差,常用于描述统计分析,方差可以帮助我们理解数据的分散程度。

512-4、返回值

        返回一个Series或DataFrame,如果axis=0(默认),返回每一列的方差,形式为一个Series,索引为每一列的名称;如果axis=1,返回每一行的方差,形式为一个Series,索引为每一行的名称。

512-5、说明

        无

512-6、用法
512-6-1、数据准备
python">无
512-6-2、代码示例
python"># 512、pandas.DataFrame.var方法
import pandas as pd
# 创建一个示例DataFrame
data = {'A': [1, 2, 3, 4],'B': [4, 5, 6, None],'C': [7, 8, 9, 10]
}
df = pd.DataFrame(data)
# 计算每一列的方差
column_variance = df.var(axis=0)
print(column_variance)
# 计算每一行的方差
row_variance = df.var(axis=1)
print(row_variance)
512-6-3、结果输出
python"># 512、pandas.DataFrame.var方法
# A    1.666667
# B    1.000000
# C    1.666667
# dtype: float64
# 0     9.0
# 1     9.0
# 2     9.0
# 3    18.0
# dtype: float64
pandas.DataFrame.nunique%E6%96%B9%E6%B3%95">513、pandas.DataFrame.nunique方法
513-1、语法
python"># 513、pandas.DataFrame.nunique方法
pandas.DataFrame.nunique(axis=0, dropna=True)
Count number of distinct elements in specified axis.Return Series with number of distinct elements. Can ignore NaN values.Parameters:
axis
{0 or ‘index’, 1 or ‘columns’}, default 0
The axis to use. 0 or ‘index’ for row-wise, 1 or ‘columns’ for column-wise.dropna
bool, default True
Don’t include NaN in the counts.Returns:
Series
513-2、参数

513-2-1、axis(可选,默认值为0)整数或字符串,指定计算的轴,0表示按列计算唯一值的数量(返回每一列的唯一值数),1表示按行计算唯一值的数量(返回每一行的唯一值数)。

513-2-2、dropna(可选,默认值为True)布尔值,是否忽略缺失值(NaN)。如果设置为True,NaN值将不计入唯一值的计算;如果为False,则NaN值也会被计算为唯一值之一。

513-3、功能

        计算DataFrame中指定轴的唯一值数量,常用于数据分析以了解数据集中各列或各行的多样性。

513-4、返回值

        返回一个Series或DataFrame,如果axis=0(默认),返回每一列的唯一值数量,形式为一个Series,索引为每一列的名称;如果axis=1,返回每一行的唯一值数量,形式为一个Series,索引为每一行的名称。

513-5、说明

        无

513-6、用法
513-6-1、数据准备
python">无
513-6-2、代码示例
python"># 513、pandas.DataFrame.nunique方法
import pandas as pd
# 创建一个示例DataFrame
data = {'A': [1, 2, 2, 4],'B': [4, 5, 6, None],'C': [7, 7, 9, 10]
}
df = pd.DataFrame(data)
# 计算每一列的唯一值数量
column_unique_counts = df.nunique(axis=0)
print("每一列的唯一值数量:\n", column_unique_counts)
# 计算每一行的唯一值数量
row_unique_counts = df.nunique(axis=1)
print("每一行的唯一值数量:\n", row_unique_counts)
513-6-3、结果输出
python"># 513、pandas.DataFrame.nunique方法
# 每一列的唯一值数量:
#  A    3
# B    3
# C    3
# dtype: int64
# 每一行的唯一值数量:
#  0    3
# 1    3
# 2    3
# 3    2
# dtype: int64
pandas.DataFrame.value_counts%E6%96%B9%E6%B3%95">514、pandas.DataFrame.value_counts方法
514-1、语法
python"># 514、pandas.DataFrame.value_counts方法
pandas.DataFrame.value_counts(subset=None, normalize=False, sort=True, ascending=False, dropna=True)
Return a Series containing the frequency of each distinct row in the Dataframe.Parameters:
subsetlabel or list of labels, optional
Columns to use when counting unique combinations.normalizebool, default False
Return proportions rather than frequencies.sortbool, default True
Sort by frequencies when True. Sort by DataFrame column values when False.ascendingbool, default False
Sort in ascending order.dropnabool, default True
Don’t include counts of rows that contain NA values.New in version 1.3.0.Returns:
Series
514-2、参数

514-2-1、subset(可选,默认值为None)指定用于计算的列名列表,如果指定了此参数,则只计算这些列的唯一值组合的计数。

514-2-2、normalize(可选,默认值为False)布尔值,如果设置为True,则返回每个唯一值的相对频率(即出现次数占总数的比例),而不是绝对计数。

514-2-3、sort(可选,默认值为True)布尔值,是否对结果进行排序,如果设置为True,结果将按计数从高到低排序。

514-2-4、ascending(可选,默认值为False)布尔值,指定排序顺序,True表示升序排序,False表示降序排序。

514-2-5、dropna(可选,默认值为True)布尔值,是否忽略缺失值(NaN)。如果设置为True,缺失值不会被计算;如果为False,缺失值将被当作一个单独的计数。

514-3、功能

        计算指定列(或多个列)中每个唯一值的出现次数,常用于了解分类数据的分布情况,帮助进行数据探索和清理。

514-4、返回值

        返回一个Series,索引为唯一值或唯一值的组合(如果使用了多个列),值为每个唯一值的计数。索引按照计数排序(如果sort=True),并且可以根据ascending参数指定排序方式。

514-5、说明

        无

514-6、用法
514-6-1、数据准备
python">无
514-6-2、代码示例
python"># 514、pandas.DataFrame.value_counts方法
import pandas as pd
# 创建一个示例DataFrame
data = {'Fruit': ['Apple', 'Banana', 'Apple', 'Orange', 'Banana', None],'Color': ['Red', 'Yellow', 'Green', 'Orange', 'Yellow', None]
}
df = pd.DataFrame(data)
# 计算'Fruit'列各唯一值的计数
fruit_counts = df['Fruit'].value_counts()
print("Fruit列各唯一值的计数:\n", fruit_counts)
# 计算'Fruit'列各唯一值的相对频率
fruit_relative_counts = df['Fruit'].value_counts(normalize=True)
print("\nFruit列各唯一值的相对频率:\n", fruit_relative_counts)
# 计算'Fruit'和'Color'列的唯一值组合计数
combo_counts = df.value_counts(subset=['Fruit', 'Color'])
print("\nFruit和Color列的唯一值组合计数:\n", combo_counts)
514-6-3、结果输出
python"># 514、pandas.DataFrame.value_counts方法
# Fruit列各唯一值的计数:
#  Fruit
# Apple     2
# Banana    2
# Orange    1
# Name: count, dtype: int64
# 
# Fruit列各唯一值的相对频率:
#  Fruit
# Apple     0.4
# Banana    0.4
# Orange    0.2
# Name: proportion, dtype: float64
# 
# Fruit和Color列的唯一值组合计数:
#  Fruit   Color 
# Banana  Yellow    2
# Apple   Green     1
#         Red       1
# Orange  Orange    1
# Name: count, dtype: int64
pandas.DataFrame.add_prefix%E6%96%B9%E6%B3%95">515、pandas.DataFrame.add_prefix方法
515-1、语法
python"># 515、pandas.DataFrame.add_prefix方法
pandas.DataFrame.add_prefix(prefix, axis=None)
Prefix labels with string prefix.For Series, the row labels are prefixed. For DataFrame, the column labels are prefixed.Parameters:
prefixstr
The string to add before each label.axis{0 or ‘index’, 1 or ‘columns’, None}, default None
Axis to add prefix onNew in version 2.0.0.Returns:
Series or DataFrame
New Series or DataFrame with updated labels.
515-2、参数

515-2-1、prefix(必须)字符串,指定要添加的前缀字符串。

515-2-2、axis(可选,默认值为None){0 或 'index', 1 或 'columns'},指定计算方差的轴,0或'index'表示按列计算方差(即每一列的数据),1或'columns'表示按行计算方差(即每一行的数据)。

515-3、功能

        用于为DataFrame的列或索引添加前缀,以便更容易区分数据的来源或含义。

515-4、返回值

        返回一个新的DataFrame,列或索引名称带有指定的前缀。

515-5、说明

        无

515-6、用法
515-6-1、数据准备
python">无
515-6-2、代码示例
python"># 515、pandas.DataFrame.add_prefix方法
import pandas as pd
# 创建示例DataFrame
data = {'A': [1, 2], 'B': [3, 4]}
df = pd.DataFrame(data)
# 在列上添加前缀
df_with_prefix = df.add_prefix('prefix_')
print(df_with_prefix)
515-6-3、结果输出
python"># 515、pandas.DataFrame.add_prefix方法
#    prefix_A  prefix_B
# 0         1         3
# 1         2         4

二、推荐阅读

1、Python筑基之旅
2、Python函数之旅
3、Python算法之旅
4、Python魔法之旅
5、博客个人主页

http://www.ppmy.cn/devtools/109852.html

相关文章

AI工具(不断更新)

AI工具 一、腾讯混元模型 https://yuanqi.tencent.com/agent-shop 腾讯元器,各种各样的agent 可以创建智能体agent,拿公司的规章制度去喂养,打造企业智能客服。 二、阿里通义千问 三、百度文心一言 四、文生图 五、文生视频 智谱&…

初识Verilog HDL其一

VerilogHDL是一种硬件描述语言,以文本形式来描述数字系统硬件的结构和行为的语言,用它可以表示逻辑电路图、逻辑表达式,还可以表示数字逻辑系统所完成的逻辑功能。 1.1 Verilog基础语法 1.11 逻辑值 0: 逻辑低电平,条件为假&am…

flutter开发多端平台应用的探索 上(基本操作)

前言 Flutter 是一个跨平台的开发框架,它允许开发者使用相同的代码库来构建 iOS、Android、Web 和桌面应用程序。 最近想了想,自己一直在用flutter开发特定端的应用,但是对于其他端的端特性case,如桌面端的菜单、多窗口、鼠标事…

学期计划大二上

项目方面: 等打完icpc再翻下数据再决定走哪个方向 算法方面: 感觉自己的代码能力还是不够,明明思路已经很清晰了代码还是写的很慢,所以在赛场上一直没有当键盘手的勇气,这也导致了赛场上的失利,我觉得我的…

计算机毕业设计选题推荐-果蔬生产溯源管理系统-Java/Python

✨作者主页:IT毕设梦工厂✨ 个人简介:曾从事计算机专业培训教学,擅长Java、Python、微信小程序、Golang、安卓Android等项目实战。接项目定制开发、代码讲解、答辩教学、文档编写、降重等。 ☑文末获取源码☑ 精彩专栏推荐⬇⬇⬇ Java项目 Py…

React 通用后台管理项目

React 通用后台管理项目 项目介绍 本项目是基于React的通用后台管理系统,整体系统有数据可视化展示,数据基本的增删改查功能。项目使用 Create React App创建,主语言为JavaScript。在使用React框架过程中通过hook进行页面逻辑编写。后端接口…

GitHub Copilot Issue in Visual Studio Code “Status Ready (disabled)“

I’m facing an issue with GitHub Copilot in Visual Studio Code, where it’s not suggesting any code. Even though it says “enabled globally” in the extensions tab settings, the icon in the status bar has a diagonal line through it. When I click on the ico…

【西电电装实习】3. SMT

前言 西电电装实习 定义 SMT,全称为Surface Mount Technology,即表面贴装技术。 是一种将电子元器件直接贴装在印刷电路板(PCB)表面的工艺。 与传统的插针式组装方法相比,SMT技术具有更高的组装密度、更小的电子产品…

手撕Python之文件操作

1.编码 编码---encode() 解码---decode() #编码(encode):将我们能够识别的文字,转换为计算机能够识别的内容 print(你好.encode())#默认utf-8 #b\xe4\xbd\xa0\xe5\xa5\xbd #将你好翻成进制数#解码(decode):将计算机能识别的内容&#xff0c…

NestJS中使用Guard实现路由保护

NestJS中Guard是一种用于保护路由的机制。它可以在路由处理之前执行一些逻辑,例如验证用户身份、检查权限等。 什么是Guard? Guard是一个实现了CanActivate接口的类。它可以在路由处理之前执行一些逻辑,例如验证用户身份、检查权限等。如果…

深度学习速通系列:LoRA微调是什么

LoRA微调(Low-Rank Adaptation)是一种用于大型预训练语言模型(LLM)的高效微调技术。它的核心思想是在不改变预训练模型权重的前提下,通过在模型的Transformer层中引入可训练的低秩矩阵来实现模型的微调。这种方法可以显…

第二百一十六节 JSF教程 - JSF基本标签、JSF表单文本框示例

JSF教程 - JSF基本标签 JSF提供了一个标准的HTML标签库&#xff0c;它们被渲染成相应的html输出。 为了使用这些标签&#xff0c;我们需要在html节点中使用以下URI的命名空间。 <html xmlns"http://www.w3.org/1999/xhtml" xmlns:h"http://java.sun.com/js…

[STM32 HAL库]课程

[STM32 HAL库]课程介绍&#xff0c;最佳教程&#xff0c;没有之一~_哔哩哔哩_bilibili

【MADRL】多智能体近端策略优化(MAPPO)算法

本篇文章是博主强化学习RL领域学习时&#xff0c;用于个人学习、研究或者欣赏使用&#xff0c;并基于博主对相关等领域的一些理解而记录的学习摘录和笔记&#xff0c;若有不当和侵权之处&#xff0c;指出后将会立即改正&#xff0c;还望谅解。文章分类在强化学习专栏&#xff1…

数据结构知识点——常用的函数

一维向量和二维向量 一维 vector<int> a; //声明一个一个向量a vector<int> a(10);//大小为10的向量 vector<int> a(10,1);//长度为10且每个值是1 vector<int> b(a);//向量a初始化向量b vector<int> b(a.begin(),a,begin3);//将a中第一个到第三…

2025年【DevOps】相关技术论文题目参考,50个,总有一个是你需要的

DevOps 基于DevOps的持续集成与部署&#xff08;CI/CD&#xff09;系统的开发基于DevOps的自动化测试框架的实现基于DevOps的微服务监控与日志分析系统的开发基于DevOps的跨平台应用部署系统的实现基于DevOps的云原生应用开发框架的开发基于DevOps的自动化测试工具的实现基于D…

【C++11 ——— 类的新功能】

C11 ——— 类的新功能 类的新功能默认成员函数类成员变量初始化强制生成默认函数的关键字default禁止生成默认函数的关键字delete 类的新功能 默认成员函数 原来C类中&#xff0c;有6个默认成员函数&#xff1a; 构造函数析构函数拷贝构造函数拷贝赋值重载取地址重载const …

11.Java基础概念-ArrayList

欢迎来到我的博客&#xff0c;很高兴能够在这里和您见面&#xff01;希望您在这里可以感受到一份轻松愉快的氛围&#xff0c;不仅可以获得有趣的内容和知识&#xff0c;也可以畅所欲言、分享您的想法和见解。 Facts speak louder than words&#xff01; ArrayList是Java中的一…

嵌入式 面试单片机面试题目分析和答案 IIC总线 IIC协议 SPI总线 I2C协议讲解 SPI和IIC协议对比比较SPI的工作模式比较 IIC基本概念讲解

IIC总线协议 高位先行。MSB在前 iic总线介绍 总线就是SDA和SCL两根 SDA为什么上拉电阻开漏输出 可以多个主机、每个 设备通过唯一的7位地址辨别通信&#xff0c; 多主机总线&#xff0c;主机有权发起和结束一次通信&#xff0c;从机只能被呼叫、每个器件都可以作为主机也…

CentOS文件和目录命令

CentOS文件和目录命令 在CentOS上&#xff0c;文件和目录是操作系统的核心部分&#xff0c;掌握其基本操作是使用Linux的第一步。文件系统是Linux用户和系统进行交互的主要方式&#xff0c;理解文件和目录的管理对于执行各种操作至关重要。以下是CentOS中与文件和目录相关的主…