Python酷库之旅-第三方库Pandas(116)

目录

一、用法精讲

pandas.DataFrame.to_csv%E5%87%BD%E6%95%B0-toc" style="margin-left:120px;">511、pandas.DataFrame.std方法

511-1、语法

511-2、参数

511-3、功能

511-4、返回值

511-5、说明

511-6、用法

511-6-1、数据准备

511-6-2、代码示例

511-6-3、结果输出

pandas.DataFrame.var%E6%96%B9%E6%B3%95-toc" style="margin-left:120px;">512、pandas.DataFrame.var方法

512-1、语法

512-2、参数

512-3、功能

512-4、返回值

512-5、说明

512-6、用法

512-6-1、数据准备

512-6-2、代码示例

512-6-3、结果输出

pandas.DataFrame.nunique%E6%96%B9%E6%B3%95-toc" style="margin-left:120px;">513、pandas.DataFrame.nunique方法

513-1、语法

513-2、参数

513-3、功能

513-4、返回值

513-5、说明

513-6、用法

513-6-1、数据准备

513-6-2、代码示例

513-6-3、结果输出

pandas.DataFrame.value_counts%E6%96%B9%E6%B3%95-toc" style="margin-left:120px;">514、pandas.DataFrame.value_counts方法

514-1、语法

514-2、参数

514-3、功能

514-4、返回值

514-5、说明

514-6、用法

514-6-1、数据准备

514-6-2、代码示例

514-6-3、结果输出

pandas.DataFrame.add_prefix%E6%96%B9%E6%B3%95-toc" style="margin-left:120px;">515、pandas.DataFrame.add_prefix方法

515-1、语法

515-2、参数

515-3、功能

515-4、返回值

515-5、说明

515-6、用法

515-6-1、数据准备

515-6-2、代码示例

515-6-3、结果输出

二、推荐阅读

1、Python筑基之旅

2、Python函数之旅

3、Python算法之旅

4、Python魔法之旅

5、博客个人主页

一、用法精讲

pandas.DataFrame.to_csv%E5%87%BD%E6%95%B0">511、pandas.DataFrame.std方法
511-1、语法
python">511、pandas.DataFrame.std方法
pandas.DataFrame.std(axis=0, skipna=True, ddof=1, numeric_only=False, **kwargs)
Return sample standard deviation over requested axis.Normalized by N-1 by default. This can be changed using the ddof argument.Parameters:
axis{index (0), columns (1)}
For Series this parameter is unused and defaults to 0.WarningThe behavior of DataFrame.std with axis=None is deprecated, in a future version this will reduce over both axes and return a scalar To retain the old behavior, pass axis=0 (or do not pass axis).skipnabool, default True
Exclude NA/null values. If an entire row/column is NA, the result will be NA.ddofint, default 1
Delta Degrees of Freedom. The divisor used in calculations is N - ddof, where N represents the number of elements.numeric_onlybool, default False
Include only float, int, boolean columns. Not implemented for Series.Returns:
Series or DataFrame (if level specified)
NotesTo have the same behaviour as numpy.std, use ddof=0 (instead of the default ddof=1).
511-2、参数

511-2-1、axis(可选,默认值为0){0 或 'index', 1 或 'columns'},计算标准差的轴,0或'index'表示按列计算标准差,1或'columns'表示按行计算标准差。

511-2-2、skipna(可选,默认值为True)布尔值,是否忽略 NaN 值,如果为True,则在计算标准差时会跳过NaN值。

511-2-3、ddof(可选,默认值为1)整数,delta degrees of freedom,计算标准差时用到的自由度调整,默认值1表示计算样本标准差(n-1),如果设置为0,则计算总体标准差(n)。

511-2-4、numeric_only(可选,默认值为False)布尔值,如果为True,则只计算数值型数据的标准差;如果为False,则会尝试计算所有类型的数据,即使它们不是数值类型(在某些情况下可能会引发错误)。

511-2-5、**kwargs(可选)其他关键字参数,为后续扩展功能做预留。

511-3、功能

        用于计算DataFrame中沿指定轴(行或列)的标准差。

511-4、返回值

        返回一个Series或标量值,表示指定轴上数据的标准差。

511-5、说明

        无

511-6、用法
511-6-1、数据准备
python">无
511-6-2、代码示例
python"># 511、pandas.DataFrame.std方法
import pandas as pd
# 创建一个示例DataFrame
data = {'A': [1, 2, 3, 4, 5],'B': [5, 6, 7, None, 9],'C': [None, None, None, None, None]
}
df = pd.DataFrame(data)
# 计算每列的标准差
std_dev = df.std(axis=0)
print(std_dev)
# 计算每行的标准差
std_dev_rows = df.std(axis=1)
print(std_dev_rows)
511-6-3、结果输出
python"># 511、pandas.DataFrame.std方法
# A    1.581139
# B    1.707825
# C         NaN
# dtype: object
# 0    2.828427
# 1    2.828427
# 2    2.828427
# 3         NaN
# 4    2.828427
# dtype: object
pandas.DataFrame.var%E6%96%B9%E6%B3%95">512、pandas.DataFrame.var方法
512-1、语法
python"># 512、pandas.DataFrame.var方法
pandas.DataFrame.var(axis=0, skipna=True, ddof=1, numeric_only=False, **kwargs)
Return unbiased variance over requested axis.Normalized by N-1 by default. This can be changed using the ddof argument.Parameters:
axis{index (0), columns (1)}
For Series this parameter is unused and defaults to 0.WarningThe behavior of DataFrame.var with axis=None is deprecated, in a future version this will reduce over both axes and return a scalar To retain the old behavior, pass axis=0 (or do not pass axis).skipnabool, default True
Exclude NA/null values. If an entire row/column is NA, the result will be NA.ddofint, default 1
Delta Degrees of Freedom. The divisor used in calculations is N - ddof, where N represents the number of elements.numeric_onlybool, default False
Include only float, int, boolean columns. Not implemented for Series.Returns:
Series or DataFrame (if level specified).
512-2、参数

512-2-1、axis(可选,默认值为0){0 或 'index', 1 或 'columns'},指定计算方差的轴,0或'index'表示按列计算方差(即每一列的数据),1或'columns'表示按行计算方差(即每一行的数据)。

512-2-2、skipna(可选,默认值为True)布尔值,是否忽略缺失值(NaN)。如果设置为True,NaN值将被排除在计算之外;如果为False,如果存在任何NaN值,结果将返回NaN。

512-2-3、ddof(可选,默认值为1)整数,Delta Degrees of Freedom,用于计算方差时的自由度调整。ddof=1表示计算样本方差,ddof=0表示计算总体方差。

512-2-4、numeric_only(可选,默认值为False)布尔值,当设置为True时,仅计算数值类型的列的方差;如果为False,则尝试计算所有可以进行计算的列。

512-2-5、**kwargs(可选)其他可选关键字参数,通常不常用,具体取决于数据框的其他功能。

512-3、功能

        计算DataFrame中指定轴的方差,常用于描述统计分析,方差可以帮助我们理解数据的分散程度。

512-4、返回值

        返回一个Series或DataFrame,如果axis=0(默认),返回每一列的方差,形式为一个Series,索引为每一列的名称;如果axis=1,返回每一行的方差,形式为一个Series,索引为每一行的名称。

512-5、说明

        无

512-6、用法
512-6-1、数据准备
python">无
512-6-2、代码示例
python"># 512、pandas.DataFrame.var方法
import pandas as pd
# 创建一个示例DataFrame
data = {'A': [1, 2, 3, 4],'B': [4, 5, 6, None],'C': [7, 8, 9, 10]
}
df = pd.DataFrame(data)
# 计算每一列的方差
column_variance = df.var(axis=0)
print(column_variance)
# 计算每一行的方差
row_variance = df.var(axis=1)
print(row_variance)
512-6-3、结果输出
python"># 512、pandas.DataFrame.var方法
# A    1.666667
# B    1.000000
# C    1.666667
# dtype: float64
# 0     9.0
# 1     9.0
# 2     9.0
# 3    18.0
# dtype: float64
pandas.DataFrame.nunique%E6%96%B9%E6%B3%95">513、pandas.DataFrame.nunique方法
513-1、语法
python"># 513、pandas.DataFrame.nunique方法
pandas.DataFrame.nunique(axis=0, dropna=True)
Count number of distinct elements in specified axis.Return Series with number of distinct elements. Can ignore NaN values.Parameters:
axis
{0 or ‘index’, 1 or ‘columns’}, default 0
The axis to use. 0 or ‘index’ for row-wise, 1 or ‘columns’ for column-wise.dropna
bool, default True
Don’t include NaN in the counts.Returns:
Series
513-2、参数

513-2-1、axis(可选,默认值为0)整数或字符串,指定计算的轴,0表示按列计算唯一值的数量(返回每一列的唯一值数),1表示按行计算唯一值的数量(返回每一行的唯一值数)。

513-2-2、dropna(可选,默认值为True)布尔值,是否忽略缺失值(NaN)。如果设置为True,NaN值将不计入唯一值的计算;如果为False,则NaN值也会被计算为唯一值之一。

513-3、功能

        计算DataFrame中指定轴的唯一值数量,常用于数据分析以了解数据集中各列或各行的多样性。

513-4、返回值

        返回一个Series或DataFrame,如果axis=0(默认),返回每一列的唯一值数量,形式为一个Series,索引为每一列的名称;如果axis=1,返回每一行的唯一值数量,形式为一个Series,索引为每一行的名称。

513-5、说明

        无

513-6、用法
513-6-1、数据准备
python">无
513-6-2、代码示例
python"># 513、pandas.DataFrame.nunique方法
import pandas as pd
# 创建一个示例DataFrame
data = {'A': [1, 2, 2, 4],'B': [4, 5, 6, None],'C': [7, 7, 9, 10]
}
df = pd.DataFrame(data)
# 计算每一列的唯一值数量
column_unique_counts = df.nunique(axis=0)
print("每一列的唯一值数量:\n", column_unique_counts)
# 计算每一行的唯一值数量
row_unique_counts = df.nunique(axis=1)
print("每一行的唯一值数量:\n", row_unique_counts)
513-6-3、结果输出
python"># 513、pandas.DataFrame.nunique方法
# 每一列的唯一值数量:
#  A    3
# B    3
# C    3
# dtype: int64
# 每一行的唯一值数量:
#  0    3
# 1    3
# 2    3
# 3    2
# dtype: int64
pandas.DataFrame.value_counts%E6%96%B9%E6%B3%95">514、pandas.DataFrame.value_counts方法
514-1、语法
python"># 514、pandas.DataFrame.value_counts方法
pandas.DataFrame.value_counts(subset=None, normalize=False, sort=True, ascending=False, dropna=True)
Return a Series containing the frequency of each distinct row in the Dataframe.Parameters:
subsetlabel or list of labels, optional
Columns to use when counting unique combinations.normalizebool, default False
Return proportions rather than frequencies.sortbool, default True
Sort by frequencies when True. Sort by DataFrame column values when False.ascendingbool, default False
Sort in ascending order.dropnabool, default True
Don’t include counts of rows that contain NA values.New in version 1.3.0.Returns:
Series
514-2、参数

514-2-1、subset(可选,默认值为None)指定用于计算的列名列表,如果指定了此参数,则只计算这些列的唯一值组合的计数。

514-2-2、normalize(可选,默认值为False)布尔值,如果设置为True,则返回每个唯一值的相对频率(即出现次数占总数的比例),而不是绝对计数。

514-2-3、sort(可选,默认值为True)布尔值,是否对结果进行排序,如果设置为True,结果将按计数从高到低排序。

514-2-4、ascending(可选,默认值为False)布尔值,指定排序顺序,True表示升序排序,False表示降序排序。

514-2-5、dropna(可选,默认值为True)布尔值,是否忽略缺失值(NaN)。如果设置为True,缺失值不会被计算;如果为False,缺失值将被当作一个单独的计数。

514-3、功能

        计算指定列(或多个列)中每个唯一值的出现次数,常用于了解分类数据的分布情况,帮助进行数据探索和清理。

514-4、返回值

        返回一个Series,索引为唯一值或唯一值的组合(如果使用了多个列),值为每个唯一值的计数。索引按照计数排序(如果sort=True),并且可以根据ascending参数指定排序方式。

514-5、说明

        无

514-6、用法
514-6-1、数据准备
python">无
514-6-2、代码示例
python"># 514、pandas.DataFrame.value_counts方法
import pandas as pd
# 创建一个示例DataFrame
data = {'Fruit': ['Apple', 'Banana', 'Apple', 'Orange', 'Banana', None],'Color': ['Red', 'Yellow', 'Green', 'Orange', 'Yellow', None]
}
df = pd.DataFrame(data)
# 计算'Fruit'列各唯一值的计数
fruit_counts = df['Fruit'].value_counts()
print("Fruit列各唯一值的计数:\n", fruit_counts)
# 计算'Fruit'列各唯一值的相对频率
fruit_relative_counts = df['Fruit'].value_counts(normalize=True)
print("\nFruit列各唯一值的相对频率:\n", fruit_relative_counts)
# 计算'Fruit'和'Color'列的唯一值组合计数
combo_counts = df.value_counts(subset=['Fruit', 'Color'])
print("\nFruit和Color列的唯一值组合计数:\n", combo_counts)
514-6-3、结果输出
python"># 514、pandas.DataFrame.value_counts方法
# Fruit列各唯一值的计数:
#  Fruit
# Apple     2
# Banana    2
# Orange    1
# Name: count, dtype: int64
# 
# Fruit列各唯一值的相对频率:
#  Fruit
# Apple     0.4
# Banana    0.4
# Orange    0.2
# Name: proportion, dtype: float64
# 
# Fruit和Color列的唯一值组合计数:
#  Fruit   Color 
# Banana  Yellow    2
# Apple   Green     1
#         Red       1
# Orange  Orange    1
# Name: count, dtype: int64
pandas.DataFrame.add_prefix%E6%96%B9%E6%B3%95">515、pandas.DataFrame.add_prefix方法
515-1、语法
python"># 515、pandas.DataFrame.add_prefix方法
pandas.DataFrame.add_prefix(prefix, axis=None)
Prefix labels with string prefix.For Series, the row labels are prefixed. For DataFrame, the column labels are prefixed.Parameters:
prefixstr
The string to add before each label.axis{0 or ‘index’, 1 or ‘columns’, None}, default None
Axis to add prefix onNew in version 2.0.0.Returns:
Series or DataFrame
New Series or DataFrame with updated labels.
515-2、参数

515-2-1、prefix(必须)字符串,指定要添加的前缀字符串。

515-2-2、axis(可选,默认值为None){0 或 'index', 1 或 'columns'},指定计算方差的轴,0或'index'表示按列计算方差(即每一列的数据),1或'columns'表示按行计算方差(即每一行的数据)。

515-3、功能

        用于为DataFrame的列或索引添加前缀,以便更容易区分数据的来源或含义。

515-4、返回值

        返回一个新的DataFrame,列或索引名称带有指定的前缀。

515-5、说明

        无

515-6、用法
515-6-1、数据准备
python">无
515-6-2、代码示例
python"># 515、pandas.DataFrame.add_prefix方法
import pandas as pd
# 创建示例DataFrame
data = {'A': [1, 2], 'B': [3, 4]}
df = pd.DataFrame(data)
# 在列上添加前缀
df_with_prefix = df.add_prefix('prefix_')
print(df_with_prefix)
515-6-3、结果输出
python"># 515、pandas.DataFrame.add_prefix方法
#    prefix_A  prefix_B
# 0         1         3
# 1         2         4

二、推荐阅读

1、Python筑基之旅
2、Python函数之旅
3、Python算法之旅
4、Python魔法之旅
5、博客个人主页

http://www.ppmy.cn/news/1524889.html

相关文章

Element UI入门笔记(个人向)

Element UI入门笔记 将页面分割为一级菜单、二级菜单、导航栏三个部分;使用npm下载安装,使用语句npm i element-ui -s; 布局组件 el-form 用于创建和管理表单;从属性上看: :model:用于双向数据绑定,将表单…

3C电子胶黏剂在手机制造方面有哪些关键的应用

3C电子胶黏剂在手机制造方面有哪些关键的应用 3C电子胶黏剂在手机制造中扮演着至关重要的角色,其应用广泛且细致,覆盖了手机内部组件的多个层面,确保了设备的可靠性和性能。以下是电子胶在手机制造中的关键应用: 手机主板用胶&…

Android Framework(五)WMS-窗口显示流程——窗口布局与绘制显示

文章目录 relayoutWindow流程概览应用端处理——ViewRootImpl::setView -> relayoutWindowViewRootImpl::setViewViewRootImpl::performTraversalsViewRootImpl::relayoutWindow Surface的创建WindowManagerService::relayoutWindow了解容器类型和Buff类型的SurfaceBuff类型…

调接口某个属性信息为null

1、问题描述 通过feign调用别的系统接口,发现有个属性,获取的值始终是null。 找接口提供方,提供方自测接口,是有返回值的。 2、问题排查 接口调用过程如图: (1)接口提供方开发接口test (2) …

【渗透测试】——DVWA靶场搭建

📖 前言:DVWA(Damn Vulnerable Web Application)是一个用于安全漏洞测试的 PHP/MySQL 网络应用,旨在为安全专业人士提供一个合法的环境,以测试他们的技能和工具,同时帮助 Web 开发者更好地理解 …

【UI】element ui table(表格)expand实现点击一行展开功能

文章目录 前言涉及知识点:代码部分隐藏小箭头总结 前言 element ui是一个非常不错的vue的UI框架,element对table进行了封装,简化了vue对表格的渲染。 element ui表格中有一个功能是展开行,在2.0版本官网例子中,只可以…

斯坦福研究人员探讨大型语言模型在社交网络生成中的应用及其在政治同质性上的偏见

社交网络生成在许多领域有着广泛的应用,比如流行病建模、社交媒体模拟以及理解社交现象如两极化等。当由于隐私问题或其他限制无法直接观察真实网络时,创建逼真的社交网络就显得尤为重要。这些生成的网络对于在这些情况下准确建模互动和预测结果至关重要…

相机光学(三十七)——自动对焦原理

1.自动对焦的三种方式 目前在手机上采用的自动对焦系统包括反差对焦、相位对焦和激光对焦三种方案,下面我们来看一下它们的工作原理和相互之间的区别是什么。 1.1反差对焦【CDAF】- Contrast Detection Auto Focus 反差对焦是目前普及率最高、使用最广泛、成本相对…

透视表支持自定义聚合公式,新增字体管理功能,DataEase开源BI工具v2.10 LTS版本发布

2024年9月9日,人人可用的开源BI工具DataEase正式发布v2.10 LTS(Long Term Support)版本。DataEase开源项目组将对v2.10 LTS版本提供长期支持,定期迭代发布小版本,持续进行问题修复更新并针对部分功能进行优化。欢迎广大…

谋算中的因果与归纳不同于计算中的因果与归纳

谋算中的因果与归纳不同于计算中的因果与归纳。计算中的因果与归纳是基于已有的数据和信息,通过数学运算和逻辑推理得出结论。而谋算中的因果与归纳则是基于对未来的预测和判断,通过分析和推理得出结论。因此,谋算中的因果与归纳需要更多的主…

rsync+inotify 实现数据实时同步

Rsync(远程同步,Remote Sync)是一款开源的、快速的、多功能的、可实现全量及增量的本地或远程数据同步备份的优秀工具,并且可以不进行改变原有数据的属性信息,实现数据的备份迁移特性。Rsync软件适用于unix/linux/windows等多种操…

铭顺元宇宙时代到来,数字人应用案例分享

近年来,随着技术的不断发展,数字人的功能和表现力也在不断提升,形形色色的虚拟数字人正代替真人,扮演着代言人、主播、客服和智能助理的角色,涉及文旅、电商、金融等多个行业。作为随着AI技术在数字人产业中的发展&…

<数据集>二维码识别数据集<目标检测>

数据集格式:VOCYOLO格式 图片数量:1601张 标注数量(xml文件个数):1601 标注数量(txt文件个数):1601 标注类别数:1 标注类别名称:[QR] 序号类别名称图片数框数1QR16016286 使用标注工具:l…

供方软件供应链安全保障要求及开源场景对照自评表(上)

国标《信息安全技术 软件供应链安全要求》确立了软件供应链安全目标,规定了软件供应链安全风险管理要求和供需双方的组织管理和供应活动管理安全要求。 开源软件供应链作为软件供应链的一种特殊形式,该国标亦适用于指导开源软件供应链中的供需双方开展组…

基于Boost库的搜索引擎开发实践

目录 1.项目相关背景2.宏观原理3.相关技术栈和环境4.正排、倒排索引原理5.去标签和数据清洗模块parser5.1.认识标签5.2.准备数据源5.3.编写数据清洗代码parser5.3.1.编写读取文件Readfile5.3.2.编写分析文件Anafile5.3.2.编写保存清洗后数据SaveHtml5.3.2.测试parser 6.编写索引…

VMware Fusion 13.6 OEM BIOS 2.7 - 在 macOS 中运行 Windows 虚拟机的最佳方式

VMware Fusion 13.6 OEM BIOS 2.7 - 在 macOS 中运行 Windows 虚拟机的最佳方式 VMware Fusion 13 原版 App 中集成 OEM BIOS 请访问原文链接:https://sysin.cn/blog/vmware-fusion-13-oem/,查看最新版。原创作品,转载请保留出处。 作者主…

vos3000外呼系统如何给外地手机号码自动加 0,本地号码不加

在使用 vos3000 外呼系统时,如果你想要对外地手机号码自动加上前缀(例如0),而对本地号码保持不变,你可以通过设置号码规则来实现。这通常涉及到对号码的规则和处理进行配置。下面是一个一般的步骤,具体的操…

工作中的自动化工具使工作效率翻倍

心得 最近在做一些工作的时候,很消耗耐心,复杂的配置项等等,对于一些有规律的事情,比如先做a,接着b,c…,经过了一些痛苦的几天折磨后,想着做一些自动化工具来帮忙提升效率&#xff…

[数据集][目标检测]智慧农业草莓叶子病虫害检测数据集VOC+YOLO格式4040张9类别

数据集格式:Pascal VOC格式YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数):4040 标注数量(xml文件个数):4040 标注数量(txt文件个数):4040 标注…

Elasticsearch 开放 inference API 为 Hugging Face 添加了原生分块支持

作者:来自 Elastic Max Hniebergall 借助 Elasticsearch 开放推理 API,你可以使用 Hugging Face 的推理端点(Inference Endpoints)在 Elasticsearch 之外执行推理。这样你就可以使用 Hugging Face 的可扩展基础架构,包…