Python酷库之旅-第三方库Pandas(116)

一、用法精讲

pandas.DataFrame.to_csv%E5%87%BD%E6%95%B0-toc" style="margin-left:120px;">511、pandas.DataFrame.std方法

511-1、语法

511-2、参数

511-3、功能

511-4、返回值

511-5、说明

511-6、用法

511-6-1、数据准备

511-6-2、代码示例

511-6-3、结果输出

pandas.DataFrame.var%E6%96%B9%E6%B3%95-toc" style="margin-left:120px;">512、pandas.DataFrame.var方法

512-1、语法

512-2、参数

512-3、功能

512-4、返回值

512-5、说明

512-6、用法

512-6-1、数据准备

512-6-2、代码示例

512-6-3、结果输出

pandas.DataFrame.nunique%E6%96%B9%E6%B3%95-toc" style="margin-left:120px;">513、pandas.DataFrame.nunique方法

513-1、语法

513-2、参数

513-3、功能

513-4、返回值

513-5、说明

513-6、用法

513-6-1、数据准备

513-6-2、代码示例

513-6-3、结果输出

pandas.DataFrame.value_counts%E6%96%B9%E6%B3%95-toc" style="margin-left:120px;">514、pandas.DataFrame.value_counts方法

514-1、语法

514-2、参数

514-3、功能

514-4、返回值

514-5、说明

514-6、用法

514-6-1、数据准备

514-6-2、代码示例

514-6-3、结果输出

pandas.DataFrame.add_prefix%E6%96%B9%E6%B3%95-toc" style="margin-left:120px;">515、pandas.DataFrame.add_prefix方法

515-1、语法

515-2、参数

515-3、功能

515-4、返回值

515-5、说明

515-6、用法

515-6-1、数据准备

515-6-2、代码示例

515-6-3、结果输出

二、推荐阅读

1、Python筑基之旅

2、Python函数之旅

3、Python算法之旅

4、Python魔法之旅

5、博客个人主页

一、用法精讲

pandas.DataFrame.to_csv%E5%87%BD%E6%95%B0">511、pandas.DataFrame.std方法

511-1、语法

python">511、pandas.DataFrame.std方法
pandas.DataFrame.std(axis=0, skipna=True, ddof=1, numeric_only=False, **kwargs)
Return sample standard deviation over requested axis.Normalized by N-1 by default. This can be changed using the ddof argument.Parameters:
axis{index (0), columns (1)}
For Series this parameter is unused and defaults to 0.WarningThe behavior of DataFrame.std with axis=None is deprecated, in a future version this will reduce over both axes and return a scalar To retain the old behavior, pass axis=0 (or do not pass axis).skipnabool, default True
Exclude NA/null values. If an entire row/column is NA, the result will be NA.ddofint, default 1
Delta Degrees of Freedom. The divisor used in calculations is N - ddof, where N represents the number of elements.numeric_onlybool, default False
Include only float, int, boolean columns. Not implemented for Series.Returns:
Series or DataFrame (if level specified)
NotesTo have the same behaviour as numpy.std, use ddof=0 (instead of the default ddof=1).

511-2、参数

511-2-1、axis(可选，默认值为0)：{0 或 'index', 1 或 'columns'}，计算标准差的轴，0或'index'表示按列计算标准差，1或'columns'表示按行计算标准差。

511-2-2、skipna(可选，默认值为True)：布尔值，是否忽略 NaN 值，如果为True，则在计算标准差时会跳过NaN值。

511-2-3、ddof(可选，默认值为1)：整数，delta degrees of freedom，计算标准差时用到的自由度调整，默认值1表示计算样本标准差(n-1)，如果设置为0，则计算总体标准差(n)。

511-2-4、numeric_only(可选，默认值为False)：布尔值，如果为True，则只计算数值型数据的标准差；如果为False，则会尝试计算所有类型的数据，即使它们不是数值类型(在某些情况下可能会引发错误)。

511-2-5、**kwargs(可选)：其他关键字参数，为后续扩展功能做预留。

511-3、功能

用于计算DataFrame中沿指定轴(行或列)的标准差。

511-4、返回值

返回一个Series或标量值，表示指定轴上数据的标准差。

511-5、说明

无

511-6、用法

511-6-1、数据准备

python">无

511-6-2、代码示例

python"># 511、pandas.DataFrame.std方法
import pandas as pd
# 创建一个示例DataFrame
data = {'A': [1, 2, 3, 4, 5],'B': [5, 6, 7, None, 9],'C': [None, None, None, None, None]
}
df = pd.DataFrame(data)
# 计算每列的标准差
std_dev = df.std(axis=0)
print(std_dev)
# 计算每行的标准差
std_dev_rows = df.std(axis=1)
print(std_dev_rows)

511-6-3、结果输出

python"># 511、pandas.DataFrame.std方法
# A    1.581139
# B    1.707825
# C         NaN
# dtype: object
# 0    2.828427
# 1    2.828427
# 2    2.828427
# 3         NaN
# 4    2.828427
# dtype: object

pandas.DataFrame.var%E6%96%B9%E6%B3%95">512、pandas.DataFrame.var方法

512-1、语法

python"># 512、pandas.DataFrame.var方法
pandas.DataFrame.var(axis=0, skipna=True, ddof=1, numeric_only=False, **kwargs)
Return unbiased variance over requested axis.Normalized by N-1 by default. This can be changed using the ddof argument.Parameters:
axis{index (0), columns (1)}
For Series this parameter is unused and defaults to 0.WarningThe behavior of DataFrame.var with axis=None is deprecated, in a future version this will reduce over both axes and return a scalar To retain the old behavior, pass axis=0 (or do not pass axis).skipnabool, default True
Exclude NA/null values. If an entire row/column is NA, the result will be NA.ddofint, default 1
Delta Degrees of Freedom. The divisor used in calculations is N - ddof, where N represents the number of elements.numeric_onlybool, default False
Include only float, int, boolean columns. Not implemented for Series.Returns:
Series or DataFrame (if level specified).

512-2、参数

512-2-1、axis(可选，默认值为0)：{0 或 'index', 1 或 'columns'}，指定计算方差的轴，0或'index'表示按列计算方差(即每一列的数据)，1或'columns'表示按行计算方差(即每一行的数据)。

512-2-2、skipna(可选，默认值为True)：布尔值，是否忽略缺失值(NaN)。如果设置为True，NaN值将被排除在计算之外；如果为False，如果存在任何NaN值，结果将返回NaN。

512-2-3、ddof(可选，默认值为1)：整数，Delta Degrees of Freedom，用于计算方差时的自由度调整。ddof=1表示计算样本方差，ddof=0表示计算总体方差。

512-2-4、numeric_only(可选，默认值为False)：布尔值，当设置为True时，仅计算数值类型的列的方差；如果为False，则尝试计算所有可以进行计算的列。

512-2-5、**kwargs(可选)：其他可选关键字参数，通常不常用，具体取决于数据框的其他功能。

512-3、功能

计算DataFrame中指定轴的方差，常用于描述统计分析，方差可以帮助我们理解数据的分散程度。

512-4、返回值

返回一个Series或DataFrame，如果axis=0(默认)，返回每一列的方差，形式为一个Series，索引为每一列的名称；如果axis=1，返回每一行的方差，形式为一个Series，索引为每一行的名称。

512-5、说明

无

512-6、用法

512-6-1、数据准备

python">无

512-6-2、代码示例

python"># 512、pandas.DataFrame.var方法
import pandas as pd
# 创建一个示例DataFrame
data = {'A': [1, 2, 3, 4],'B': [4, 5, 6, None],'C': [7, 8, 9, 10]
}
df = pd.DataFrame(data)
# 计算每一列的方差
column_variance = df.var(axis=0)
print(column_variance)
# 计算每一行的方差
row_variance = df.var(axis=1)
print(row_variance)

512-6-3、结果输出

python"># 512、pandas.DataFrame.var方法
# A    1.666667
# B    1.000000
# C    1.666667
# dtype: float64
# 0     9.0
# 1     9.0
# 2     9.0
# 3    18.0
# dtype: float64

pandas.DataFrame.nunique%E6%96%B9%E6%B3%95">513、pandas.DataFrame.nunique方法

513-1、语法

python"># 513、pandas.DataFrame.nunique方法
pandas.DataFrame.nunique(axis=0, dropna=True)
Count number of distinct elements in specified axis.Return Series with number of distinct elements. Can ignore NaN values.Parameters:
axis
{0 or ‘index’, 1 or ‘columns’}, default 0
The axis to use. 0 or ‘index’ for row-wise, 1 or ‘columns’ for column-wise.dropna
bool, default True
Don’t include NaN in the counts.Returns:
Series

513-2、参数

513-2-1、axis(可选，默认值为0)：整数或字符串，指定计算的轴，0表示按列计算唯一值的数量(返回每一列的唯一值数)，1表示按行计算唯一值的数量(返回每一行的唯一值数)。

513-2-2、dropna(可选，默认值为True)：布尔值，是否忽略缺失值(NaN)。如果设置为True，NaN值将不计入唯一值的计算；如果为False，则NaN值也会被计算为唯一值之一。

513-3、功能

计算DataFrame中指定轴的唯一值数量，常用于数据分析以了解数据集中各列或各行的多样性。

513-4、返回值

返回一个Series或DataFrame，如果axis=0(默认)，返回每一列的唯一值数量，形式为一个Series，索引为每一列的名称；如果axis=1，返回每一行的唯一值数量，形式为一个Series，索引为每一行的名称。

513-5、说明

无

513-6、用法

513-6-1、数据准备

python">无

513-6-2、代码示例

python"># 513、pandas.DataFrame.nunique方法
import pandas as pd
# 创建一个示例DataFrame
data = {'A': [1, 2, 2, 4],'B': [4, 5, 6, None],'C': [7, 7, 9, 10]
}
df = pd.DataFrame(data)
# 计算每一列的唯一值数量
column_unique_counts = df.nunique(axis=0)
print("每一列的唯一值数量:\n", column_unique_counts)
# 计算每一行的唯一值数量
row_unique_counts = df.nunique(axis=1)
print("每一行的唯一值数量:\n", row_unique_counts)

513-6-3、结果输出

python"># 513、pandas.DataFrame.nunique方法
# 每一列的唯一值数量:
#  A    3
# B    3
# C    3
# dtype: int64
# 每一行的唯一值数量:
#  0    3
# 1    3
# 2    3
# 3    2
# dtype: int64

pandas.DataFrame.value_counts%E6%96%B9%E6%B3%95">514、pandas.DataFrame.value_counts方法

514-1、语法

python"># 514、pandas.DataFrame.value_counts方法
pandas.DataFrame.value_counts(subset=None, normalize=False, sort=True, ascending=False, dropna=True)
Return a Series containing the frequency of each distinct row in the Dataframe.Parameters:
subsetlabel or list of labels, optional
Columns to use when counting unique combinations.normalizebool, default False
Return proportions rather than frequencies.sortbool, default True
Sort by frequencies when True. Sort by DataFrame column values when False.ascendingbool, default False
Sort in ascending order.dropnabool, default True
Don’t include counts of rows that contain NA values.New in version 1.3.0.Returns:
Series

514-2、参数

514-2-1、subset(可选，默认值为None)：指定用于计算的列名列表，如果指定了此参数，则只计算这些列的唯一值组合的计数。

514-2-2、normalize(可选，默认值为False)：布尔值，如果设置为True，则返回每个唯一值的相对频率(即出现次数占总数的比例)，而不是绝对计数。

514-2-3、sort(可选，默认值为True)：布尔值，是否对结果进行排序，如果设置为True，结果将按计数从高到低排序。

514-2-4、ascending(可选，默认值为False)：布尔值，指定排序顺序，True表示升序排序，False表示降序排序。

514-2-5、dropna(可选，默认值为True)：布尔值，是否忽略缺失值(NaN)。如果设置为True，缺失值不会被计算；如果为False，缺失值将被当作一个单独的计数。

514-3、功能

计算指定列(或多个列)中每个唯一值的出现次数，常用于了解分类数据的分布情况，帮助进行数据探索和清理。

514-4、返回值

返回一个Series，索引为唯一值或唯一值的组合(如果使用了多个列)，值为每个唯一值的计数。索引按照计数排序(如果sort=True)，并且可以根据ascending参数指定排序方式。

514-5、说明

无

514-6、用法

514-6-1、数据准备

python">无

514-6-2、代码示例

python"># 514、pandas.DataFrame.value_counts方法
import pandas as pd
# 创建一个示例DataFrame
data = {'Fruit': ['Apple', 'Banana', 'Apple', 'Orange', 'Banana', None],'Color': ['Red', 'Yellow', 'Green', 'Orange', 'Yellow', None]
}
df = pd.DataFrame(data)
# 计算'Fruit'列各唯一值的计数
fruit_counts = df['Fruit'].value_counts()
print("Fruit列各唯一值的计数:\n", fruit_counts)
# 计算'Fruit'列各唯一值的相对频率
fruit_relative_counts = df['Fruit'].value_counts(normalize=True)
print("\nFruit列各唯一值的相对频率:\n", fruit_relative_counts)
# 计算'Fruit'和'Color'列的唯一值组合计数
combo_counts = df.value_counts(subset=['Fruit', 'Color'])
print("\nFruit和Color列的唯一值组合计数:\n", combo_counts)

514-6-3、结果输出

python"># 514、pandas.DataFrame.value_counts方法
# Fruit列各唯一值的计数:
#  Fruit
# Apple     2
# Banana    2
# Orange    1
# Name: count, dtype: int64
# 
# Fruit列各唯一值的相对频率:
#  Fruit
# Apple     0.4
# Banana    0.4
# Orange    0.2
# Name: proportion, dtype: float64
# 
# Fruit和Color列的唯一值组合计数:
#  Fruit   Color 
# Banana  Yellow    2
# Apple   Green     1
#         Red       1
# Orange  Orange    1
# Name: count, dtype: int64

pandas.DataFrame.add_prefix%E6%96%B9%E6%B3%95">515、pandas.DataFrame.add_prefix方法

515-1、语法

python"># 515、pandas.DataFrame.add_prefix方法
pandas.DataFrame.add_prefix(prefix, axis=None)
Prefix labels with string prefix.For Series, the row labels are prefixed. For DataFrame, the column labels are prefixed.Parameters:
prefixstr
The string to add before each label.axis{0 or ‘index’, 1 or ‘columns’, None}, default None
Axis to add prefix onNew in version 2.0.0.Returns:
Series or DataFrame
New Series or DataFrame with updated labels.

515-2、参数

515-2-1、prefix(必须)：字符串，指定要添加的前缀字符串。

515-2-2、axis(可选，默认值为None)：{0 或 'index', 1 或 'columns'}，指定计算方差的轴，0或'index'表示按列计算方差(即每一列的数据)，1或'columns'表示按行计算方差(即每一行的数据)。

515-3、功能

用于为DataFrame的列或索引添加前缀，以便更容易区分数据的来源或含义。

515-4、返回值

返回一个新的DataFrame，列或索引名称带有指定的前缀。

515-5、说明

无

515-6、用法

515-6-1、数据准备

python">无

515-6-2、代码示例

python"># 515、pandas.DataFrame.add_prefix方法
import pandas as pd
# 创建示例DataFrame
data = {'A': [1, 2], 'B': [3, 4]}
df = pd.DataFrame(data)
# 在列上添加前缀
df_with_prefix = df.add_prefix('prefix_')
print(df_with_prefix)

515-6-3、结果输出

python"># 515、pandas.DataFrame.add_prefix方法
#    prefix_A  prefix_B
# 0         1         3
# 1         2         4