数据的查看与选择
查看数据的函数:
对象变量.head(n) 查看 前 n 行的数据 如果不设置n的值 默认为 n = 5
对象变量.tail(n) 查看 后 n 行的数据 如果不设置n的值 默认为 n = 5
例如:
-
查看数据的前两行
# 数据的查看 # 引用 pandas import pandas as pd # 定义数据 data = {"name":["张三","李四","王五","赵六"],"age":[15,65,58,79],"sex":["男","女","女","男"] } # 创建 DataFrame df = pd.DataFrame(data) print(df)# 查看数据的前两行 print("数据的前两行为:\n",df.head(2))
结果:
name age sex 0 张三 15 男 1 李四 65 女 2 王五 58 女 3 赵六 79 男 数据的前两行为:name age sex 0 张三 15 男 1 李四 65 女
-
查看数据的后两行
# 数据的查看 # 引用 pandas import pandas as pd # 定义数据 data = {"name":["张三","李四","王五","赵六"],"age":[15,65,58,79],"sex":["男","女","女","男"] } # 创建 DataFrame df = pd.DataFrame(data) print(df)# 查看数据的后两行 print("数据的后两行为:\n",df.tail(2))
结果:
name age sex 0 张三 15 男 1 李四 65 女 2 王五 58 女 3 赵六 79 男 数据的后两行为:name age sex 2 王五 58 女 3 赵六 79 男
-
查看数据基本信息
使用函数describe数据对象.describe(include = 'all')
# 数据的查看 # 引用 pandas import pandas as pd # 定义数据 data = {"name":["张三","李四","王五","赵六"],"age":[15,65,58,79],"sex":["男","女","女","男"] } # 创建 DataFrame df = pd.DataFrame(data) print(df)# 查看基本信息 print("查看统计的基本信息:") print(df.describe(include = 'all'))
结果:
name age sex 0 张三 15 男 1 李四 65 女 2 王五 58 女 3 赵六 79 男 查看统计的基本信息:name age sex count 4 4.000000 4 unique 4 NaN 2 top 张三 NaN 男 freq 1 NaN 2 mean NaN 54.250000 NaN std NaN 27.584718 NaN min NaN 15.000000 NaN 25% NaN 47.250000 NaN 50% NaN 61.500000 NaN 75% NaN 68.500000 NaN max NaN 79.000000 NaN
·数据的选择
函数:
数据对象.iloc[行号]
数据对象.loc[索引名]
- 选择第四行数据
# 引用 pandas
import pandas as pd
# 定义数据
data = {"name":["张三","李四","王五","赵六"],"age":[15,67,87,45],"sex":["男","女","男","男"]
}
# 创建 DataFrame
df = pd.DataFrame(data,index = ['a','b','c','d'])
print(df)
# 显示行数据
print(df.iloc[3])
print(df.loc['d'])
结果:
name age sex
0 张三 15 男
1 李四 67 女
2 王五 87 男
3 赵六 45 男
name 赵六
age 45
sex 男
Name: 3, dtype: object
name 赵六
age 45
sex 男
Name: 3, dtype: object