文章目录

🏳️‍🌈 4. 数据切片、筛选
- 4.1 输出城市为上海的行
- 4.2 输出城市为上海或广州的行
- 4.3 输出城市名称中含有‘海’字的行
- 4.4 输出城市名称以‘海’字开头的行
- 4.5 输出城市名称以‘海’字结尾的行
- 4.6 输出所有姓名，缺失值用Null填充
- 4.7 重置索引
- 4.8 前两行
- 4.9 后两行
- 4.10 2-8行
- 4.11 每隔3行读取
- 4.12 2-8行,步长为2，即第2/4/6行
- 4.13 选取'语文','数学','英语'列
- 4.14 学号为'001'的行，所有列
- 4.15 学号为'001'或'003'的行，所有列
- 4.16 学号为'001'至'009'的行，所有列
- 4.17 列索引为'姓名'，所有行
- 4.18 列索引为'姓名'至‘城市’，所有行
- 4.19 语文成绩大于80的行
- 4.20 语文成绩大于80的人的姓名和城市
- 4.21 输出'赵四'和'周七'的各科成绩
- 4.22 iloc选取第2行
- 4.23 iloc选取前3行
- 4.24 选取第2行、第4行、第6行
- 4.25 选取第2列
- 4.26 选取前3列
- 4.27 选取第3行的第3列
- 4.28 选取第1列、第3列和第4列
- 4.29 选取第2行的第1列、第3列、第4列
- 4.30 选取前3行的前3列
推荐阅读

大家好，我是 👉【Python当打之年(点击跳转)】

本期为大家带来《 Pandas常用操作命令》的 第四篇 ，主要介绍在数据处理可视化过程中经常用到的一些指令，本系列在后期会不断进行补充更新，希望对你有所帮助，如有疑问或者需要改进的地方可以私信小编。

🏳️‍🌈 4. 数据切片、筛选

示例数据：
在这里插入图片描述

4.1 输出城市为上海的行

df[df['城市']=='上海']

在这里插入图片描述

4.2 输出城市为上海或广州的行

df[df['城市'].isin(['上海','广州'])]

在这里插入图片描述

4.3 输出城市名称中含有‘海’字的行

df[df['城市'].str.contains("海", na=False)]

在这里插入图片描述

4.4 输出城市名称以‘海’字开头的行

df[df['城市'].str.startswith("海", na=False)]

在这里插入图片描述

4.5 输出城市名称以‘海’字结尾的行

df[df['城市'].str.endswith("海", na=False)]

在这里插入图片描述

4.6 输出所有姓名，缺失值用Null填充

df['姓名'].str.cat(sep='、',na_rep='Null')

‘001-张三、002-李四、003-赵四、004-王五、005-陈六、006-孙五、007-周七、Null、009-王二、010-刘八、011-郑九、012-赵十、013-郭一’

4.7 重置索引

df2 = df1.set_index('学号')
df2

在这里插入图片描述

4.8 前两行

df2[:2]

在这里插入图片描述

4.9 后两行

df2[-2:]

在这里插入图片描述

4.10 2-8行

df2[2:8]

在这里插入图片描述

4.11 每隔3行读取

df2[::3]

在这里插入图片描述

4.12 2-8行,步长为2，即第2/4/6行

df2[2:8:2]

在这里插入图片描述

4.13 选取’语文’,‘数学’,'英语’列

df2[['语文','数学','英语']]

在这里插入图片描述

4.14 学号为’001’的行，所有列

df.loc只能使用标签索引，不能使用整数索引，通过便签索引切边进行筛选时，前闭后闭.

df2.loc['001', :]

在这里插入图片描述

4.15 学号为’001’或’003’的行，所有列

df2.loc[['001','003'], :]

在这里插入图片描述

4.16 学号为’001’至’009’的行，所有列

df2.loc['001':'009', :]

在这里插入图片描述

4.17 列索引为’姓名’，所有行

df2.loc[:, '姓名']

在这里插入图片描述

4.18 列索引为’姓名’至‘城市’，所有行

df2.loc[:, '姓名':'城市']

在这里插入图片描述

4.19 语文成绩大于80的行

# 方法一
df2.loc[df2['语文']>80,:]# 方法二
df2.loc[df2.loc[:,'语文']>80, :]# 方法三
df2.loc[lambda df2:df2['语文'] > 80, :]

在这里插入图片描述

4.20 语文成绩大于80的人的姓名和城市

df2.loc[df2['语文']>80,['姓名','城市']]

在这里插入图片描述

4.21 输出’赵四’和’周七’的各科成绩

df2.loc[df2['姓名'].isin(['赵四','周七']),['姓名','语文','数学','英语']]

在这里插入图片描述

df.iloc[]只能使用整数索引，不能使用标签索引，通过整数索引切边进行筛选时，前闭后开

4.22 iloc选取第2行

df2.iloc[1, :]

在这里插入图片描述

4.23 iloc选取前3行

df2.iloc[:3, :]

在这里插入图片描述

4.24 选取第2行、第4行、第6行

df2.iloc[[1,3,5],:]

在这里插入图片描述

4.25 选取第2列

df2.iloc[:, 1]

在这里插入图片描述

4.26 选取前3列

df2.iloc[:, :3]

在这里插入图片描述

4.27 选取第3行的第3列

df2.iloc[3, 3]

4.28 选取第1列、第3列和第4列

df2.iloc[:, [0,2,3]]

在这里插入图片描述

4.29 选取第2行的第1列、第3列、第4列

df2.iloc[1, [0,2,3]]

在这里插入图片描述

4.30 选取前3行的前3列

df2.iloc[:3, :3]

在这里插入图片描述

未完待续。。。

文章首发：微信公众号 “Python当打之年” ，Python编程技巧推送，希望大家可以喜欢。

以上就是本期为大家整理的全部内容了，赶快练习起来吧，原创不易，喜欢的朋友可以点赞、收藏也可以分享（注明出处）让更多人知道。

Pandas常用操作命令（四）——数据切片、筛选

文章目录

🏳️‍🌈 4. 数据切片、筛选

4.1 输出城市为上海的行

4.2 输出城市为上海或广州的行

4.3 输出城市名称中含有‘海’字的行

4.4 输出城市名称以‘海’字开头的行

4.5 输出城市名称以‘海’字结尾的行

4.6 输出所有姓名，缺失值用Null填充

4.7 重置索引

4.8 前两行

4.9 后两行

4.10 2-8行

4.11 每隔3行读取

4.12 2-8行,步长为2，即第2/4/6行

4.13 选取’语文’,‘数学’,'英语’列

4.14 学号为’001’的行，所有列

4.15 学号为’001’或’003’的行，所有列

4.16 学号为’001’至’009’的行，所有列

4.17 列索引为’姓名’，所有行

4.18 列索引为’姓名’至‘城市’，所有行

4.19 语文成绩大于80的行

4.20 语文成绩大于80的人的姓名和城市

4.21 输出’赵四’和’周七’的各科成绩

4.22 iloc选取第2行

4.23 iloc选取前3行

4.24 选取第2行、第4行、第6行

4.25 选取第2列

4.26 选取前3列

4.27 选取第3行的第3列

4.28 选取第1列、第3列和第4列

4.29 选取第2行的第1列、第3列、第4列

4.30 选取前3行的前3列

推荐阅读

相关文章