文章目录
- 🏳️🌈 4. 数据切片、筛选
- 4.1 输出城市为上海的行
- 4.2 输出城市为上海或广州的行
- 4.3 输出城市名称中含有‘海’字的行
- 4.4 输出城市名称以‘海’字开头的行
- 4.5 输出城市名称以‘海’字结尾的行
- 4.6 输出所有姓名,缺失值用Null填充
- 4.7 重置索引
- 4.8 前两行
- 4.9 后两行
- 4.10 2-8行
- 4.11 每隔3行读取
- 4.12 2-8行,步长为2,即第2/4/6行
- 4.13 选取'语文','数学','英语'列
- 4.14 学号为'001'的行,所有列
- 4.15 学号为'001'或'003'的行,所有列
- 4.16 学号为'001'至'009'的行,所有列
- 4.17 列索引为'姓名',所有行
- 4.18 列索引为'姓名'至‘城市’,所有行
- 4.19 语文成绩大于80的行
- 4.20 语文成绩大于80的人的姓名和城市
- 4.21 输出'赵四'和'周七'的各科成绩
- 4.22 iloc选取第2行
- 4.23 iloc选取前3行
- 4.24 选取第2行、第4行、第6行
- 4.25 选取第2列
- 4.26 选取前3列
- 4.27 选取第3行的第3列
- 4.28 选取第1列、第3列和第4列
- 4.29 选取第2行的第1列、第3列、第4列
- 4.30 选取前3行的前3列
- 推荐阅读
大家好,我是 👉【Python当打之年(点击跳转)】
本期为大家带来 《 Pandas常用操作命令》 的 第四篇 ,主要介绍在数据处理可视化过程中经常用到的一些指令,本系列在后期会不断进行补充更新,希望对你有所帮助,如有疑问或者需要改进的地方可以私信小编。
🏳️🌈 4. 数据切片、筛选
示例数据:
4.1 输出城市为上海的行
df[df['城市']=='上海']
4.2 输出城市为上海或广州的行
df[df['城市'].isin(['上海','广州'])]
4.3 输出城市名称中含有‘海’字的行
df[df['城市'].str.contains("海", na=False)]
4.4 输出城市名称以‘海’字开头的行
df[df['城市'].str.startswith("海", na=False)]
4.5 输出城市名称以‘海’字结尾的行
df[df['城市'].str.endswith("海", na=False)]
4.6 输出所有姓名,缺失值用Null填充
df['姓名'].str.cat(sep='、',na_rep='Null')
‘001-张三、002-李四、003-赵四、004-王五、005-陈六、006-孙五、007-周七、Null、009-王二、010-刘八、011-郑九、012-赵十、013-郭一’
4.7 重置索引
df2 = df1.set_index('学号')
df2
4.8 前两行
df2[:2]
4.9 后两行
df2[-2:]
4.10 2-8行
df2[2:8]
4.11 每隔3行读取
df2[::3]
4.12 2-8行,步长为2,即第2/4/6行
df2[2:8:2]
4.13 选取’语文’,‘数学’,'英语’列
df2[['语文','数学','英语']]
4.14 学号为’001’的行,所有列
df.loc只能使用标签索引,不能使用整数索引,通过便签索引切边进行筛选时,前闭后闭.
df2.loc['001', :]
4.15 学号为’001’或’003’的行,所有列
df2.loc[['001','003'], :]
4.16 学号为’001’至’009’的行,所有列
df2.loc['001':'009', :]
4.17 列索引为’姓名’,所有行
df2.loc[:, '姓名']
4.18 列索引为’姓名’至‘城市’,所有行
df2.loc[:, '姓名':'城市']
4.19 语文成绩大于80的行
# 方法一
df2.loc[df2['语文']>80,:]# 方法二
df2.loc[df2.loc[:,'语文']>80, :]# 方法三
df2.loc[lambda df2:df2['语文'] > 80, :]
4.20 语文成绩大于80的人的姓名和城市
df2.loc[df2['语文']>80,['姓名','城市']]
4.21 输出’赵四’和’周七’的各科成绩
df2.loc[df2['姓名'].isin(['赵四','周七']),['姓名','语文','数学','英语']]
df.iloc[]只能使用整数索引,不能使用标签索引,通过整数索引切边进行筛选时,前闭后开
4.22 iloc选取第2行
df2.iloc[1, :]
4.23 iloc选取前3行
df2.iloc[:3, :]
4.24 选取第2行、第4行、第6行
df2.iloc[[1,3,5],:]
4.25 选取第2列
df2.iloc[:, 1]
4.26 选取前3列
df2.iloc[:, :3]
4.27 选取第3行的第3列
df2.iloc[3, 3]
4.28 选取第1列、第3列和第4列
df2.iloc[:, [0,2,3]]
4.29 选取第2行的第1列、第3列、第4列
df2.iloc[1, [0,2,3]]
4.30 选取前3行的前3列
df2.iloc[:3, :3]
未完待续。。。
文章首发:微信公众号 “Python当打之年” ,Python编程技巧推送,希望大家可以喜欢。
以上就是本期为大家整理的全部内容了,赶快练习起来吧,原创不易,喜欢的朋友可以点赞、收藏也可以分享(注明出处)让更多人知道。
推荐阅读
- 👨🎓 【Pandas+Pyecharts | 山东省高考考生数据分析可视化】
- 🚗 【Pandas+Pyecharts | 40000+汽车之家数据分析可视化】
- 🛒 【Pandas+Pyecharts | 20000+天猫订单数据可视化】
- 🏠 【Pandas+Pyecharts | 广州市已成交房源信息数据可视化】
- 🏫 【Pandas+Pyecharts | 考研信息数据可视化】
- 💸 【Pandas+Pyecharts | 某平台招聘信息数据可视化】
- 🏥 【Pandas+Pyecharts | 医院药品销售数据可视化】
- 💰️ 【Pyecharts | 比特币每日价格动态可视化】
- 🥮 【可视化 | Python中秋月饼销量分析,这些口味才是yyds!】
- 🎦 【Pyecharts | 《白蛇2:青蛇劫起》20000+数据分析可视化】
- 💑 【Pyecharts | 历年全国各地民政局登记数据分析+可视化】
- 🌏 【Pandas+Pyecharts | 全国热门旅游景点数据分析+可视化】
- 🏆 【Pandas+Pyecharts | 2020东京奥运会奖牌数据可视化】
- 🏹 【Pandas常用基础操作指令汇总 】
- 🎯 【pandas + pyecharts | ADX游戏广告投放渠道综合分析】
- 🕔 【Schedule + Pyecharts | 时间序列图(动态轮播图)】
- 🏠 【Pandas+Pyecharts | 北京某平台二手房数据分析+可视化】
- 🏫 【Pandas+Pyecharts | 2021中国大学综合排名分析+可视化】
- 🎦 【爬虫 | Python爬取豆瓣电影Top250 + 数据可视化】
- 📡 【技巧 | Python创建自己的高匿代理IP池】