python中对dataframe进行特定行列的提取

news/2025/2/1 17:02:42/

Ref.: python之pandas取dataframe特定行列的简单示例_512笔记 (512pic.com)

1.按列取、按索引/行取、按特定行列取

代码如下:


import numpy as np
from pandas import DataFrame
import pandas as pddf=DataFrame(np.arange(12).reshape((3,4)),index=['one','two','thr'],columns=list('abcd'))df['a']#取a列
df[['a','b']]#取a、b列#ix可以用数字索引,也可以用index和column索引
df.ix[0]#取第0行
df.ix[0:1]#取第0行
df.ix['one':'two']#取one、two行
df.ix[0:2,0]#取第0、1行,第0列
df.ix[0:1,'a']#取第0行,a列
df.ix[0:2,'a':'c']#取第0、1行,abc列
df.ix['one':'two','a':'c']#取one、two行,abc列
df.ix[0:2,0:1]#取第0、1行,第0列
df.ix[0:2,0:2]#取第0、1行,第0、1列#loc只能通过index和columns来取,不能用数字
df.loc['one','a']#one行,a列
df.loc['one':'two','a']#one到two行,a列
df.loc['one':'two','a':'c']#one到two行,a到c列
df.loc['one':'two',['a','c']]#one到two行,ac列#iloc只能用数字索引,不能用索引名
df.iloc[0:2]#前2行
df.iloc[0]#第0行
df.iloc[0:2,0:2]#0、1行,0、1列
df.iloc[[0,2],[1,2,3]]#第0、2行,1、2、3列#iat取某个单值,只能数字索引
df.iat[1,1]#第1行,1列
#at取某个单值,只能index和columns索引
df.at['one','a']#one行,a列

pandas取dataframe特定行列的实现方法

2.按条件取行

代码如下:


选取等于某些值的行记录 用 ==
df.loc[df[‘column_name'] == some_value]选取某列是否是某一类型的数值 用 isin
df.loc[df[‘column_name'].isin(some_values)]多种条件的选取 用 &
df.loc[(df[‘column'] == some_value) & df[‘other_column'].isin(some_values)]选取不等于某些值的行记录 用 !=
df.loc[df[‘column_name'] != some_value]isin返回一系列的数值,如果要选择不符合这个条件的数值使用~
df.loc[~df[‘column_name'].isin(some_values)]

pandas取dataframe特定行列的实现方法

3.取完之后替换

代码如下:


df = pd.DataFrame({"id": [25,53,15,47,52,54,45,9], "sex": list('mfmfmfmf'), 'score': [1.2, 2.3, 3.4, 4.5,6.4,5.7,5.6,4.3],"name":['daisy','tony','peter','tommy','ana','david','ken','jim']})

pandas取dataframe特定行列的实现方法

将男性(m)替换为1,女性(f)替换为0

方法1:

代码如下:


df.ix[df['sex']=='f','sex']=0
df.ix[df['sex']=='m','sex']=1

pandas取dataframe特定行列的实现方法

注:在上面的代码中,逗号后面的‘sex'起到固定列名的作用

方法2:

代码如下:


df.sex[df['sex']=='m']=1
df.sex[df['sex']=='f']=0  

pandas取dataframe特定行列的实现方法

4.删除特定行

代码如下:


# 要删除列“score”<50的所有行:
df = df.drop(df[df.score < 50].index)df.drop(df[df.score < 50].index, inplace=True)# 多条件情况
# 可以使用操作符: | 只需其中一个成立, & 同时成立, ~ 表示取反,它们要用括号括起来。
# 例如删除列“score<50 和>20的所有行
df = df.drop(df[(df.score < 50) & (df.score > 20)].index)

http://www.ppmy.cn/news/579516.html

相关文章

dataframe选取特定行和列

dataframe选取特定行和列 选取行 df pd.read_csv(data.csv) data df.loc[3:6] # 选取多行# 按某列值在某个区间内选取行 data df[(df[column] > t1) & (df[column] < t2)]# 按索引选择行&#xff08;选择idx这一行&#xff09; data.loc[[idx]] # 或者&#xf…

DataFrame取出某一个值所在行

dfpd.DataFrame([[1],[2],[3],[4],[5],[6],[7]],columns["实验"],index[a,b,c,d,e,f,g]) df2_mediandf.median() #返回值是series print(df.values df2_median) #判断两边的值类型不一样故会报错 df2_mediannp.array(df.median()) …

pandas.DataFrame获取满足某条件的行、元素所在的索引(index)

dataframe中根据某些条件得到特定的行或者特定的元素&#xff0c;如何找出这些行、元素所在的index&#xff0c;也就是行号。 _temp {job:[farmer, teacher, worker, acter, present], money:[3000, 7000, 5000, 100000, 66666]} df pd.DataFrame(_temp) print(df) >>…

获取DataFrame中各列最大值所在行的行号(索引号)idxmax()

【小白从小学Python、C、Java】 【Python-计算机等级考试二级】 【Python-数据分析】 获取DataFrame中各列最大值 所在行的行号&#xff08;索引号&#xff09; idxmax() [太阳]选择题 关于以下代码说法错误的是? import pandas as pd myDf pd.DataFrame({Math: [87,…

Python 提取 DataFrame 某字段最大值所对应的行

在处理DataFrame时&#xff0c;某一列/某个字段在不同类别中有不同的值。 提取某个类别中该字段最大值所对应的行&#xff0c;需要用group by 方法。 输入&#xff1a; year num name 0 2016 2 a 1 2016 5 b 2 2017 4 c 3 2017 7 d 4 2017 …

pandas获得指定行_pandas取dataframe特定行/列

转自他人博客&#xff1a;https://blog.csdn.net/weixin_39586825/article/details/111758506 1.按列取、按索引/行取、按特定行列取 import numpy as np from pandas import DataFrame import pandas as pd dfDataFrame(np.arange(12).reshape((3,4)),index[‘one’,‘tw…

【无标题】行操作DataFrame

&#xff08;1&#xff09;标签选取&#xff1a; 行操作需要借助loc属性来完成&#xff1a;按标签或布尔数组访问一组行和列 注&#xff1a;loc允许接受两个参数分别是行和列 行和列还可以使用切片 &#xff08;2&#xff09;数值型索引和切片&#xff1a; 使用数据型索引需要…

30_Pandas.DataFrame提取(选择)指定行名和列名的行和列

30_Pandas.DataFrame提取&#xff08;选择&#xff09;指定行名和列名的行和列 从pandas.DataFrame中提取&#xff08;选择&#xff09;行名称&#xff08;索引名称&#xff09;和列名称&#xff08;列名称&#xff09;满足特定条件的行或列。 了解如何提取元素包含特定字符串…