grouped.get_group((‘B‘, ‘A‘))选择分组

ops/2025/1/7 23:43:56/

1. df.groupby(['team', df.name.str[0]])

  • df.groupby(['team', df.name.str[0]]) 这一部分代码表示对 DataFrame df 按照 两个条件 进行分组:

    • 按照 'team' 列(即团队)。
    • 按照 'name' 列的 首字母df.name.str[0])。
  • df.name.str[0] 使用了 str 访问器和 .str[0] 索引来获取 'name' 列中每个名字的首字母。例如,如果某个名字是 “Alice”,那么 df.name.str[0] 就会返回 'A'

  • 因此,分组后的结果是按团队(team)和每个人姓名的首字母进行二重分组。

2. grouped2.get_group(('B', 'A'))

  • grouped2.get_group(('B', 'A')) 表示从已经按 teamname 首字母分组的结果中,选出 teamB 且姓名首字母为 A 的组。
  • get_group(('B', 'A')) 方法返回的是符合条件的组的 DataFrame 数据。

示例:

假设你有如下的 DataFrame df

python">import pandas as pd# 创建一个示例 DataFrame
data = {'name': ['Alice', 'Bob', 'Charlie', 'David', 'Eva'],'team': ['A', 'B', 'A', 'B', 'A'],'score': [90, 80, 85, 95, 88]
}
df = pd.DataFrame(data)print(df)

输出:

      name team  score
0    Alice    A     90
1      Bob    B     80
2  Charlie    A     85
3    David    B     95
4      Eva    A     88

执行 grouped2 = df.groupby(['team', df.name.str[0]])

python">grouped2 = df.groupby(['team', df.name.str[0]])

这将按照 team 和姓名首字母进行分组,得到一个分组对象。现在,grouped2 是一个包含多个组的 GroupBy 对象。

执行 grouped2.get_group(('B', 'A'))

python">grouped2.get_group(('B', 'A'))

这行代码会选出 teamB 且姓名首字母为 A 的分组。输出将是:

    name team  score
1    Bob    B     80

解释:

  • teamB 且姓名首字母为 A 的数据只有 Bob,因此返回的结果是一个 DataFrame,其中只包含 Bob 这一行数据。

完整代码

python">import pandas as pd# 创建一个示例 DataFrame
data = {'name': ['Alice', 'Bob', 'Charlie', 'David', 'Eva'],'team': ['A', 'B', 'A', 'B', 'A'],'score': [90, 80, 85, 95, 88]
}
df = pd.DataFrame(data)print(df)grouped2 = df.groupby(['team', df.name.str[0].str.upper()])  # 确保首字母是大写
print(grouped2.groups)grouped2.get_group(('B', 'B'))

输出:
在这里插入图片描述

总结:

  • df.groupby(['team', df.name.str[0]]):按团队 (team) 和姓名的首字母 (df.name.str[0]) 进行二重分组。
  • get_group(('B', 'A')):获取 teamB 且姓名首字母为 A 的分组数据。在本例中,只有 Bob 这一行符合条件,因此返回该行数据。

这种方法非常有用,可以实现更复杂的分组,比如按某一列的部分值(如首字母、日期的月或周等)进行分组。

补充:

分组对象的groups方法会生成一个字典(其实是Pandas定义的PrettyDict),这个字典包含分组的名称和分组的内容索引列表,然后我们可以使用字典的.keys()方法取出分组名称:

python">import pandas as pd# 创建一个示例 DataFrame
data = {'name': ['Alice', 'Bob', 'Charlie', 'David', 'Eva'],'team': ['A', 'B', 'A', 'B', 'A'],'score': [90, 80, 85, 95, 88]
}
df = pd.DataFrame(data)print(df,'\n')
grouped = df.drop('name', axis=1).groupby('team')
result = grouped.sum()
print(result,'\n')
print(df.groupby('team').groups,'\n')
print(df.groupby('team').groups.keys(),'\n')

输出:
在这里插入图片描述


http://www.ppmy.cn/ops/148298.html

相关文章

深兰科技董事长陈海波应邀为华东师大心理学专业师生做AI专题讲座

12月28日,应上海华东师范大学的邀请,上海市科协常委、上海交通大学博士生导师、深兰科技创始人兼董事长陈海波专程到校,为该校心理学专业的全体师生做了一场关于人工智能推动个人数字化未来的专题讲座。 他在演讲中,首先详细讲述了…

小程序组件 —— 30 组件 - 背景图片的使用

在编写小程序的样式文件时,可以使用 background-image 属性来设置元素的背景图像;但是这个属性在微信小程序中使用时存在坑; 注意事项:微信小程序中的 background-iamge 不支持本地路径!需要使用网络图片,…

C语言 扫雷程序设计

目录 1.main函数 2.菜单打印menu函数 3.游戏game函数 4.宏定义 5.界面初始化 6.打印界面 7.设置雷 8.统计排查坐标周围雷的个数 9.排查雷 10.总代码 test.c代码 game.h代码 game.c代码 结语: 一个简单的扫雷游戏,通过宏定义可以修改行列的…

[极客大挑战 2019]Http 1

进入环境: 检查源码发现有一个链接,但是这里没有绑定,需要手动跳转,打开后,发现提示: 这里就是需要我们从https://Sycsecret.buuoj.cn来访问它 因此我们抓包,使用referer:服务器伪造…

node.js内置模块之---fs 模块

fs模块的作用 在 Node.js 中,fs(文件系统)模块提供了与文件系统交互的功能,允许你读取、写入、更新和删除文件,以及操作文件和目录。这个模块是 Node.js 的核心模块之一,主要用于服务器端处理文件系统相关的…

机器翻译

阿里云提供了强大的 机器翻译服务,名为 阿里云机器翻译(Alibaba Cloud Machine Translation, MT)。它利用人工智能技术,特别是自然语言处理(NLP)和深度学习模型,支持多语言间的高效翻译&#xf…

华为的数字化转型框架和数字化转型成熟度评估方法

2016年,华为公司数字化转型变革规划汇报通过,一系列的变革项目由变革指导委员会(Executive Steering Committee,ESC)完成立项。8年多来,华为数字化转型工作初步取得了一些成果,比如: 实现“销售收入翻番,但…

学英语学压测:01开源压测工具jmeter能干什么

📢📢📢:先看关键单词,再看英文,最后看中文总结,再回头看一遍英文原文,效果更佳!! 关键单词: simulate模拟/ˈsɪmjʊˌleɪt/concurrent并发的/…