【愚公系列】《Python网络爬虫从入门到精通》035-DataFrame数据分组统计整理

server/2025/2/28 14:00:08/
标题详情
作者简介愚公搬代码
头衔华为云特约编辑,华为云云享专家,华为开发者专家,华为产品云测专家,CSDN博客专家,CSDN商业化专家,阿里云专家博主,阿里云签约作者,腾讯云优秀博主,腾讯云内容共创官,掘金优秀博主,亚马逊技领云博主,51CTO博客专家等。
近期荣誉2022年度博客之星TOP2,2023年度博客之星TOP2,2022年华为云十佳博主,2023年华为云十佳博主,2024年华为云十佳博主等。
博客内容.NET、Java、Python、Go、Node、前端、IOS、Android、鸿蒙、Linux、物联网、网络安全、大数据、人工智能、U3D游戏、小程序等相关领域知识。
欢迎👍点赞、✍评论、⭐收藏

文章目录

  • 🚀前言
  • 🚀一、DataFrame数据分组统计整理
    • 🔎1.`groupby` 方法概述
    • 🔎2.参数详解
    • 🔎3.分组统计场景与实例
      • 🦋3.1 单列分组统计
      • 🦋3.2 多列分组统计
      • 🦋3.3 分组后指定列计算
    • 🔎4.分组数据迭代
    • 🔎5.通过字典/Series分组统计
      • 🦋5.1 字典分组
      • 🦋5.2 Series分组
    • 🔎6.注意事项
    • 🔎7.附:常见聚合函数


🚀前言

在数据分析过程中,数据的分组统计是揭示数据内在规律的重要方法。无论是对销售数据进行汇总,还是分析用户行为,合理的分组统计可以帮助我们更清晰地理解数据背后的趋势和模式。Pandas库中的DataFrame为我们提供了强大的工具,使得分组统计变得简单而高效。

本文将深入探讨如何在DataFrame中进行数据分组和统计整理。我们将介绍如何使用Pandas的groupby功能,进行多种汇总操作,包括计数、求和、平均值等。同时,我们还会展示如何处理复杂数据场景,比如多重分组和自定义聚合函数。通过具体的示例和实用技巧,帮助你掌握数据分组的核心思路,提高数据分析的准确性和效率。

🚀一、DataFrame数据分组统计整理

🔎1.groupby 方法概述

DataFrame.groupby() 是 Pandas 中用于数据分组统计的核心方法,支持灵活的分组规则和聚合操作,功能类似 SQL 的 GROUP BY。语法如下:

python">DataFrame.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True, squeeze=False, observed=False
)

🔎2.参数详解

参数说明
by分组依据:列名、列名列表、字典、Series 或函数
axis分组方向:0 按列分组(默认),1 按行分组
level多层索引时指定层级(默认 None
as_index是否以分组键为索引:True(默认),False 返回普通索引
sort是否对分组结果排序:True(默认),False 保留原始顺序
group_keys是否保留分组键:True(默认),False 隐藏分组键
observed分类数据分组时,是否仅显示观测值:False(默认显示所有值)

🔎3.分组统计场景与实例

🦋3.1 单列分组统计

场景:按“一级分类”分组统计销量总和
代码:

python">import pandas as pd  #导入pandas模块
#设置数据显示的列数和宽度
pd.set_option('display.max_columns',500)
pd.set_option('display.width',1000)
#解决数据输出时列名不对齐的问题
pd.set_option('display.unicode.east_asian_width', True)
df=pd.read_csv(

http://www.ppmy.cn/server/171304.html

相关文章

蓝桥杯 Java B 组之记忆化搜索(滑雪问题、斐波那契数列)

Day 5:记忆化搜索(滑雪问题、斐波那契数列) 📖 一、记忆化搜索简介 记忆化搜索(Memoization) 是一种优化递归的方法,它利用 哈希表(HashMap)或数组 存储已经计算过的结果…

脑机接口SSVEP经典算法 ITCCA个体模板典型相关分析 matlab实战

文章目录 前言一、ItCCA的进步二、在C-VEP的应用1.C-VEP介绍2.应用方法 三、在SSVEP的应用1.标准CCA模板的局限2. 实验结果:ITCCA的优势 四、matlab实现 前言 itCCA最开始用于C-VEP(code modulated VEP)信号的解码,这种信号的特征难以用正余弦波去描述&a…

Anaconda安装 超详细版 (2025版)

目录 第一步:下载anaconda安装包 官网下载:Anaconda | Built to Advance Open Source AI 清华大学镜像站下载(速度较快) 第二步:安装anaconda 第三步:验证安装 扩展 创建conda基本环境 激活conda环…

基础设施安全(Infrastructure Security)是什么?

基础设施安全(Infrastructure Security)指的是保护IT基础设施(包括物理和云端的服务器、网络设备、存储、数据库等)免受网络攻击、数据泄露、未授权访问、系统故障等威胁的各种安全措施和技术。 1. 基础设施安全的主要组成部分 &…

十一、k8s安全机制

k8s作为一个分布式的微服务管理系统,保证集群安全是一个非常重要的任务, 核心-----------api-server 我们围绕集群权限的设置,其实就是设置api-server权限。 围绕api-server的权限机制,分为三个步骤: 1、认证------…

如何通过JS实现关闭网页时清空该页面在本地电脑的缓存存储?

要通过JavaScript实现关闭网页时清空该页面在本地电脑的缓存存储,可以采用以下方法: 使用window.onbeforeunload事件监听器: 在Vue.js应用中,可以在App.vue组件的mounted生命周期钩子中监听window.onbeforeunload事件&#xff0c…

Python连接SQL SEVER数据库全流程

背景介绍 在数据分析领域,经常需要从数据库中获取数据进行分析和处理。而SQL Server是一种常用的关系型数据库管理系统,因此学习如何使用Python连接SQL Server数据库并获取数据是非常有用的。 以下是Python使用pymssql连接SQL Server数据库的全流程&a…

【FL0086】基于SSM和微信小程序的垃圾分类小程序

🧑‍💻博主介绍🧑‍💻 全网粉丝10W,CSDN全栈领域优质创作者,博客之星、掘金/知乎/b站/华为云/阿里云等平台优质作者、专注于Java、小程序/APP、python、大数据等技术领域和毕业项目实战,以及程序定制化开发…