【愚公系列】《Python网络爬虫从入门到精通》034-DataFrame简单数据计算整理

devtools/2025/2/26 19:17:17/
标题详情
作者简介愚公搬代码
头衔华为云特约编辑,华为云云享专家,华为开发者专家,华为产品云测专家,CSDN博客专家,CSDN商业化专家,阿里云专家博主,阿里云签约作者,腾讯云优秀博主,腾讯云内容共创官,掘金优秀博主,亚马逊技领云博主,51CTO博客专家等。
近期荣誉2022年度博客之星TOP2,2023年度博客之星TOP2,2022年华为云十佳博主,2023年华为云十佳博主,2024年华为云十佳博主等。
博客内容.NET、Java、Python、Go、Node、前端、IOS、Android、鸿蒙、Linux、物联网、网络安全、大数据、人工智能、U3D游戏、小程序等相关领域知识。
欢迎👍点赞、✍评论、⭐收藏

文章目录

  • 🚀前言
  • 🚀一、DataFrame简单数据计算整理
    • 🔎1.求和(`sum`函数)
      • 🦋1.1 语法与参数
      • 🦋1.2 示例代码
    • 🔎2.求均值(`mean`函数)
      • 🦋2.1 语法与参数
      • 🦋2.2 示例代码
    • 🔎3.求最大值(`max`函数)
      • 🦋3.1 语法与参数
      • 🦋3.2 示例代码
    • 🔎4.求最小值(`min`函数)
      • 🦋4.1 语法与参数
      • 🦋4.2 示例代码
    • 🔎5.注意事项
    • 🔎6.扩展函数


🚀前言

在数据分析的过程中,数据的计算与整理是至关重要的步骤。对于使用Pandas库的分析师而言,DataFrame不仅是数据存储的工具,更是进行各种计算和整理的强大助手。通过简单的数据计算,我们可以快速得出有价值的洞察,帮助我们更好地理解数据背后的趋势与模式。

本文将重点介绍如何在DataFrame中进行简单的数据计算与整理,包括基本的统计计算、分组汇总、数据透视等操作。我们将通过实际案例,展示如何利用Pandas的强大功能来快速处理和分析数据,让复杂的计算变得简单直观。

🚀一、DataFrame简单数据计算整理

🔎1.求和(sum函数)

功能:计算行或列的数据总和。

🦋1.1 语法与参数

python">DataFrame.sum(axis=0, skipna=True, level=None)
参数说明
axis0 按列求和(默认),1 按行求和
skipnaTrue 自动忽略 NaN(默认),False 包含 NaN(结果为 NaN)
level多层索引时指定层级(默认 None

🦋1.2 示例代码

python">import pandas as pd# 数据准备
data = [[110, 105, 99], [105, 88, 115], [109, 120, 130]]
index = [1, 2, 3]
columns = ['语文', '数学', '英语']
df = pd.DataFrame(data

http://www.ppmy.cn/devtools/162863.html

相关文章

【Rust中级教程】2.8. API设计原则之灵活性(flexible) Pt.4:显式析构函数的问题及3种解决方案

喜欢的话别忘了点赞、收藏加关注哦(加关注即可阅读全文),对接下来的教程有兴趣的可以关注专栏。谢谢喵!(・ω・) 说句题外话,这篇文章一共5721个字,是我截至目前写的最长的一篇文章&a…

社群团购平台的愿景构建与开源链动2+1模式S2B2C商城小程序应用探索

摘要:在数字经济背景下,社群团购作为一种新兴的商业模式,凭借其独特的互动性和便捷性,展现出巨大的市场潜力。本文旨在探讨社群团购平台愿景的构建策略,并结合开源链动21模式S2B2C商城小程序的应用,为创业者…

【linux配置】 修改内核网络参数

命令解释 echo 1 > /proc/sys/net/ipv4/conf/all/arp_ignore 这个命令的具体含义是: echo 1:将值1写入文件。 /proc/sys/net/ipv4/conf/all/arp_ignore:将值1写入 /proc/sys/net/ipv4/conf/all/arp_ignore 文件,从而修改内核参…

Nginx的安装和部署以及Nginx的反向代理与负载均衡

Nginx的安装和部署以及Nginx的反向代理与负载均衡 1. 本文内容 Nginx的安装Nginx的静态网站部署Nginx的反向代理与负载均衡,配置反向代理与负载均衡 2. Nginx的安装与启动 2.1 什么是Nginx Nginx是一款高性能的http服务器/反向代理服务器及电子邮件&#xff08…

机器学习基础入门——机器学习库介绍(NumPy、pandas、Matplotlib)

机器学习库介绍(NumPy、pandas、Matplotlib) 在 Python 机器学习的领域中,NumPy、pandas 和 Matplotlib 是三个不可或缺的基础库。它们分别在数值计算、数据处理与分析以及数据可视化方面发挥着关键作用,极大地提升了开发效率与数…

《Operating System Concepts》阅读笔记:p125-p146

《Operating System Concepts》学习第 14 天,p125-p146 总结,总计 20 页。 一、技术总结 1.IPC(Interprocesses Comunicating) (1) shared memory (2)message passing 2.primitive (1)语言中的 primitive primitive: primus(“first”, 参考 prim…

xxl-job 源码解析,分布式任务调度xxl-job 客户端启动 执行器原理(二)

当前主要介绍了:执行器如何进行初始化,如何向调度器注册,调度器侧接收相关方法分析 目录: 1. 配置xxl-job数据库环境,将调度器,执行器demo进行启动。 2. 分析执行器启动流程 3. 分析调度器接收心跳流程 1…

将VsCode变得顺手好用(1

目录 设置中文 配置调试功能 提效和增强相关插件 主题和图标相关插件 设置中文 打开【拓展】 输入【Chinese】 下载完成后重启Vs即可变为中文 配置调试功能 在随便一个位置新建一个文件夹,用于放置调试文件以及你未来写的代码,随便命名但切记不可用中…