python——Pandas库

ops/2024/10/21 14:30:07/

Pandas 是一个非常强大的 Python 库,专门用于数据处理和分析。在处理 Excel 文件时,它提供了简单且功能丰富的 API,使得读取、写入、筛选、修改以及分析 Excel 数据变得十分便捷。以下是一些常用的 Pandas API 及其应用场景,以及如何在复杂场景下使用它们的示例。

基础 API 及使用场景

  1. 读取 Excel 文件

    • API: pandas.read_excel()
    • 场景: 从 Excel 文件加载数据到 DataFrame 对象中,以便进行进一步处理。
    python">import pandas as pd
    df = pd.read_excel('example.xlsx', sheet_name='Sheet1')
    
  2. 写入 Excel 文件

    • API: DataFrame.to_excel()
    • 场景: 将 DataFrame 数据保存到 Excel 文件中。
    python">df.to_excel('output.xlsx', index=False)  # index=False 避免将索引写入Excel
    

复杂场景示例

数据筛选与排序
  • 筛选特定条件的行

    python">filtered_df = df[df['Column_Name'] == 'SomeValue']
    
  • 多条件筛选

    python">filtered_df = df[(df['Column1'] > 100) & (df['Column2'] == 'Category')]
    
  • 排序

    python">sorted_df = df.sort_values(by=['Column_Name'], ascending=False)
    
数据清洗
  • 处理缺失值

    python">df.fillna(value=0, inplace=True)  # 用0填充缺失值
    
  • 删除含有缺失值的行

    python">cleaned_df = df.dropna(subset=['Column_Name'])
    
数据转换与计算
  • 添加新列

    python">df['New_Column'] = df['Column1'] + df['Column2']
    
  • 数据类型转换

    python">df['Column_Name'] = df['Column_Name'].astype('int')  # 将列转换为整型
    
  • 分组聚合

    python">grouped_df = df.groupby('Group_Column')['Value_Column'].sum()
    
复合操作
  • 合并多个工作表到一个 DataFrame

    python">all_sheets_df = pd.concat([pd.read_excel('example.xlsx', sheet_name=sheet) for sheet in pd.ExcelFile('example.xlsx').sheet_names], ignore_index=True)
    
  • 条件性修改数据
    使用 .loc.mask 方法根据条件修改数据。

    python">df.loc[df['Column_Name'] > threshold, 'New_Column'] = 'Above Threshold'
    

总结

Pandas 提供了丰富的方法来高效处理 Excel 文件,无论是简单的数据读写,还是复杂的清洗、转换和分析任务。在处理复杂场景时,通常需要结合多种 Pandas 函数和方法,如条件筛选、数据转换、聚合分析等,以达到数据处理目的。利用 DataFrame 的灵活性和丰富的API,可以应对几乎所有的数据处理挑战。


http://www.ppmy.cn/ops/27151.html

相关文章

【Numpy】一文向您详细介绍 np.linspace()

【Numpy】一文向您详细介绍 np.linspace() 🌈 欢迎莅临我的个人主页👈 这里是我静心耕耘深度学习领域、真诚分享知识与智慧的小天地!🎇 🎓 博主简介:985高校的计算机专业人士,热衷于分享技术见…

【Docker学习】docker checkpoint简单了解

docker checkpoint是一个试验性的功能,旨在用于测试和反馈,未来不确定是否会发生变化或是被删除掉,现有的功能我们可以简单了解了解。 docker checkpoint主要用于管理检查点(CheckPoint)。检查点(CheckPoi…

python绘制R控制图(Range Chart)

R控制图(Range Chart),也称为范围图或移动极差图,是一种用于分析和控制生产过程中的变异性的统计工具。它通常与Xbar控制图(均值图)一起使用,可以提供关于生产过程变异性的额外信息。以下是R控制…

python vtk 非结构化网格体渲染

import vtk# 创建一个非结构化网格对象 unstructuredGrid vtk.vtkUnstructuredGrid()# 创建点(例如:vtkPoints对象)并将其设置到非结构化网格对象上 points vtk.vtkPoints() point0 [0.0, 0.0, 0.0] point1 [1.0, 0.0, 0.0] point2 [1.0…

Linux 信号

目录 信号概述 信号的概念: 进程看待信号的方式: 查看信号: 信号的处理方式: 信号的产生 通过kill指令产生信号: 通过终端按键产生信号: 通过系统调用产生信号: 给任意进程发送任意信号&#xf…

ChatGPT 网络安全秘籍(一)

原文:zh.annas-archive.org/md5/6b2705e0d6d24d8c113752f67b42d7d8 译者:飞龙 协议:CC BY-NC-SA 4.0 前言 在不断发展的网络安全领域中,由 OpenAI 推出的 ChatGPT 所代表的生成式人工智能和大型语言模型(LLMs&#xf…

OpenCV 填洼处理

文章目录 一、简介二、实现代码三、实现效果参考资料一、简介 这里使用一种从外边缘往内部收缩的算法来实现对图像进行填洼处理,当然,在这个过程中,我们需要通过根据指定的最小坡度来对低洼区域进行高程修正处理。(OpenCV版本) 二、实现代码 ImageSmoothing.h #pragma onc…

在Spring中注入动态代理Bean

在Springboot中我们可以通过内置的注解如Service,Component,Repository来注册bean,也可以在配置类中通过Bean来注册bean。这些都是Spring内置的注解。 除此之外,还可以用WebFilter,WebServlet,WebListener…