python数据分析模块

news/2025/1/11 22:47:54/

python数据分析模块

  • Python与数据分析的关系
  • 数据分析常用模块
    • Python数据分析常用类库
      • 1.数组计算的数学模块-Numpy
      • 2.Pandas——数据分析核心库
      • 3.Matplotlib——绘制数据图表的 Python 库
      • 4.批量处理Excel文件的模块-xlwings
      • 5.操作路径、文件夹和文件-pathlib
  • 模块的交互
    • xlwings 模块与pandas模块的交互
    • xlwings 模块与matplotlib模块的交互

Python与数据分析的关系

在这里插入图片描述
在这里插入图片描述

数据分析常用模块

Python数据分析常用类库

1.数组计算的数学模块-Numpy

  • 快速高效的多维数组对象 ndarray
  • 对数组执行元素级的计算以及直接对数组执行数学运算的函数
  • 读写硬盘上基于数组的数据集的工具
  • 线性代数运算、傅里叶变换,以及随机数生成的功能
  • 将 C、C++、Fortran 代码集成到 Python 的工具。
    !!!Numpy模块的主要特点就是引入了数组的概念

2.Pandas——数据分析核心库

  • 提供了一系列能够快速、便捷地处理结构化数据的数据结构和函数。
  • 高性能的数组计算功能以及电子表格和关系型数据库(如 SQL)灵活的数据处理功能。
  • 复杂精细的索引功能,以便便捷地完成重塑、切片和切块、聚合及选取数据子集等操作。
  • 二维数据表格DataFrame的创建与索引的修改
  • 文件的读取和写入
  • 数据的选取和处理
  • 数据表的拼接

3.Matplotlib——绘制数据图表的 Python 库

  • Python的2D绘图库,非常适合创建出版物上用的图表。
  • 操作比较容易,只需几行代码即可生成直方图、功率谱图、条形图、错误图和散点图等图形。
  • 提供了pylab的模块,其中包括了NumPy和pyplot中许多常用的函数,方便用户快速进行计算和绘图。
  • 交互式的数据绘图环境,绘制的图表也是交互式的。

4.批量处理Excel文件的模块-xlwings

  • 可以处理Excel文件的Python模块有很多,如XlsxWriter、xlrd、xlwt、xlutils、openpyxl和xlwings等
    在这里插入图片描述
  • Xlwings模块的功能是最齐全的,它不仅能读、写和修改两种格式的Excel文件,而且能够批量处理多个Excel文件。此外,xlwings模块还能与Excel VBA 结合使用,实现更强大的数据输入和分析功能
    创建工作簿 APP()
    在这里插入图片描述
    打开工作簿 open()
    在这里插入图片描述
    保存工作簿 save()
    在这里插入图片描述
    *操控工作表和单元格 *
    在这里插入图片描述

5.操作路径、文件夹和文件-pathlib

  • Pathlib是Python的内置模块,无须单独安装
  • 它将原先散落在os,glob等模块中的路径、文件夹和文件处理功能集中起来,以面向对象的方式提供给用户,使用起来更加灵活
  • Pathlib模块提供的路径操作包括路径的获取、分解、拼接、修改等,提供的文件夹或文件的新建、删除、重命名、状态信息获取等
    • 创建路径对象 pathlib.Path(path_string)
    • 获取特殊路径 pathlib.Path.cwd/home()
    • 分解路径 表达式.parts()
    • 获取上级路径 表达式.parent/parents
    • 获取文件全名、文件主名和文件夹名 表达式.name/stem
    • 获取文件扩展名 表达式.suffix/suffixes
    • 拼接路径 “/”运算符和joinpath()函数
    • 更改文件夹名、文件名、扩展名 with_name()函数和with_suffuix()函数
    • 判断文件夹或文件是否存在 exists()函数
    • 判断路径指向的对象是文件夹还是文件 is_dir()函数和is_file()函数
    • 新建和删除文件夹 mkdir()函数和rmdir()函数
    • 新建和删除文件 touch()函数和unlink()函数
    • 重命名或移动文件夹和文件 rename()函数和replace()函数
    • 罗列文件夹的内容 iterdir()函数
    • 罗列并筛选文件夹的内容 glob()函数和rglob()函数
    • 获取文件夹或文件的状态信息 stat()函数

模块的交互

xlwings 模块与pandas模块的交互

Xlwings模块可以与pandas模块进行交互。例如,pandas模块创建数据表格,再用xlwings模块将表格写入工作簿:
在这里插入图片描述

xlwings 模块与matplotlib模块的交互

用matplotlib模块绘制图表,再用xlwings模块将图表写入工作簿:
在这里插入图片描述


http://www.ppmy.cn/news/169563.html

相关文章

主板、内存条、硬盘、显卡认识和选购

主板的主要功能是为计算机的其他部件提供插槽和接口,计算机的所有部件通过主板间接或直接组成了一个工作平台。主板是主机内部最大的一块电路板,上面安装了组成计算机的主要电路系统。 主芯片组是主板性能的核心,通常有南桥芯片和北桥芯片组成…

12G大显存,七彩虹在CES发布多款RTX 3060显卡和游戏整机新品

北京时间2021年1月13日凌晨,英伟达在CES上发布了采用NVIDIA Ampere 架构的 GeForce RTX™ 3060 全新GPU ,届时其核心AIC七彩虹也同步向全球用户首发了旗下多款iGame及战斧系列GeForce RTX™ 3060显卡和游戏整机,将为数百万 PC 玩家带来更好的…

CMake Install:深度解析与实践

CMake Install:深度解析与实践 一、CMake Install简介(Introduction to CMake Install)1.1 CMake Install的核心概念(Core Concepts of CMake Install)1.1.1 目标(Targets)1.1.2 安装规则&#…

Spring Boot的核心组件和工作原理

引言 Spring Boot是一个快速构建应用程序的框架,通过自动化配置和约定优于配置的原则,可以快速地创建可独立运行的、生产级别的Spring应用程序。Spring Boot的核心组件是自动配置、起步依赖和嵌入式Web服务器。 在本文中,我们将深入了解Spr…

Linux运维:系统日志篇

一.系统日志 您可以将系统日志理解为记录系统运行情况的一种日记。它包含了各种级别的信息,从调试信息和错误报告到警告和系统事件等。通过对系统日志进行分析,管理员可以了解系统的状态和运行情况,发现并解决问题,确保系统的正常…

VESC操作入门——PPM输入控制和ADC输入控制

目录 一、PPM输入控制1.1、硬件准备1.2、PPM信号1.3、校准电机1.4、输入设置 二、ADC输入控制2.1、硬件准备2.2、更改固件2.3、电压信号2.4、校准电机2.5、输入设置 三、电动车转把控制3.1、转把说明3.2、转把测试 ODrive、VESC和SimpleFOC 教程链接汇总:请点击 一、…

超级魔术师克里斯·安吉尔 漂浮高空 神秘消失魔术

克里斯安吉尔,世界街头魔术之神,唯一一个2001年到2004年连续获得世界最佳魔术师称号的人。他是魔术师,音乐家,逃生术表演专家和特技表演家。现为《破胆王》的主持人。出演过电视剧《街头魔术》,也曾出过多盘专辑。主要…

与擎标同行|君智百亿战略咨询荣获ISO27001认证

近日,在上海擎标顾问团队的指导下,君智百亿战略咨询(公司名称:上海君智企业管理有限公司)顺利获得了ISO27001信息安全管理体系认证。信息安全管理体系建立是企业信息化建设中的重要环节,对企业安全管理和企…