python数据分析模块
- Python与数据分析的关系
- 数据分析常用模块
- Python数据分析常用类库
- 1.数组计算的数学模块-Numpy
- 2.Pandas——数据分析核心库
- 3.Matplotlib——绘制数据图表的 Python 库
- 4.批量处理Excel文件的模块-xlwings
- 5.操作路径、文件夹和文件-pathlib
- 模块的交互
- xlwings 模块与pandas模块的交互
- xlwings 模块与matplotlib模块的交互
Python与数据分析的关系
数据分析常用模块
Python数据分析常用类库
1.数组计算的数学模块-Numpy
- 快速高效的多维数组对象 ndarray
- 对数组执行元素级的计算以及直接对数组执行数学运算的函数
- 读写硬盘上基于数组的数据集的工具
- 线性代数运算、傅里叶变换,以及随机数生成的功能
- 将 C、C++、Fortran 代码集成到 Python 的工具。
!!!Numpy模块的主要特点就是引入了数组的概念
2.Pandas——数据分析核心库
- 提供了一系列能够快速、便捷地处理结构化数据的数据结构和函数。
- 高性能的数组计算功能以及电子表格和关系型数据库(如 SQL)灵活的数据处理功能。
- 复杂精细的索引功能,以便便捷地完成重塑、切片和切块、聚合及选取数据子集等操作。
- 二维数据表格DataFrame的创建与索引的修改
- 文件的读取和写入
- 数据的选取和处理
- 数据表的拼接
3.Matplotlib——绘制数据图表的 Python 库
- Python的2D绘图库,非常适合创建出版物上用的图表。
- 操作比较容易,只需几行代码即可生成直方图、功率谱图、条形图、错误图和散点图等图形。
- 提供了pylab的模块,其中包括了NumPy和pyplot中许多常用的函数,方便用户快速进行计算和绘图。
- 交互式的数据绘图环境,绘制的图表也是交互式的。
4.批量处理Excel文件的模块-xlwings
- 可以处理Excel文件的Python模块有很多,如XlsxWriter、xlrd、xlwt、xlutils、openpyxl和xlwings等
- Xlwings模块的功能是最齐全的,它不仅能读、写和修改两种格式的Excel文件,而且能够批量处理多个Excel文件。此外,xlwings模块还能与Excel VBA 结合使用,实现更强大的数据输入和分析功能
创建工作簿 APP()
打开工作簿 open()
保存工作簿 save()
*操控工作表和单元格 *
5.操作路径、文件夹和文件-pathlib
- Pathlib是Python的内置模块,无须单独安装
- 它将原先散落在os,glob等模块中的路径、文件夹和文件处理功能集中起来,以面向对象的方式提供给用户,使用起来更加灵活
- Pathlib模块提供的路径操作包括路径的获取、分解、拼接、修改等,提供的文件夹或文件的新建、删除、重命名、状态信息获取等
- 创建路径对象 pathlib.Path(path_string)
- 获取特殊路径 pathlib.Path.cwd/home()
- 分解路径 表达式.parts()
- 获取上级路径 表达式.parent/parents
- 获取文件全名、文件主名和文件夹名 表达式.name/stem
- 获取文件扩展名 表达式.suffix/suffixes
- 拼接路径 “/”运算符和joinpath()函数
- 更改文件夹名、文件名、扩展名 with_name()函数和with_suffuix()函数
- 判断文件夹或文件是否存在 exists()函数
- 判断路径指向的对象是文件夹还是文件 is_dir()函数和is_file()函数
- 新建和删除文件夹 mkdir()函数和rmdir()函数
- 新建和删除文件 touch()函数和unlink()函数
- 重命名或移动文件夹和文件 rename()函数和replace()函数
- 罗列文件夹的内容 iterdir()函数
- 罗列并筛选文件夹的内容 glob()函数和rglob()函数
- 获取文件夹或文件的状态信息 stat()函数
模块的交互
xlwings 模块与pandas模块的交互
Xlwings模块可以与pandas模块进行交互。例如,pandas模块创建数据表格,再用xlwings模块将表格写入工作簿:
xlwings 模块与matplotlib模块的交互
用matplotlib模块绘制图表,再用xlwings模块将图表写入工作簿: