python实战一:合并多个Excel中数据

ops/2024/11/13 9:33:33/

看不懂可以跟着视频学一下,关于基础课程项目也可以私聊我!

视频+源码:
链接:https://pan.quark.cn/s/2055653f735b

之前我们已经学习了如何读取和写入Execl数据,今天我们来用一个实例来进行表格的合并。如下是
2021年4个季度的销售数据明细。我们把它放在了D盘2021年销售明细的文件夹下。

每一个季度销售数据里又包含三个月的具体明细,每个月的销售记录都有1000多条,现在需要批量合
并4个工作簿,共计12张表,使用Ctrl+C、Ctrl+V功能已经不能很好的解决这里的问题,这里我们就可以用
代码解决。

上代码:

python">import time
from openpyxl import Workbook, load_workbook
import osdef 合并表格(file_dir, save_dir):files_name = os.listdir(file_dir)# 创建新表格new_wb = Workbook()new_ws = new_wb.activeheader = ['销售日期', '员工工号', '销售员', '货号', '销售单号', '销量', '销售额']new_ws.append(header)# 向新的表格写入数据for file_name in files_name:wb = load_workbook(file_dir + "\\" + file_name)for sheet in wb.sheetnames:ws = wb[sheet]# 设置values_only=True 则可以直接得到单元格中的值for row in ws.iter_rows(min_row=2, values_only=True):new_ws.append(row)print('全年销售数据为 %s 行' % (new_ws.max_row - 1)) # 去除第一行标题剩下的则为全年销
售数据总行数# 数据保存if not os.path.exists(save_dir):os.makedirs(save_dir)new_wb.save(save_dir + "\\" + "全年数据.xlsx")if __name__ == '__main__':开始时间 = time.time()合并表格(r"D:\2021年销售明细", r"D:\2021年销售分析")print('合并完成耗时:', time.time() - 开始时间, "秒")

 运行结果:

全年销售数据为 13065 行
合并完成耗时: 6.565231084823608 秒

代码很简单,首先使用os库,循环遍历D:\2021年销售明细 目录下所有文件,然后再使用openpyxl库循环遍历单元格中的数据,并且导入,合并结果保存到【全年数据,xsx】文档下。从结果可以看出总共合并了13065行数据,只花了不到7秒钟。
我们打开看下【全年数据.xlsx】可以看到行数计数是跟代码统计的行数相吻合的。

自我演示如下:

python">import time  #导入 time 模块,以便使用时间相关的功能,比如测量程序运行时间。
from openpyxl import Workbook, load_workbook  #从 openpyxl 库导入 Workbook 和 load_workbook 类。这两个类用于创建和加载 Excel 工作簿。
import os  #导入 os 模块,用于处理文件和目录路径等操作。def 合并表格(file_dir, save_dir):  #定义一个名为 合并表格 的函数,它接受两个参数:file_dir(包含要合并的 Excel 文件的目录路径)和 save_dir(保存合并结果的目录路径)。files_name = os.listdir(file_dir)  #使用 os.listdir 函数列出 file_dir 目录下的所有文件和目录的名称,并将这些名称存储在 files_name 列表中。print(files_name)  #打印 files_name 列表的内容,这样你可以看到 file_dir 目录中的所有文件和目录名称。new_wb = Workbook()     #这里新建一个工作铺,相当新建一个文件夹new_ws = new_wb.active  #新建一个Excel表格header = ['销售日期', '员工工号', '销售员', '货号', '销售单号', '销量', '销售额']  #表格的头部new_ws.append(header)   #将表格的头部加入到新建的表格中去for file_name in files_name:   #利用for循环遍历将几个旧表格内容添加到新表格中if file_name.endswith('.xlsx'):  #检查文件名是否以 .xlsx 结尾,以确定它是否是一个 Excel 文件。file_path = os.path.join(file_dir, file_name)#构建 Excel 文件的完整路径,file_dir 是文件夹路径,file_name 是文件名。wb = load_workbook(file_path)#使用 openpyxl 库的 load_workbook 函数加载 Excel 文件,以便在代码中进一步处理这个工作簿。for sheet in wb.sheetnames:  #遍历工作簿中的所有工作表名称。ws = wb[sheet]  #获取当前工作表对象 ws。for row in ws.iter_rows(min_row=2, values_only=True):  #遍历当前工作表中的所有数据行,从第二行开始(跳过表头),并且只获取单元格的值,不包括单元格格式。new_ws.append(row)  #将遍历到的数据行 row 添加到新工作表 new_ws 中if not os.path.exists(save_dir):  #检查保存目录 save_dir 是否存在。如果不存在,则创建这个目录。os.makedirs(save_dir)  #创建最终保存文件的完整路径,save_dir 是保存目录,"全年数据.xlsx" 是文件名。save_path = os.path.join(save_dir, "全年数据.xlsx")  #创建最终保存文件的完整路径,save_dir 是保存目录,"全年数据.xlsx" 是文件名。new_wb.save(save_path)  #将新创建的工作簿 new_wb 保存到上述路径。if __name__ == '__main__':  #确保只有在脚本被直接运行时,才会执行以下代码块。开始时间 = time.time()  #记录脚本开始运行的时间。合并表格(r"D:\2021年销售明细", r"D:\2021年销售汇总")  #调用 合并表格 函数,传入输入和输出目录。print('合并完成耗时:', time.time() - 开始时间, "秒")  #打印合并过程的耗时。

以上是我演示有什么不懂的地方可以私信我!谢谢阅读!可以技术交流!


http://www.ppmy.cn/ops/105269.html

相关文章

ThinkPHP之入门讲解

文章目录 1 ThinkPHP1.1 框架1.1.1 目录讲解1.1.1.1 5.x1.1.1.2 6.0以上 1.1.2 配置文件1.1.2.1 5.x1.1.2.2 6.0以上 1.1.3 函数文件1.1.3.1 5.x1.1.3.1 6.0以上 1.2 控制器1.2.1 控制器的后缀1.2.2 框架中的命名空间1.2.3 url访问1.2.4 调试模式1.2.4.1 5.x1.2.4.2 6.0以上 1.…

帅地:秋招入职腾讯,后裸辞创业年入百万,一位全职程序员博主的第六年

这是《开发者说》的第17期,这次我们采访的是知名的程序员博主:帅地。 帅地从大学开始接触公众号,在大学毕业时就沉淀了10w垂直粉丝,月入近10w。在秋招阶段,帅地靠扎实的算法基础和技术功底顺利入职腾讯。“还没折腾够”…

【零知识证明】MiMC哈希函数电路

1 哈希电路 哈希函数电路实现: pragma circom 2.0.0;// y (x k c) ^ 5 // 输入信号x, k ,常量c // base x k c // base2 base * base // base4 base2 * base2 // base5 base *base4 // 输出 ytemplate MIMC5(){signal input x;signal input k…

Day-03-信号与槽的三种代码引入方式

一、构造函数引用 1、引出三个按键 2、为了方便区分和编写,对控件进行改名 3、切记切记,注意函数声明 4、注意相关的头文件 5、快捷跳转 二、Lambda函数引用 lambda函数不需要另外再单独声明其他函数 三、函数指针直接连接信号与槽 此种引用需要另外声明…

数据库系统之逻辑设计

数据库的逻辑设计是将概念设计阶段产生的实体关系图(ER图)转化为具体的数据库表结构的过程。这一阶段的目标是创建一个高效、易于管理和扩展的数据库模式。下面我将通过一个简单的例子来详细介绍数据库逻辑设计的过程。 ### 示例:图书管理系…

C_12_链表

链表 概述: 是一种数据结构 分为单链表与双链表两种 单链表: 链表种节点是离散的在内存中开辟空间的 因为是离散开辟,内存地址通常不是连续的,地址不一定相邻,甚至可能存在其他数据在它们之间。 双链表 1 定义节点 分…

Anaconda的包管理

使用pip命令安装第三方包的方法,其中package-name代表程序包的名字 pip install package-name使用conda下载Python程序包 conda install package-name使用conda list可以查看有哪些包是使用conda进行安装的。 使用pip list可以查看有哪些包是使用pip进行安装的。

【STM32】FMC

FMC功能与FSMC类似,但比FSMC更强大,但仅在F4 / F7 / H7等高级一点的MCU上支持,F1不支持。虽然我的是F103,但顺便都看了。 大部分图片来源:正点原子HAL库课程 专栏目录:记录自己的嵌入式学习之路-CSDN博客 目…