python脚本处理excel文件

devtools/2025/4/1 15:26:47/

1.对比perl和python

分别尝试用perl和python处理excel文件，发现perl的比较复杂，比如说read excel就有很多方式

Spreadsheet::Read

use Spreadsheet::ParseExcel

不同的method，对应的取sheet的cell方式也不一样。更复杂的是处理含有中文内容的Excel。用perl目前没有成功过。

对于python来说就比较简单，目前使用openpyxl库，处理起来清晰明了

2.python处理excel实例

下面给出一个python处理Excel的实例

用python完成两个excel合并，要求如下：

1. 24xiaoxue.xlsx有A-G列，24zhongxue.xlsx有A-G列

2.用24zhongxue.xlsx的D列匹配24xiaoxue.xlsx的D列，如果有相同项，将24xiaoxue.xlsx相同项所在行添加到24zhongxue.xlsx行尾，并输出到新的excel

3.支持中文内容

编码声明需要放在文件的第一行或第二行，一般使用 # -*- coding: 编码格式 -*- 这种形式。常见的编码格式有 utf-8、gbk、gb2312 等。

python"># -*- coding: gb2312 -*- #for 中文支持
import openpyxl# 定义文件路径
file1 = '24zhongxue - 副本.xlsx'  # 小学文件
file2 = '24xiaoxue - 副本.xlsx' # 中学文件
#file1 = 'xxxx.xlsx'  # 小学文件
#file2 = 'xxxx.xlsx' # 中学文件
output_file = 'merged_result.xlsx' # 输出文件# 加载两个Excel文件
wb1 = openpyxl.load_workbook(file1)
wb2 = openpyxl.load_workbook(file2)# 获取第一个工作表
ws1 = wb1.active
ws2 = wb2.active# 创建一个新的工作簿用于保存结果
wb_result = openpyxl.Workbook()
ws_result = wb_result.active# 将24zhongxue.xlsx的标题行复制到新工作簿
for col in range(1, 8):  # A-G列for row in range(1,ws2.max_row+1):ws_result.cell(row=row, column=col).value = ws2.cell(row=row, column=col).value# 创建一个字典，用于存储24xiaoxue.xlsx中D列的值和对应的行
match_dict = {}
for row in range(1, ws1.max_row + 1):  # 从第1行开始key = ws1.cell(row=row, column=4).value  # D列的值if key:match_dict[key] = row# 遍历24zhongxue.xlsx的D列，查找匹配项
row_count = 1  # 新工作簿的行计数器
for row in range(1, ws2.max_row + 1):  # 从第1行开始key = ws2.cell(row=row, column=4).value  # D列的值if key and key in match_dict:# 如果找到匹配项，将24xiaoxue.xlsx中匹配的行复制到新工作簿matched_row = match_dict[key]for col in range(1, 8):  # A-G列ws_result.cell(row=row, column=col+10).value = ws1.cell(row=matched_row, column=col).valuerow_count += 1else:# 如果没有找到匹配项，将24zhongxue.xlsx的当前行复制到新工作簿#for couse Spreadsheet::ParseExcell in range(1, 8):  # A-G列#    ws_result.cell(row=row_count, column=col).value = ws2.cell(row=row, column=col).valuerow_count += 1# 保存结果到新的Excel文件
wb_result.save(output_file)print(f"合并完成，结果已保存到 {output_file}")