代码+注释
绝对详细的xlsx表格转为csv文件过程 : D
# coding = utf-8
import os
import pandas as pd
import csv
from openpyxl import load_workbookdef get_filename(path_filename):"""获取文件所在文件夹路径、带拓展文件名、文件名、拓展名:param path_filename: 带拓展完整路径:return: 文件所在文件夹路径、带拓展文件名、文件名、拓展名"""(filepath, tempfilename) = os.path.split(path_filename)(filename, extension) = os.path.splitext(tempfilename)return filepath, tempfilename, filename, extensiondef XLSX2CSV(data_filenamepath):"""转换 xlsx -> csv:param data_filenamepath: xlsx 文件路径:return: csv 文件路径"""filepath, tempfilename, filename, extension = get_filename(data_filenamepath)# 读入xlsx表格,表格内有n个工作簿(worksheets),以下标0~n-1获取sheet = load_workbook(data_filenamepath).worksheets[0]# 取出表格内容转为列表形式,各项为包含元素的结构体rows = list(sheet.rows)# 用于保存csv列表sheet_val = []# 迭代读取所有的行,取出数值for row in rows:row_val = [col.value for col in row]sheet_val.append(row_val)# 例子中第1行为标签名,2~len为表格内容print("excle表格转化csv", sheet_val[0])# csv 文件结构 数据内容、标签dt = pd.DataFrame(sheet_val[1:len(sheet_val)-1], columns=sheet_val[0])save_dir = "【你存放csv文件的文件夹路径】"# 若文件夹未创建,则生成文件夹(多层)if not os.path.exists(save_dir):os.makedirs(save_dir)# 完整csv文件路径CSVfilepath = os.path.join(save_dir, "【你的csv文件名】" + ".csv")# 转为csv文件dt.to_csv(CSVfilepath, index=0)return CSVfilepath
其中标签名colums也可以自己自定义,例子中xlsx第一行正好是标签名。
colums格式即列表,标签名个数需与数据列数一致。
colums = ['标签名1', '标签名2', ...]
转化结果
原xlsx:
转化后csv: