EasyExcel动态拆分非固定列Excel表格

server/2025/3/18 13:21:22/

使用EasyExcel动态拆分非固定列Excel表格

在Excel数据解析场景中,​动态列结构拆分是典型挑战(如供应链系统中不同品类的属性字段差异较大)。传统基于POJO映射的方案无法应对列数量不固定的场景。本方案采用EasyExcel的动态模型解析和Map数据承载技术,实现按指定列(如"部门")拆分时自动保留原始列结构,支持以下特性:

  • 无需预定义Java实体类
  • 自动继承原始表格所有列头
  • 拆分后文件保留完整数据格式

无实体动态读取表格

继承 AnalysisEventListener 创建一个自定义监听器,用于处理 Excel 文件的解析和数据拆分。在监听器中,可以重写 invokeHeadMap 方法来获取表头信息,重写 invoke 方法来处理每一行数据。

java">@Data
public class CustomExcelListener extends AnalysisEventListener<Map<Integer, String>> {private Map<Integer, String> headerMap; // 表头信息private final Map<String, List<Map<String, String>>> dataMap = new LinkedHashMap<>(); // 拆分后的数据,此处使用LinkedHashMap保持插入顺序private int specifiedColumnIndex = 0;指定某一列拆分表格,可使用列索引/列名@Overridepublic void invokeHeadMap(Map<Integer, String> headMap, AnalysisContext context) {this.headerMap = headMap;// 根据表头初始化 dataMapfor (Map.Entry<Integer, String> entry : headMap.entrySet()) {dataMap.put(entry, new ArrayList<>());}}@Overridepublic void invoke(Map<Integer, String> data, AnalysisContext context) {// 获取指定列的值String specifiedColumnValue = data.get(specifiedColumnIndex);// 如果指定列的值为空,设置一个默认值if (specifiedColumnValue == null) {specifiedColumnValue = "默认分类";}// 将整行数据存储到对应的分类中dataMap.computeIfAbsent(specifiedColumnValue, k -> new ArrayList<>()).add(new HashMap<>(data));}@Overridepublic void doAfterAllAnalysed(AnalysisContext context) {// 可进行数据校验或数据处理// 对于拆分后的数据处理可以在doAfterAllAnalysed()中,也可以通过listener.getDataMap()获取数据后自行处理。}
}

解析 Excel 文件

在解析 Excel 文件时,使用 EasyExcel 的 read 方法,并将自定义的监听器传递进去。

java">File targetFile = new File("/yourFile/file.xls"); // 读取的文件
int specifiedColumnIndex = 0:// 可传入指定列索引,用以拆分excel表格
CustomExcelListener listener = new CustomExcelListener("可传入指定列索引,用以拆分excel表格");
ExcelReader excelReader = EasyExcel.read(targetFile).sheet(0).registerReadListener(listener ).doRead();
listener.getDataMap();// 可获取拆分后的表数据

通过 specifiedColumnIndex 变量来指定用于拆分表格的列索引。在实际应用中,这个索引值可能需要根据具体情况动态确定。

总结

通过上述方案,可高效应对供应链、电商等场景中非固定列结构的Excel拆分需求,具体性能优化需自行添加。实际应用中建议结合具体业务场景选择拆分策略(如按时间/地区等多列组合拆分)。


http://www.ppmy.cn/server/175966.html

相关文章

C++之list类及模拟实现

目录 list的介绍 list的模拟实现 定义节点 有关遍历的重载运算符 list的操作实现 &#xff08;1&#xff09;构造函数 (2)拷贝构造函数 &#xff08;3&#xff09;赋值运算符重载函数 &#xff08;4&#xff09;析构函数和clear成员函数 &#xff08;5&#xff09;尾…

C# ManualResetEvent‌的高级用法

一、ManualResetEvent 的核心作用‌ ManualResetEvent 是 C# 中用于 ‌线程同步‌ 的类&#xff08;位于 System.Threading 命名空间&#xff09;&#xff0c;通过信号机制控制线程的等待与执行。其核心功能包括&#xff1a; 阻塞线程‌&#xff1a;调用 WaitOne() 的线程会等…

【实测闭坑】LazyGraphRAG利用本地ollama提供Embedding model服务和火山引擎的deepseek API构建本地知识库

LazyGraphRAG 2024年4月&#xff0c;为解决传统RAG在全局性的查询总结任务上表现不佳&#xff0c;微软多部门联合提出Project GraphRAG&#xff08;大模型驱动的KG&#xff09;&#xff1b;2024年7月&#xff0c;微软正式开源GraphRAG项目&#xff0c;引起极大关注&#xff0c…

【前端面试题】宏任务与微任务的区别

宏任务与微任务的区别 JavaScript采用单线程模型&#xff0c;通过 事件循环&#xff08;Event Loop&#xff09; 机制处理异步操作。 类比于厨师上菜的过程&#xff0c;顾客点的菜可能存在容易处理的 “软菜” 与难处理的 “硬菜” &#xff0c;以及要加米饭酒水这些立马可以上…

Java常用设计模式

设计模式是软件开发中解决常见问题的模板或指南。Java中的23种设计模式通常被分为三大类&#xff1a;创建型模式&#xff08;Creational Patterns&#xff09;、结构型模式&#xff08;Structural Patterns&#xff09;和行为型模式&#xff08;Behavioral Patterns&#xff09…

python脚本实现服务器内存和cpu使用监控,并记录日志,可以设置阈值和采样频率

Python 脚本&#xff0c;实现以下功能&#xff1a; 按日期自动生成日志文件&#xff08;例如 cpu_mem_20231001.csv&#xff09;当 CPU 或内存超过阈值时触发记录独立记录报警事件&#xff08;保存到 alert.log&#xff09;支持自定义阈值和监控间隔 脚本代码 import psutil …

HCIA-PPP

一、基本概念 1、定义&#xff1a;PPP 协议是一种数据链路层协议&#xff0c;在两点之间建立直接通信连接。常用于拨号上网、宽带接入、路由器间通信等。 2、核心功能&#xff1a; ①链路控制&#xff1a;建立、配置和测试数据链路连接。 ②网络层协议支持&#xff1a;支持…

【密码学——基础理论与应用】李子臣编著 第四章 SM4分组密码算法 课后习题

免责声明 这里都是自己搓或者手写的。 里面不少题目感觉有问题或者我的理解有偏颇&#xff0c;请大佬批评指正&#xff01; 不带思考抄作业的请自动退出&#xff0c;我的并非全对&#xff0c;仅仅提供思维&#xff01; SM4的python实现 基于AI生成的SM4加密算法-CSDN博客 题…