Java EasyExcel 导出报内存溢出如何解决

ops/2024/11/3 2:32:00/

大家好,我是 V 哥。使用EasyExcel进行大数据量导出时容易导致内存溢出,特别是在导出百万级别的数据时。你有遇到过这种情况吗,以下是V 哥整理的解决该问题的一些常见方法,分享给大家,欢迎一起讨论:
V 哥推荐:2024 最适合入门的 JAVA 课程

EasyExcel大数据量导出常见方法

1. 分批写入
  • EasyExcel支持分批写入数据,可以将数据分批加载到内存中,分批写入Excel文件,避免一次性将大量数据加载到内存中。
  • 示例代码
java">     String fileName = "large_data.xlsx";ExcelWriter excelWriter = EasyExcel.write(fileName).build();WriteSheet writeSheet = EasyExcel.writerSheet("Sheet1").build();// 假设每次写入10000条数据int batchSize = 10000;List<Data> dataList;int pageIndex = 0;do {// 分页获取数据dataList = getDataByPage(pageIndex++, batchSize);excelWriter.write(dataList, writeSheet);} while (dataList.size() == batchSize);// 关闭资源excelWriter.finish();
2. 设置合适的JVM内存
  • 针对大数据导出场景,可以尝试增大JVM的内存分配,例如:
     java -Xms512M -Xmx4G -jar yourApp.jar
  • 解释
    • -Xms512M:设置初始堆大小为512MB。
    • -Xmx4G:设置最大堆大小为4GB。
3. 减少数据对象的复杂性
  • 导出数据时,尽量简化数据对象,避免不必要的嵌套和多余字段的加载,以减少对象占用的内存空间。
4. 关闭自动列宽设置
  • EasyExcel的自动列宽功能会占用大量内存,特别是在数据量较大的情况下。关闭自动列宽可以节省内存。
  • 示例代码
java">     EasyExcel.write(fileName).registerWriteHandler(new SimpleWriteHandler()) // 不使用自动列宽.sheet("Sheet1").doWrite(dataList);
5. 使用Stream导出(适合大数据)
  • 利用OutputStream分批写入数据,减少内存消耗。通过BufferedOutputStream可以进一步提高性能。
  • 示例代码
java">     try (OutputStream out = new BufferedOutputStream(new FileOutputStream(fileName))) {ExcelWriter excelWriter = EasyExcel.write(out).build();WriteSheet writeSheet = EasyExcel.writerSheet("Sheet1").build();int pageIndex = 0;List<Data> dataList;do {dataList = getDataByPage(pageIndex++, batchSize);excelWriter.write(dataList, writeSheet);} while (dataList.size() == batchSize);excelWriter.finish();} catch (IOException e) {e.printStackTrace();}
6. 选择合适的数据导出工具
  • 如果数据量非常大,可以考虑切换到支持更高性能的导出工具(如Apache POI的SXSSFWorkbook),适合导出百万级别数据量,但配置和使用会更复杂。

亮点来了,那要如何使用 POI 的 SXSSFWorkbook来导出百万级别的数据量呢?

Apache POI的SXSSFWorkbook 实现百万级别数据量的导出案例

使用Apache POI的SXSSFWorkbook可以处理大数据量的Excel导出,因为SXSSFWorkbook基于流式写入,不会将所有数据加载到内存中,而是使用临时文件进行缓存,这样可以显著减少内存消耗,适合百万级别数据的导出。下面我们来看一个完整的实现示例。

代码如下
java">import org.apache.poi.ss.usermodel.*;
import org.apache.poi.xssf.streaming.SXSSFWorkbook;import java.io.FileOutputStream;
import java.io.IOException;
import java.util.ArrayList;
import java.util.List;public class LargeDataExportExample {public static void main(String[] args) {// 文件输出路径String filePath = "vg_large_data_export.xlsx";// 导出百万级数据exportLargeData(filePath);}private static void exportLargeData(String filePath) {// 每次写入的批次大小final int batchSize = 10000;// 数据总条数final int totalRows = 1_000_000;// 创建SXSSFWorkbook对象,内存中只保留100行,超过的部分会写入临时文件SXSSFWorkbook workbook = new SXSSFWorkbook(100);workbook.setCompressTempFiles(true); // 启用临时文件压缩// 创建工作表Sheet sheet = workbook.createSheet("Large Data");// 创建标题行Row headerRow = sheet.createRow(0);String[] headers = {"ID", "Name", "Age"};for (int i = 0; i < headers.length; i++) {Cell cell = headerRow.createCell(i);cell.setCellValue(headers[i]);}int rowNum = 1; // 数据开始的行号try {// 按批次写入数据for (int i = 0; i < totalRows / batchSize; i++) {// 模拟获取每批数据List<Data> dataList = getDataBatch(rowNum, batchSize);// 将数据写入到Excel中for (Data data : dataList) {Row row = sheet.createRow(rowNum++);row.createCell(0).setCellValue(data.getId());row.createCell(1).setCellValue(data.getName());row.createCell(2).setCellValue(data.getAge());}// 处理完成一批数据后,可以选择清除缓存数据,防止内存溢出((SXSSFSheet) sheet).flushRows(batchSize); // 清除已写的行缓存}// 将数据写入文件try (FileOutputStream fos = new FileOutputStream(filePath)) {workbook.write(fos);}System.out.println("数据导出完成:" + filePath);} catch (IOException e) {e.printStackTrace();} finally {// 关闭workbook并删除临时文件workbook.dispose();}}/*** 模拟分页获取数据*/private static List<Data> getDataBatch(int startId, int batchSize) {List<Data> dataList = new ArrayList<>(batchSize);for (int i = 0; i < batchSize; i++) {dataList.add(new Data(startId + i, "Name" + (startId + i), 20 + (startId + i) % 50));}return dataList;}// 数据类static class Data {private final int id;private final String name;private final int age;public Data(int id, String name, int age) {this.id = id;this.name = name;this.age = age;}public int getId() {return id;}public String getName() {return name;}public int getAge() {return age;}}
}
来解释一下代码
  1. SXSSFWorkbookSXSSFWorkbook(100)表示内存中最多保留100行数据,超过的部分会写入临时文件,节省内存。
  2. 批次处理:通过batchSize控制每批次写入的数据量,以减少内存消耗。totalRows设置为1,000,000表示导出100万条数据。
  3. 模拟数据生成getDataBatch方法模拟分页获取数据,每次返回一批数据。
  4. 清除缓存行:每次写入一批数据后,通过flushRows(batchSize)将缓存的行从内存中清除,以控制内存占用。
  5. 压缩临时文件workbook.setCompressTempFiles(true)启用临时文件压缩,进一步减少磁盘空间占用。

需要注意的事项

  • 临时文件:SXSSFWorkbook会在系统临时文件夹中生成临时文件,需要确保磁盘空间足够。
  • 资源释放:完成数据写入后需要调用workbook.dispose()以清理临时文件。
  • 性能优化:可根据机器内存调整batchSizeSXSSFWorkbook缓存行数,避免频繁刷新和内存溢出。

http://www.ppmy.cn/ops/130579.html

相关文章

【STM32】INA3221三通道电压电流采集模块,HAL库

一、简单介绍 芯片的datasheet地址&#xff1a; INA3221 三通道、高侧测量、分流和总线电压监视器&#xff0c;具有兼容 I2C 和 SMBUS 的接口 datasheet (Rev. B) 笔者所使用的INA3221是淘宝买的模块 原理图 模块的三个通道的电压都是一样&#xff0c;都是POWER。这个芯片采用…

制作安装k8s需要的离线yum源

制作安装k8s需要的离线yum源 添加docker在线源制作安装k8s命令行工具需要的离线yum源传到内网k8s节点&#xff0c;通过如下命令导出镜像&#xff1a; 要全内网环境安装docker、k8s和相关依赖&#xff0c;需要在内部提供安装k8s、docker需要的yum源 添加docker在线源 yum-confi…

优先级队列(PriorityQueue)

优先级队列&#xff08;PriorityQueue&#xff09; 1. PriorityQueue的特性2. PriorityQueue常用方法介绍常用构造方法常用的普通方法 1. PriorityQueue的特性 使用时必须导入PriorityQueue所在的包&#xff0c;即 import java.util.PriorityQueue;PriorityQueue中所放置的元素…

redolog与binlog的写入机制

redo log 事务在执行的过程中&#xff0c;生成的redo log是要先写到redo log buffer中的。redo log buffer里面的内容不需要每次生成后都直接持久化到磁盘。 如果事务执行期间MySQL发生异常重启&#xff0c;那这部分日志就丢了&#xff0c;但是由于没有commit&#xff0c;所以…

el-table 修改高亮行样式

el-table 修改高亮行样式 <el-table reftable :data"tableData" highlight-current-row></el-table>修改样式 ::v-deep .el-table__body tr.current-row > td {background: #e1e1e1 !important;color: #000 !important; }

国自然基金项目撰写技巧

原文链接&#xff1a;国自然基金项目撰写技巧https://mp.weixin.qq.com/s?__bizMzUzNTczMDMxMg&mid2247625527&idx5&sn47c81dafb938fbc1da19e9a745f7bd5c&chksmfa8daad0cdfa23c6973c85a334373392b3edaad4a6d8661e53cd39e1d02aac5d035cad429cd2&token91245…

大数据-204 数据挖掘 机器学习理论 - 混淆矩阵 sklearn 决策树算法评价

点一下关注吧&#xff01;&#xff01;&#xff01;非常感谢&#xff01;&#xff01;持续更新&#xff01;&#xff01;&#xff01; 目前已经更新到了&#xff1a; Hadoop&#xff08;已更完&#xff09;HDFS&#xff08;已更完&#xff09;MapReduce&#xff08;已更完&am…

MFC文件管理-学习笔记

CFileDialog封装用于文件打开操作或文件保存操作的常见对话框&#xff0c;继承于CCommonDialogCFileDialog的公共数据成员&#xff1a;m_ofn:Windows的OPENFILENAME结构&#xff0c;提供对基本文件对话框参数的访问权限。使用CFileDialog对象首先要使用构造参数创建该对象&…