适用于.net的操作excel的库

server/2024/12/23 17:30:32/

目录

目录

知识点概要

知识点具体说明(使用步骤、解释)

使用场景及示例

1. EPPlus

 2. NPOI

 3. ClosedXml

4. SpreadsheetLight

 5.ExcelDataReader 开源库

 6. ExcelDataWriter

总结


 

知识点概要

        使用Excel来导入和导出数据,在日常工作中使用频率是相当高的,而直接去读取Excel数据还是比较繁琐的,使用 EPPlus 、 ClosedXML 等第三方库读取 Excel 数据相较于直接读取,则方便的多,第三方库通常都提供了简单、实用、易于理解的高层次API,具有很高的可用性,使得开发效率大大提高,同时也使得代码更易于理解和维护。现在我们就总结一下适合于.Net操作Excel的库。

知识点具体说明(使用步骤、解释)

        Excel其实是由XML发展而来的,它实际上是一个ZIP压缩包,其中包含了很多的文件和文件夹,我们可以将一个excel文件的后缀改成“.zip”,然后打开就可以看到其内部组成文件了。

所以使用库来操作excel还是很有必要的。

现在我整理了一下几个常见的比较稳定的库:

1. EPPlus(1亿2306万下载量,123M)

2. ClosedXML(8399万下载量,84M)

3. NPOI(5872万下载量, 58.8M)

4. SpreadsheetLight(284万下载量,2.8M),跨平台可能会有GDI+(图形设备接口)的初始化问题、兼容性问题;

5. ExcelDataReader(6092万下载量,61M) ,ExcelDataWriter(0.89万下载量,9.0K)

6. Microsoft.Office.Interop.Excel(2148万下载量,21.5M), 需要依赖Microsoft office,跨平台就不用考虑了;

7. Syncfusion Excel (XlsIO)、GemBox.Spreadsheet都是功能强大的商业库;

 下面就分别说一下。

使用场景及示例

下面就用代码来实际说一下,实验环境为使用Avalonia读取到了文件流:

await using var stream = await file.OpenReadAsync(); //已经读取到stream流

 下面就用各个库来分析获取想要的数据。

1. EPPlus

EPPlus是一个非常流行的开源 .NET 库,用于读取和写入 Excel 文件(只适用.xlsx 格式);

开源,跨平台;

性能优秀,适合处理大型 Excel 文件;

支持 LINQ 查询,可以方便地对 Excel 数据进行操作和过滤;

支持许多 Excel 公式和函数,可以在文档中直接使用;

单元格的行、列Index是从1开始;

private async Task<List<TemplateData>> ReadFilesByEpplus(Stream stream)
{try{ExcelPackage.LicenseContext = LicenseContext.NonCommercial;using var package = new ExcelPackage(stream); // 用流加载Excel包  var worksheet = package.Workbook.Worksheets[0]; // 获取第一个工作表  var datas = new List<TemplateData>();var rowCount = worksheet.Dimension.End.Row;  var colCount = worksheet.Dimension.End.Column;  // 遍历每一行  for (var row = 2; row <= rowCount; row++) // 从第二行开始  {var t = new ExcelRow(){ColumnData = new List<string>()};// 遍历每一列  for (var col = 1; col <= colCount; col++)  {  var cellValue = worksheet.Cells[row, col].Text; // 获取当前单元格的文本  t.ColumnData.Add(cellValue); // 将值添加到ColumnData  }// 将读取的数据添加到列表  datas.Add(t.ToTemplateData());  } return datas;}catch (Exception e){var logger = LogManager.GetCurrentClassLogger();logger.Error($"ReadFiles Exception: {e.Message}");return null;}
}

 值得一提的是,EPPlus 从版本 5 开始引入了许可证管理,所以在使用的代码中设置ExcelPackage.LicenseContext 属性:

ExcelPackage.LicenseContext = LicenseContext.NonCommercial; // 对于非商业用途

当然,也可以在配置文件中设置。

如果不进行设置的话,会触发异常:

Exception: Please set the ExcelPackage.LicenseContext property. See https://epplussoftware.com/developers/licenseexception

EPPlus 官网也给出了解决方案:

1. 代码中直接设置:

 2. 配置文件

3. 环境变量

 2. NPOI

NPOI 也是一个比较好用的非常流行的开源 .NET 库,而且不仅可以处理Excel,也支持 Word 文档(.doc 和 .docx)、PowerPoint(.ppt 和 .pptx)等其他Office 文件格式。

支持读取 .xls 和 .xlsx 文件,但导入方式不同。需要根据文件格式使用 HSSFWorkbook 或 XSSFWorkbook;支持公式、样式、图表和图像的管理;操作工作表(如插入、删除或修改行和列);

NPOI单元格行、列Index都是从0开始;

private async Task<List<TemplateData>> ReadFiles(Stream stream)
{try{var workbook = new XSSFWorkbook(stream);  var worksheet = workbook.GetSheetAt(0);var datas = new List<TemplateData>();for (var row = 1; row <= worksheet.LastRowNum; row++) // row=1 跳过表头  {  var temp = new ExcelRow { ColumnData = new List<string>() };var currentRow = worksheet.GetRow(row); // 获取当前行  if (currentRow == null) continue; // 确保行不为空  for (var col = 0; col < currentRow.LastCellNum; col++) // 遍历每一列  {  var cell = currentRow.GetCell(col); // 获取当前列的单元格,得到的是单元格的内容  // 尝试获取单元格的值  var cellValue = cell?.ToString(); // 转换为字符串  temp.ColumnData.Add(cellValue); // 添加到 ColumnData 列表中  }  // 将读取的数据添加到列表  datas.Add(temp.ToTemplateData());} return datas;}catch (Exception e){var logger = LogManager.GetCurrentClassLogger();logger.Error($"ReadFiles Exception: {e.Message}");return null;}
}
 3. ClosedXml

能够快速创建、读取、写入和修改 Excel 文件,而不需要深入了解 Excel 的复杂结构,ClosedXML 库的目标是使 Excel 操作简单而强大;

支持单元格写入、格式化、图表生成、数据验证、合并单元格等,能够满足大多数 Excel 操作的需求;

支持 LINQ 查询;

仅支持 .xlsx 格式,不可以操作 .xls 文件;

单元格行、列index从1开始;

private async Task<List<TemplateData>> ReadFilesByClosedXml(Stream stream)
{try{using var workbook = new XLWorkbook(stream);var worksheet = workbook.Worksheet(1);var datas = new List<TemplateData>();var rowNum = worksheet.LastRowUsed().RowNumber();for (var row = 2; row <= rowNum; row++) // row=1 跳过表头  {  var temp = new ExcelRow { ColumnData = new List<string>() };var colNum = worksheet.LastColumnUsed().ColumnNumber();for (var col = 1; col <= colNum; col++) // 遍历每一列  {  // 获取当前列的单元格var cell = worksheet.Cell(row,col).GetString(); // 尝试获取单元格的值  temp.ColumnData.Add(cell); // 添加到 ColumnData 列表中  }  // 将读取的数据添加到列表  datas.Add(temp.ToTemplateData());} return datas;}catch (Exception e){var logger = LogManager.GetCurrentClassLogger();logger.Error($"ReadFiles Exception: {e.Message}");return null;}
}
4. SpreadsheetLight

轻量级的.NET库,创建、读取、写入、图表支持、数据验证等;适合快速开发和原型制作。

开源,可在Mono框架下运行,实现跨平台,不过得不偿失,仍可能会有些兼容性问题,

比如:

“Exception: The type initializer for 'Gdip' threw an exception” ;
 5.ExcelDataReader 开源库

是一个用于读取 Excel 文件的轻量级库,特别适用于 .xls 和 .xlsx 文件格式。专为快速和高效的数据读取而设计,特别适合需要将 Excel 数据导入到数据库或进行其他处理的场景。只支持数据的读取,而不支持 Excel 文件的写入和格式化;

行、列index从0开始;

private async Task<List<TemplateData>> ReadFiles(IStorageFile file)
{try{Encoding.RegisterProvider(CodePagesEncodingProvider.Instance);  var datas = new List<TemplateData>();await using var stream = await file.OpenReadAsync();using var reader = ExcelReaderFactory.CreateReader(stream);// 读取所有数据  var result = reader.AsDataSet();  // 遍历获取的 DataSetforeach (DataTable table in result.Tables)  {  Console.WriteLine($"Sheet: {table.TableName}");  for (var row = 1; row < table.Rows.Count; row++) //跳过第一行{var temp = new ExcelRow { ColumnData = [] };for (var col = 0; col < table.Rows[row].ItemArray.Length; col++){var cell = table.Rows[row][col];temp.ColumnData.Add(cell?.ToString());}datas.Add(temp.ToTemplateData());}}return datas;}catch (Exception e){var logger = LogManager.GetCurrentClassLogger();logger.Error($"ReadFiles Exception: {e.Message}");return null;}
}
 6. ExcelDataWriter

ExcelDataWriter 是一个专门用于在 .NET 环境中处理 Excel 表格的轻量级库,主要用于将数据以 Excel 格式写入文件。

只支持生成 Excel 文件,且只能生成.xlsx 文件;

它与ExcelDataReader并不是同一个库,且他们之间没有任何关系,不是同一个作者。

还要依赖于EPPLus。

总结

前三个库都是比较好用且使用比较多的,且开源跨平台,推荐使用前三种,稳定,使用起来也放心,易于维护。使用方法大差不差,但是还是需要注意个别差异,比如单元格行、列Index有的是从1开始,而有的是从0开始......


http://www.ppmy.cn/server/152545.html

相关文章

情报信息收集能力

红队专题-Web渗透之资产思路框架知识整理 钓鱼社工 钓鱼自动化zip域名ARP欺骗快捷方式ToolsburpsuiteApp 抓包ffuf模糊测试QingScanWiresharkCloudCFEn-Decodeffffffff0xInfodirbdirmapdirsearchdnsenum使用测试常规使用使用字典文件进行dns查询子域名暴力查询部分C类IP地址IP块…

鸿鹄电子招投标系统源码实现与立项流程:基于Spring Boot、Mybatis、Redis和Layui的企业电子招采平台

随着企业的快速发展&#xff0c;招采管理逐渐成为企业运营中的重要环节。为了满足公司对内部招采管理提升的要求&#xff0c;建立一个公平、公开、公正的采购环境至关重要。在这个背景下&#xff0c;我们开发了一款电子招标采购软件&#xff0c;以最大限度地控制采购成本&#…

html(超文本标记语言)

声明&#xff01; 学习视频来自B站up主 **泷羽sec** 有兴趣的师傅可以关注一下&#xff0c;如涉及侵权马上删除文章&#xff0c;笔记只是方便各位师傅的学习和探讨&#xff0c;文章所提到的网站以及内容&#xff0c;只做学习交流&#xff0c;其他均与本人以及泷羽sec团队无关&…

陪诊小程序搭建,打造一站式陪诊服务

当下&#xff0c;陪诊市场正在持续火热发展&#xff0c;在全国医疗行业中&#xff0c;陪诊师成为了一个重要的就医方式。陪诊师的出现在快节奏生活下显得尤为重要&#xff0c;为不少没有时间陪老人去医院的家庭以及对医院不熟悉的提供了便利&#xff0c;满足了众多患者及其家属…

Transformers-Datasets篇(公开数据集和自己数据集的数据预处理使用方法总结)

导所有相关包:from datasets import * 大纲 一、对公开数据集完成数据预处理操作1.在线加载数据集例1,不加限定直接导入,这种情况针对只有一个数据集。例2,数据集中包括很多子任务的数据集如何下载?例3:按照数据划分加载数据集(指定下载内容:名,切片,比例等)2.离线…

从ES的JVM配置起步思考JVM常见参数优化

目录 一、真实查看参数 &#xff08;一&#xff09;-XX:PrintCommandLineFlags &#xff08;二&#xff09;-XX:PrintFlagsFinal 二、堆空间的配置 &#xff08;一&#xff09;默认配置 &#xff08;二&#xff09;配置Elasticsearch堆内存时&#xff0c;将初始大小设置为…

REMOTE_LISTENER引发的血案

作者&#xff1a;Digital Observer&#xff08;施嘉伟&#xff09; Oracle ACE Pro: Database PostgreSQL ACE Partner 11年数据库行业经验&#xff0c;现主要从事数据库服务工作 拥有Oracle OCM、DB2 10.1 Fundamentals、MySQL 8.0 OCP、WebLogic 12c OCA、KCP、PCTP、PCSD、P…

防止私接小路由器

电脑获取到IP地址不是DHCP服务器的IP地址段&#xff0c;导致整个公司网络瘫痪&#xff0c;这些故障现象通常80%原因是私接小路由器导致的&#xff0c;以下防止私接小路由器措施。 一、交换机配置DHCP Sooping DHCP snooping是一种DHCP安全特性&#xff0c;用于防止非法设备获…