Java 一键将 Word 文档转为 PDF

server/2025/2/10 8:02:29/

嘿,朋友们!在开发中,经常会碰到需要把 Word 文档转换成 PDF 格式的需求,像生成报告、合同啥的。Java 有不少好用的库能实现这个功能,下面就给大家介绍两种常见的方法,分别使用 Apache POI 和 Docx4J 结合 iText 库来实现 Word 转 PDF。

方法一:使用 Apache POI 和 iText

1. 引入依赖

如果你用 Maven 管理项目,在 pom.xml 里添加以下依赖:

 
<dependencies><!-- Apache POI 处理 Word 文档 --><dependency><groupId>org.apache.poi</groupId><artifactId>poi-ooxml</artifactId><version>5.2.3</version></dependency><!-- iText 生成 PDF 文档 --><dependency><groupId>com.itextpdf</groupId><artifactId>itextpdf</artifactId><version>5.5.13.3</version></dependency>
</dependencies>

2. 代码示例

 
java">import com.itextpdf.text.*;
import com.itextpdf.text.pdf.PdfWriter;
import org.apache.poi.xwpf.usermodel.XWPFDocument;
import org.apache.poi.xwpf.usermodel.XWPFParagraph;
import org.apache.poi.xwpf.usermodel.XWPFRun;import java.io.*;public class WordToPdfWithPOI {public static void main(String[] args) {try {// 读取 Word 文档FileInputStream fis = new FileInputStream("input.docx");XWPFDocument document = new XWPFDocument(fis);// 创建 PDF 文档Document pdfDoc = new Document();PdfWriter.getInstance(pdfDoc, new FileOutputStream("output.pdf"));pdfDoc.open();// 遍历 Word 文档的段落for (XWPFParagraph paragraph : document.getParagraphs()) {StringBuilder text = new StringBuilder();// 遍历段落中的文本运行对象for (XWPFRun run : paragraph.getRuns()) {text.append(run.getText(0));}// 将段落文本添加到 PDF 文档中Paragraph pdfParagraph = new Paragraph(text.toString());pdfDoc.add(pdfParagraph);}// 关闭文档和流pdfDoc.close();document.close();fis.close();System.out.println("Word 转 PDF 成功!");} catch (Exception e) {e.printStackTrace();System.out.println("Word 转 PDF 失败:" + e.getMessage());}}
}

3. 代码解释

  • 读取 Word 文档:用 FileInputStream 读取 input.docx 文件,再用 XWPFDocument 类把它加载到内存。

  • 创建 PDF 文档:创建 Document 对象表示 PDF 文档,用 PdfWriter 关联输出流,然后打开文档准备写入内容。

  • 遍历 Word 文档段落:遍历 Word 文档的每个段落,把段落里的文本提取出来,添加到 StringBuilder 里,再创建 Paragraph 对象添加到 PDF 文档中。

  • 关闭文档和流:操作完成后,关闭 PDF 文档、Word 文档和输入流。

方法二:使用 Docx4J

1. 引入依赖

pom.xml 里添加以下依赖:

 
<dependencies><dependency><groupId>org.docx4j</groupId><artifactId>docx4j-JAXB-Internal</artifactId><version>11.4.9</version></dependency><dependency><groupId>org.docx4j</groupId><artifactId>docx4j-JAXB-ReferenceImpl</artifactId><version>11.4.9</version></dependency><dependency><groupId>org.docx4j</groupId><artifactId>docx4j</artifactId><version>11.4.9</version></dependency><dependency><groupId>org.docx4j</groupId><artifactId>docx4j-export-fo</artifactId><version>11.4.9</version></dependency>
</dependencies>

2. 代码示例

 
java">import org.docx4j.Docx4J;
import org.docx4j.convert.out.FOSettings;
import org.docx4j.openpackaging.packages.WordprocessingMLPackage;import java.io.File;
import java.io.FileOutputStream;
import java.io.OutputStream;public class WordToPdfWithDocx4J {public static void main(String[] args) {try {// 加载 Word 文档WordprocessingMLPackage wordMLPackage = WordprocessingMLPackage.load(new File("input.docx"));// 创建 FOSettings 对象FOSettings foSettings = Docx4J.createFOSettings();foSettings.setWmlPackage(wordMLPackage);// 创建输出流OutputStream os = new FileOutputStream(new File("output.pdf"));// 转换并保存为 PDFDocx4J.toPDF(foSettings, os, Docx4J.FLAG_EXPORT_PREFER_XSL);// 关闭输出流os.close();System.out.println("Word 转 PDF 成功!");} catch (Exception e) {e.printStackTrace();System.out.println("Word 转 PDF 失败:" + e.getMessage());}}
}

3. 代码解释

  • 加载 Word 文档:用 WordprocessingMLPackage.load 方法加载 input.docx 文件。

  • 创建 FOSettings 对象FOSettings 用于配置转换设置,把加载的 Word 文档设置进去。

  • 创建输出流:创建 FileOutputStream 用于输出 PDF 文件。

  • 转换并保存为 PDF:调用 Docx4J.toPDF 方法进行转换,并将结果保存到输出流。

  • 关闭输出流:操作完成后,关闭输出流。

嘿,朋友们!这两种方法都能帮你用 Java 把 Word 文档转换成 PDF。你可以根据自己的需求和喜好选择合适的方法。赶紧动手试试,让你的程序轻松搞定文档转换!


http://www.ppmy.cn/server/166443.html

相关文章

机器学习中常用的数据预处理方法

1. 数据清洗 方法&#xff1a;处理异常值、重复数据、噪声数据。 异常值处理&#xff1a;通过统计方法&#xff08;如 Z-Score、IQR&#xff09;或可视化检测&#xff0c;选择删除、替换&#xff08;均值/中位数&#xff09;或保留。重复数据&#xff1a;直接删除重复样本。 优…

排错 -- 用React.js,Solidity,智能合约构建最新区块链应用

真枪实弹:第一个Web3项目【上集】用React.js,Solidity,智能合约构建最新区块链应用详细教程 构建web跟随b站教程中遇到了很多错误&#xff0c;从今天开始构建完整的应用&#xff0c;在此记录一些排错。 问题情况1&#xff1a;跟随视频后无Src文件 问题情况1解决方法&#xff1…

游戏引擎学习第91天

黑板&#xff1a;澄清线性独立性 首先&#xff0c;提到线性独立时&#xff0c;之前讲解过的“最小”的概念实际上是在表达线性独立。对于二维坐标系来说&#xff0c;两个基向量是最小的&#xff0c;这两个向量是线性独立的。如果超过两个基向量&#xff0c;就会变得冗余&#…

20.责任链模式(Chain of Responsibility Pattern)

定义 责任链模式&#xff08;Chain of Responsibility Pattern&#xff09; 是一种行为型设计模式&#xff0c;它使得多个对象都有机会处理请求&#xff0c;从而避免请求的发送者和接收者之间的耦合关系。将多个处理对象连成一条链&#xff0c;并沿着这条链传递请求&#xff0…

transformers学习笔记——初级篇

Transformers&#xff08;库&#xff09; 是 Hugging Face 开发的 开源 Python 库&#xff0c;用于加载和使用基于 Transformer 结构的各种预训练模型。Transformers&#xff08;库&#xff09;是对 Transformer&#xff08;理论&#xff09;的工程实现&#xff0c;并且包含了很…

【算法】动态规划专题⑩ —— 混合背包问题 python

目录 前置知识进入正题总结 前置知识 【算法】动态规划专题⑤ —— 0-1背包问题 滚动数组优化 【算法】动态规划专题⑥ —— 完全背包问题 python 【算法】动态规划专题⑦ —— 多重背包问题 二进制分解优化 python 混合背包结合了三种不同类型的背包问题&#xff1a;0/1背包…

蚂蚁爬行最短问题

初二数学问题记录 分析过程 考点&#xff1a;2点之间直线最短。 思考过程&#xff1a;将EBCF以BC为边翻折&#xff0c;EF边翻折后为&#xff0c;则A为蚂蚁需要爬行的最小距离。

配置PXC实现高可用

一。关闭防火墙和selinux systemctl stop firewalld systemctl disable firewalld setenforce 0 二。本地地址解析 三。下载PXC包&#xff0c;并且进行安装 wget https://repo.percona.com/yum/release/7/RPMS/x86_64/qpress-11-1.el7.x86_64.rpm yum localinstall *.rpm…