PDF文件转换为HTML文件

devtools/2024/9/19 16:06:20/ 标签: pdf

推荐使用 pdf2htmlEX(因为确实做的比较全)

pdf2htmlEX 是一个开源工具,可以将PDF文件转换为HTML文件。你需要先安装pdf2htmlEX工具,并确保它在你的系统路径中可用。(花时间最多就是找包)

  • 安装 pdf2htmlEX

    可以从 pdf2htmlEX的GitHub页面 下载和安装。(下载特别慢)

  • 我自己创建一个库pdf2htmlEX 方便下载;(主要适用于linux环境,需要一点点编译)

  • Java window环境可以参考编译好的包(百度云盘方便大家下载)

链接:https://pan.baidu.com/s/1-w4nnuYu8OyaI61QR7AImg 提取码:ipe4

使用Java调用 pdf2htmlEX

你可以通过Java的 RuntimeProcessBuilder 来调用 pdf2htmlEX 工具。

public static void convertPdfToHtml(String pdfPath, String htmlPath) {List list = new ArrayList();list.add("cmd.exe");list.add("/c");list.add("C:\\wp\\project\\pdf2htmlEX\\pdf2htmlEX\\pdf2htmlEX.exe");list.add("\"" + pdfPath + "\"");list.add("\"" + htmlPath + "\"");ProcessBuilder processBuilder = new ProcessBuilder(list);try {Process process = processBuilder.start();BufferedReader reader = new BufferedReader(new InputStreamReader(process.getInputStream()));String line = "";while ((line = reader.readLine()) != null) {System.out.println(line);}process.waitFor();System.out.println("PDF conversion completed.");} catch (IOException | InterruptedException  e ) {System.out.println("应用程序不存在!");e.printStackTrace();}}
public static void main(String[] args) {String pdfFilePath = "test.pdf";String xmlFilePath = "wptest.html";EscapeUtil.convertPdfToHtml(pdfFilePath,xmlFilePath);}

执行之后的效果 PDF文件

生成html的文件

个人有一些开源项目 北斗位置服务平台(GPS跟踪平台)


http://www.ppmy.cn/devtools/95280.html

相关文章

中英双语介绍金融经济中的鹰派 (Hawkish)和鸽派 (Dovish)

中文版 在金融和经济政策中,“鹰派”和“鸽派”是两种对货币政策和经济管理有不同立场的群体。 鹰派 (Hawkish) 鹰派倾向于担心通货膨胀的风险,通常支持较高的利率和更紧的货币政策,以防止经济过热和控制物价上涨。具体特征包括&#xff1…

Unity安卓IOS根据不同国家语言显示不同的APP名字

安卓篇 把res文件放在Plugins下,然后修改string.xm里的app名字即可; 如果需要别的国家,增加文件夹即可 IOS篇 info.list中增加Boolean类型的Application has localized display name,值为YES 然后把多语言放在ATT弹窗的多语言里面 CFBun…

声学气膜馆与普通气膜馆的投资回报影响—轻空间

在投资气膜馆项目时,声学气膜馆和普通气膜馆在功能和性能上的差异,直接影响着投资人的收益和回报。 声学气膜馆的独特优势 声学气膜馆专为声学需求设计,不仅具备普通气膜馆的所有优势,还提供卓越的音质控制能力,是高端…

【区块链+金融服务】基于区块链的一站式绿色金融开放平台 | FISCO BCOS应用案例

科技的进步为绿色金融发展提供了新的机遇,但银行、企业、第三方金融机构等在进行绿色金融业务操作过程中, 存在着相关系统和服务平台建设成本高、迭代难度大、数据交互弱、适配难等痛点。 基于此,中碳绿信采用国产开源联盟链底层平台 FISCO …

【Story】编译器的基础概念与类型分类

目录 编译器详解1. 编译器的工作流程1.1 词法分析(Lexical Analysis)词法分析的例子 1.2 语法分析(Syntax Analysis)语法分析的例子 1.3 语义分析(Semantic Analysis)语义分析的例子 1.4 中间代码生成&…

解决 Kibana 中的 “Invalid character in header content” 错误

在使用 Kibana 进行数据可视化和分析的过程中,我们可能会遇到一些配置相关的问题。本文将介绍一个常见的错误:“Invalid character in header content”,并提供详细的解决步骤。 问题背景 当启动 Kibana 服务时,如果遇到以下错误…

华为鸿蒙Core Vision Kit 骨骼检测技术

鸿蒙Core Vision Kit 是华为鸿蒙系统中的一个图像处理框架,旨在提供各种计算机视觉功能,包括物体检测、人脸识别、文本识别等。骨骼检测是其中的一项功能,主要用于检测和识别人类身体的骨骼结构。 骨骼检测的关键点 骨骼点检测:通…

Scout Suite:开源云安全审计工具

Scout Suite 是一个开源、多云安全审计工具,旨在评估云环境的安全态势。 Scout Suite 利用云供应商提供的 API 来收集和整理配置数据,从而更轻松地识别潜在风险。 Scout Suite 无需手动筛选云 Web 控制台上的大量页面,而是会自动生成全面清…

什么是凤凰雪球期权?和雪球期权有什么区别?

凤凰结构,和经典雪球结构类似,属于障碍期权的一种。凤凰结构中包括敲入事件,也包括敲出事件,最后的收益取决于挂钩标的走势和敲入、敲出事件发生的时间,不过在收益计算规则上与雪球有所不同,下文为大家科普…

从铜都到数字先锋:贵溪市铜产业链办件智能化

江西省贵溪市,被誉为中国的“铜都”,其铜产业的蓬勃发展已成为城市经济的强大引擎。铜产业营收占其工业营收的 90%,是贵溪市工业产值的重要支柱。在产业规模的不断扩大和市场需求的日益增长的背景下,现有的铜产业信息化基础设施和…

JavaScript基础(二)函数、数组、对象

1.函数 1.1函数声明 function 函数名(){} let 函数名 function(){//函数体} 1.2函数参数 function 函数名(num1,num2){ 【return num1num2】//只有有return才能写参数 } let 函数名 function(){//函数体} 1.3…

vue3二次封装element-puls

将表单的通用信息给设置出来 如: label 的提示信息 , type 的类型 // 定义表单的配置项 const formConfig{ formItems:[ { type:"input", label:"用户ID", placeholder:"请输入用户ID" } ] } 页面配置如 <template v-for"(it…

家里养有宠物浮毛多、异味大,宠物空气净化器有用吗

我家收养了12只流浪猫&#xff0c;掉毛量是很多人想象不到的&#xff0c;对于猫掉毛和人掉头发一个道理&#xff0c;情绪压力&#xff0c;长期熬夜&#xff0c;营养不良&#xff0c;年龄原因都会掉毛或掉头发&#xff0c;猫更是如此&#xff01;但确实之前也不知道一只猫的掉毛…

child_process.spawn事件解析并举例

child_process.spawn 是 Node.js 中 child_process 模块提供的一个用于异步创建子进程的方法。这个方法返回一个 ChildProcess 对象&#xff0c;该对象继承自 Node.js 的 EventEmitter 类&#xff0c;因此可以触发和监听多种事件。以下是对 child_process.spawn 所触发事件的深…

React 中 react-i18next 切换语言( 项目国际化 )

思路 首先在项目中安装i18n插件&#xff0c;然后将插件引入到项目&#xff0c;然后配置语言包&#xff08;语言包需要你自己来进行配置&#xff0c;自己编写语言包&#xff0c;或者你能找到跟你项目适配的也可以&#xff09;&#xff0c;然后就用特定的方法来展示可以切换语言的…

【运维高级内容--haproxy】

proxies代理配置-defaults tcp 四层 http七层 haproxy、http默认使用80端口&#xff0c;如需同时启动haproxy、http&#xff0c;为防止端口被占用&#xff0c;需修改http使用的端口&#xff1a; vim /etc/httpd/conf/httpd.conf Listen 80 --> Listen 8080 …

网络协议八 网络安全相关

网络通讯中的4种 安全问题 网络层- ARP欺骗 ARP欺骗的防护原理 DoS&#xff0c;DDoS 攻击 应用层 DNS 劫持 HTTP 协议的安全问题 单向散列函数&#xff0c;不可逆 MD4,MD5,SHA全家桶 可逆&#xff0c;对称加密 DES,3DES,AES DES,已经被破解&#xff0c;不建议使用 3DES AES 目前…

启动虚拟机:另一个程序已锁定文件的一部分,进程无法访问,打不开磁盘xxx或它所依赖的某个快照磁盘

theme: nico 你们好&#xff0c;我是金金金。 场景 启动虚拟机时报错如下 造成error的原因 这是一种虚拟机的保护机制 虚拟机在运行时&#xff0c;为了防止数据被篡改&#xff0c;会将所运行的文件保护起来。 当虚拟机突然崩溃或强制结束导致异常退出&#xff08;我昨天是直接…

新手学习华为HCIE,会遇到哪些“坑”?

在众多认证中&#xff0c;HCIE无疑是里程碑式的金牌&#xff0c;吸引着无数网工朋友们的目光。 它不仅代表着专业技能的巅峰&#xff0c;更是通往高端网络工程师职位的金钥匙。 但是&#xff0c;对于那些刚踏上这条路的小白来说&#xff0c;HCIE的学习之旅可谓充满了不少大大小…

viser-vue官网地址

viser-vue官网地址&#xff1a;Viser