Java用pdfbox或icepdf转换PDF为图片时,中文乱码问题

news/2024/11/29 23:55:30/

最近在做一个将PDF文件转换成图片文件,然后传给前端展示的功能。刚开始时是用pdfbox,在本地windows环境下可以正常转换,图片没有任何问题。然后上了linux的测试环境,一样没问题。但是上了linux的生产环境之后,传出来的图片里面的中文内容就变成乱码了。

刚开始时以为是pdfBox本身有兼容性问题或者bug,因为在网上也查到资料说pdfBox转换会有乱码。后来就换了icePdf,但是结果一样,本地windows没问题,linux测试环境没问题,但生产linux环境出问题了。经过一番网上查资料折腾无果,最后想到,会不会是字库的问题,因为linux本身其实对中文支持就不是很好。最后,把linux测试环境里面的中文字库都放到了linux生产环境上面,刷新字库缓存之后,问题解决!

后来总结了一下,这个问题搞了这么久,有两个原因,一、对pdf格式文件不够了解,一开始以为它是和图片差不多,只是普通的像素组成,没想到还与字符编码有关系。2、Java的跨平台特性一直都很好,所以没有想到这个小问题会与平台本身的环境有关,花了大量时间在代码的检查上面。

因为在网上看不到有这种问题的解决办法,所以特此写了出来,希望能帮助到更多同行。

 

PS:如果不知道需要装什么字库文件,可以用pdf阅读器打开pdf文件,然后可以看到这个pdf文件里面用到了什么字体,然后再去一一对应的找出来,然后安装进去就可以了

 

转载请注明出处:http://www.cnblogs.com/Starshot/p/7481724.html

 

转载于:https://www.cnblogs.com/Starshot/p/7481724.html


http://www.ppmy.cn/news/363335.html

相关文章

文件下载pdf乱码 application/pdf;charset-UTF-8

try { const blob new Blob([res], { type: application/pdf;charset-UTF-8 // word文档为msword,pdf文档为pdf }) if (download in document.createElement(a)) { // 非IE下载 const url window.URL.createObjectURL(blob) const aLink document.createElement(a) a…

解决JD-GUI-1.6.6 中文乱码

一、背景 在window环境下使用中遇到了乱码问题。 问题有两个: 一、从反编译代码的界面 CTRLC 复制是如果选中内容包含中文,贴到其他编辑器时,中文丢失。 二、打开xml文件、properties文件等包含中文时。中文在反编译界面中显示乱码。用其他工…

使用Aspose将Word转成Pdf后中文乱码问题

场景: 使用Aspose.Word将word文档转换成pdf。 本地Windows开发环境,pdf文件正常。 但是将程序部署到CentOS的服务器上,pdf的中文就都是乱码了。 解决思路: 运行jetty服务时,指定 java -Dfile.encodingUTF-8 或GBK 参…

基于51单片机的全自动智能洗衣机控制系统Proteus仿真

资料编号:108 下面是相关功能视频演示: 108-基于51单片机的全自动智能洗衣机控制系统Proteus仿真(仿真源码全套资料) 设计功能: 1、对水温实时显示 2、显示滚筒转速 3、显示运行倒计时 4、能通过按钮分别设置洗涤时间…

PDF文件转换图片格式,解决中文乱码问题

在网上找过很多方法&#xff0c;都有中文乱码的的问题。 这里使用PdfBox方法解决中文的乱码问题 依赖jar包 pdfbox-app 2.0.16 fontbox 2.0.16 <!-- Maven坐标 --><!-- https://mvnrepository.com/artifact/org.apache.pdfbox/pdfbox-app --><dependency><…

Android Studio打开文件错乱,Java文件图标由“C”变成蓝色的“J”,打开Java文件显示xml乱码,打开xml文件出现png格式图片乱码的问题

在刚接触Android Studio的时候&#xff0c;由于不明不白的原因&#xff0c;出现了如标题所示的打开文件错乱&#xff0c;打开Java文件出现的是后面的xml文件代码&#xff0c;Java文件图标由“C”变成蓝色的“J”&#xff0c;打开Java文件显示xml乱码&#xff0c;打开xml文件出现…

Tp5 打开PDF文件乱码的问题

使用tp3 显示pdf文件没有问题&#xff1a; $file d:/1.pdf; $filename 1.pdf; header(Content-type: application/pdf); header(Content-Disposition: inline; filename".$filename."); header(Content-Transfer-Encoding: binary); header(Accept-Ranges: bytes);…

解决从PDF复制文字后乱码问题

背景 需要从PDF复制文字出来做笔记&#xff0c;可是谁知道PDF通过adobe打开后复制出来后是乱码&#xff0c;如下图所示&#xff1a; 解决 尝试过安装字体&#xff0c;可惜没卵用。 方法1-CAJViewer打开 用该软件打开后复制&#xff0c;可以完美复制&#xff0c;但是有个小问题…