java 在pdf中根据关键字位置插入图片(公章、签名等)

news/2024/9/13 23:18:55/ 标签: java, pdf, 后端

java_pdf_0">javapdf中根据关键字位置插入图片(公章、签名等)

1.使用依赖

		<dependency><groupId>com.itextpdf</groupId><artifactId>itext7-core</artifactId><version>7.1.12</version><type>pom</type></dependency>

2.工具类

java">import com.itextpdf.io.image.ImageData;
import com.itextpdf.io.image.ImageDataFactory;
import com.itextpdf.kernel.geom.Rectangle;
import com.itextpdf.kernel.pdf.PdfDocument;
import com.itextpdf.kernel.pdf.PdfPage;
import com.itextpdf.kernel.pdf.PdfReader;
import com.itextpdf.kernel.pdf.PdfWriter;
import com.itextpdf.kernel.pdf.canvas.parser.PdfCanvasProcessor;
import com.itextpdf.kernel.pdf.canvas.parser.listener.IPdfTextLocation;
import com.itextpdf.kernel.pdf.canvas.parser.listener.RegexBasedLocationExtractionStrategy;
import com.itextpdf.layout.Document;
import com.itextpdf.layout.element.Image;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;import java.io.File;
import java.util.Collection;/*** @author dume* @ClassName Pdf* @description: TODO* @date 2024年07月03日* @version: 1.0*/
public class PdfUtisl {private static Logger logger = LoggerFactory.getLogger(PdfUtisl.class);public static void main(String[] args)  throws Exception {String input = "D:\\te1.pdf";//通过指定pdf文件名,指定关键字,和指定的pdf文件的待处理页数做参数getKeyWordsLocation("D:\\te1.pdf","D:\\1.png","签名:", 50d,50d,0d,0d);}/*** 得到关键字位置插入图片* @param sourcePath 源文件* @param imagePath 图片位置* @param KEY_WORD 关键字* @param width 图片宽度* @param height 图片高度* @param x 相对关键字平移x轴距离* @param y 相对关键字平移y轴距离*/public static boolean getKeyWordsAndInsertImg(String sourcePath,String imagePath, String KEY_WORD,float width,float height,float x,float y) {try {//得到需要插入的图片ImageData imageData = ImageDataFactory.create(imagePath);//核心思路为对PdfDocument对象采用某种Strategy,这里使用RegexBasedLocationExtractionStrategyPdfReader pr = new PdfReader(sourcePath);//临时路径String UUID= UUIDUtils.createUUID();String tempPath = sourcePath.replace(".pdf","_"+UUID+".pdf");//生成新的PDF文件PdfDocument pd = new PdfDocument(pr, new PdfWriter(tempPath));Document document = new Document(pd);int pageCount = pd.getNumberOfPages();boolean insertFlag = false;//遍历每一页for(int i = 1; i <= pageCount; i++){PdfPage page = pd.getPage(i);//查找页中的匹配文字,并定位到位置。RegexBasedLocationExtractionStrategy strategy = new RegexBasedLocationExtractionStrategy(KEY_WORD);PdfCanvasProcessor processor = new PdfCanvasProcessor(strategy);processor.processPageContent(page);Collection<IPdfTextLocation> resultantLocations = strategy.getResultantLocations();//自定义结果处理if (!resultantLocations.isEmpty()) {for (IPdfTextLocation item : resultantLocations) {Rectangle boundRectangle = item.getRectangle();System.out.println(item.getText());System.out.println("关键字“" + KEY_WORD + "” 的坐标为 x: " + boundRectangle.getX() + "  ,y: " + boundRectangle.getY());Image image = new Image(imageData).scaleAbsolute(width, height).setFixedPosition(i, boundRectangle.getRight() + x, boundRectangle.getBottom()+y);document.add(image);insertFlag = true;break;}}}document.close();pr.close();pd.close();if(insertFlag){logger.info("图片插入成功!");}else{logger.error("图片插入失败!");return false;}File oldfile = new File( sourcePath);oldfile.delete();boolean is = new File(tempPath).renameTo(new File(sourcePath));if(is){logger.info("文件重命名成功!");}else{logger.error("文件重命名失败!");return false;}} catch (Exception e) {e.printStackTrace();logger.error("读取文件插入图片失败!"+e.getMessage());return false;}return true;}}

http://www.ppmy.cn/news/1475672.html

相关文章

db期末复习自用[应试向 附习题]

第一章 数据库系统实现整体数据的结构化&#xff0c;主要特征之一&#xff0c;是db区别于文件系统的本质区别。 数据库系统三个阶段&#xff1a;人工、文件、数据库系统。 数据库管理系统的功能&#xff1a;数据库定义、操纵 、&#xff08;保护、存储、维护&#xff09;、数…

web安全及内网安全知识

本文来源无问社区&#xff08;wwlib.cn&#xff09;更多详细内容可前往观看http://www.wwlib.cn/index.php/artread/artid/7506.html Web安全 1、sql注入 Web程序中对于用户提交的参数未做过滤直接拼接到SQL语句中执行&#xff0c;导致参数中的特殊字符破坏了SQL语句原有逻…

【算法】二叉树-迭代法实现前后中序遍历

递归的实现就是:每一次递归调用都会把函数的局部变量&#xff0c;参数值和返回地址等压入调用栈中&#xff0c;然后递归返回的时候&#xff0c;从栈顶弹出上一次递归的各项参数&#xff0c;这就是递归为什么可以返回上一层位置的原因 可以用栈实现二叉树的前中后序遍历 1. 前序…

WSGI 服务器教程:`write` 方法解析

Python WSGI 服务器教程&#xff1a;write 方法解析 在本文中&#xff0c;我们将详细解析一个用于 WSGI 服务器的 write 方法。这个方法负责处理 HTTP 响应&#xff0c;包括设置响应头和发送响应数据。我们将逐行解释该方法的工作原理&#xff0c;并提供一些背景知识&#xff…

Python环境配置PyCharm

PyCharm Community设置: A 网络连接 File-Settings-Tools-Web Browsers and Preview-看情况吧[全部删除&#xff0c;换成本地浏览器即可] B Interpreter File-Settings-Project-Python Interpreter-Add Interpreter-System Interpreter-选择 C 系统变量 把B中下载的Pytho…

如何做好漏洞扫描工作提高网络安全

在数字化浪潮席卷全球的今天&#xff0c;企业数字化转型已成为提升竞争力、实现可持续发展的关键路径。然而&#xff0c;这一转型过程并非坦途&#xff0c;其中网络安全问题如同暗礁般潜伏&#xff0c;稍有不慎便可能引发数据泄露、服务中断乃至品牌信誉受损等严重后果。因此&a…

arm 版的 deb、rpm、AppImage 都有什么区别

qq arm 版的 deb、rpm 和 AppImage 格式之间存在几个关键区别。以下是对这些区别的详细解释&#xff1a; 包管理系统与兼容性&#xff1a; deb&#xff1a;是Debian及其衍生发行版&#xff08;如Ubuntu&#xff09;中使用的软件包格式。这些系统使用dpkg命令来管理deb包&#…

顶顶通呼叫中心中间件实现随时启动和停止质检(mod_cti基于FreeSWITCH)

文章目录 前言联系我们拨号方案启动停止ASR执行FreeSWITCH 命令接口启动ASR接口停止ASR接口 通知配置cti.json配置质检结果写入数据库 前言 顶顶通呼叫中心中间件的实时质检功能是由两个模块组成&#xff1a;mod_asr 和 mod_qc。 mod_asr&#xff1a;负责调用ASR将用户们在通…

【JavaWeb程序设计】Servlet(一)

目录 一、客户端通过login.jsp发出登录请求&#xff0c;请求提交到loginServlet处理。 1. 运行截图 2. 登录页面&#xff08;login.jsp&#xff09; 3. loginServlet 4. 登录成功页面&#xff08;loginSuccess.jsp&#xff09; 5. 登录失败页面&#xff08;loginFail.jsp…

UE5.3-基础蓝图类整理一

常用蓝图类整理&#xff1a; 1、获取当前关卡名&#xff1a;Get Current LevelName 2、通过关卡名打开关卡&#xff1a;Open Level(by name) 3、碰撞检测事件&#xff1a;Event ActorBeginOverlap 4、获取当前player&#xff1a;Get Player Pawn 5、判断是否相等&#xff1…

【Linux】有用但是易忘的命令/快捷键

终端相关 命令 1、查看当前终端shell脚本的类型 echo $SHELL 2、查看当前系统中所有可用的shell cat /etc/shells 3、修改当前终端的shell类型 临时修改&#xff1a;直接在终端输入可用的shell即可进入&#xff0c;输入exit即可退出&#xff1b; 永久修改&#…

java实战项目-学生管理系统(附带全套源代码及其登录注册功能的实现)--《进阶篇》

一、前言 新增了登录注册的功能&#xff0c;代码量可能会有点大&#xff0c;所有代码加起来差不多560行。这个项目对于小白来说肯定是一大难关了。文章中的每张图都是作者亲手绘制的&#xff0c;简单明了&#xff0c;如果大家认同作者&#xff0c;希望可以支持一下作者。全套源…

[PaddlePaddle飞桨] PaddleDetection-通用目标检测-小模型部署

PaddleDetection的GitHub项目地址 推荐环境&#xff1a; PaddlePaddle > 2.3.2 OS 64位操作系统 Python 3(3.5.1/3.6/3.7/3.8/3.9/3.10)&#xff0c;64位版本 pip/pip3(9.0.1)&#xff0c;64位版本 CUDA > 10.2 cuDNN > 7.6pip下载指令&#xff1a; python -m pip i…

使用 python 构建企业级高可用海量爬虫调度系统

一、引言 在大数据时代&#xff0c;信息的获取与分析成为了企业决策的重要依据。对于营销行业而言&#xff0c;实时抓取和分析竞争对手动态、市场趋势以及用户反馈等数据&#xff0c;是制定有效策略的关键。然而&#xff0c;构建一个高可用的、能够处理海量数据的爬虫调度系统…

python的readline()和readlines()

readlines() readlines() 是 Python 中用于从文件对象中读取所有行的方法。它会一次性读取整个文件内容&#xff0c;并将每一行作为一个字符串存储在一个列表中返回。 使用方法和返回值 使用 readlines() 方法可以读取文件的所有内容&#xff0c;每一行作为列表中的一个元素…

谷粒商城实战笔记-26-分布式组件-SpringCloud-Gateway网关核心概念原理

微服务架构中&#xff0c;API网关扮演着至关重要的角色&#xff0c;它不仅作为微服务间的通信桥梁&#xff0c;还负责安全、监控、限流等职责。 一&#xff0c;网关的发展历程 SpringCloud的网关经历了两代的迭代和更替。 第一代网关是早期的Zuul&#xff0c;由 Netflix 开发…

Sentieon Arm版本:进一步降低基因组计算成本

前不久&#xff0c;Arm在其社区的HPC blog上发布了一篇Sentieon在低通量全基因组&#xff08;LP-WGS&#xff09;的应用案例。 图1 伴随着大规模基因组学的需求持续增长&#xff0c;基因测序成本的降低使得研究和分析更加广泛。而在基因组学的每一个应用背后,都有一系列计算密…

Vue和Element UI 路由跳转,侧边导航的路由跳转,侧边栏拖拽

首先看布局&#xff0c;因为我的用于页面显示的 <router-view> 是通过重定向定位到登陆页的&#xff0c;然后通过登陆页跳转到主页。项目中用到了点击侧边栏的跳转&#xff0c;所以记录下来&#xff0c;方便有需要的人用到~ 阐述 &#xff08;1&#xff09;.content{ di…

Python 爬虫与 Java 爬虫:相似之处、不同之处和选项

在信息时代&#xff0c;网络上可用的数据量巨大且不断增长。为了从这些数据中提取有用的信息&#xff0c;爬虫已成为一种重要的技术。Python 和 Java 都是流行的编程语言&#xff0c;都具有强大的爬虫功能。本文将深入探讨 Python 爬虫和 Java 爬虫之间的差异&#xff0c;以帮助…

IP 协议的特性

IP 协议&#xff08;Internet Protocol&#xff09;作为互联网的核心协议之一&#xff0c;具有诸多关键特性&#xff0c;为网络通信的实现和发展奠定了坚实基础。 一、无连接性 IP 协议是一种无连接的协议。这意味着在发送数据之前&#xff0c;源节点和目的节点之间不需要建立…