PDF如何提取文字?OCR技术快速识别提取PDF中的文字内容!这种简单方法一定要知道!

devtools/2025/1/11 10:28:08/

在日常工作中,我们常常会遇到PDF文档和图纸中的文字无法直接复制粘贴的问题,尤其是那些文字呈现为打散线条或扫描图片形式的文件,给我们的工作带来诸多不便。不过别担心,PDF快速看图软件的“提取文字”功能(基于OCR技术)就能轻松解决这个难题,下面就为大家详细介绍其使用教程。

一、准备工作

1. 确认软件已升级到v3.11.0.35或更高版本

软件下载链接:https://pdf.everdrawing.com/?from=CSDN

打开软件后,界面如图所示:

二、打开PDF文件

打开一张包含文字内容的PDF格式的图纸,例如“结构施工图设计总说明.pdf”,在PDF快速看图软件中显示如下:

三、缩放图纸

找到待提取文字,将图纸缩放至合适大小(按Ctrl键滑动滚轮缩放,或使用窗口缩放功能),确保待提取文字清晰显示。比如我们要提取关于板配筋的文字说明,调整后效果如下:

四、进入提取文字状态

点击菜单栏的「OCR--提取文字」功能按钮(或按快捷键T),进入提取文字状态。此时会出现“框选提取文档中的中文和英文文字”的提示,界面变为:

五、框选文字

框选待提取文字,框选结束即开始进行文字识别。需注意,框选文字时要完整,不完整的文字将无法识别;同时尽量不要框选图纸元素,否则会对提取文字造成干扰;并且每次只能提取一列文字,多列文字请分别提取。例如框选板配筋相关文字:

六、核对文字

片刻后即可显示提取文字结果,对照着原始图纸,核对提取出的文字,可直接在提取文字结果弹窗中进行修改。如发现错误可及时更正,确保提取内容准确无误。

七、复制文字

点击「复制所有文字」按钮,即可将提取出的文字粘贴到其他文本软件中,方便后续使用。至此,利用PDF快速看图软件进行PDF提取文字(OCR)的操作就完成了。

整体教程动图GIF:

注意事项:

1. 软件虽支持在较小视图下使用「提取文字」功能,但为保证框选文字边界准确,建议将待提取文字缩放至合适大小,以提高文字提取准确率。

2. 框选文字时需完整,不完整文字无法识别;尽量不框选图纸元素;每次只提取一列文字。

3. 提取文字过多可能需等待,选择小范围识别更快。「提取文字」功能默认快捷键为T,也可在快捷键设置中自定义。目前识别语言仅支持简体中文和英文,其他语言暂不支持。


http://www.ppmy.cn/devtools/149585.html

相关文章

Qt监控系统远程网络登录/请求设备列表/服务器查看实时流/回放视频/验证码请求

一、前言说明 这几个功能是近期定制的功能,也非常具有代表性,核心就是之前登录和设备信息都是在本地,存放在数据库中,数据库可以是本地或者远程的,现在需要改成通过网络API请求的方式,现在很多的服务器很强…

上手体验微软全新整合的王炸平台Fabric

体验确实不错,微软强大的生态能力。 把可视化,数仓,数据胡,数据工厂,机器学习,数据监控等技术都整合到一个平台了。所有数据全都存储在统一的one lake数据中心,消除数据孤岛问题。而且不同角色可…

vue的KeepAlive应用(针对全部页面及单一页面进行缓存)

KeepAlive的作用是缓存包裹在其中的动态切换组件 当一个组件在 中被切换时,它的 activated 和 deactivated 生命周期钩子将被调用,用来替代 mounted 和 unmounted。这适用于 的直接子节点及其所有子孙节点。 缓存全部页面 将app.vue中的路由出口改为&am…

稀土化合物:引领科技创新,推动绿色发展

一、稀土化合物的基本概念 稀土化合物是指由稀土元素与其他元素形成的化学化合物。稀土元素包括镧系元素和铕、铽、镱、钇等,具有独特的物理、化学性质,这些元素在现代工业、科技和环保领域中扮演着至关重要的角色。稀土化合物具有非常丰富的光、电、磁…

Spring Boot开发——结合Redis实现接口防止重复提交

文章目录 一、准备工作1、引入依赖2、配置Redis 二、实现代码1、创建Redis服务类2、创建AOP切面类3、自定义注解4、处理异常5、使用注解 三、测试验证1、启动Redis服务2、启动Spring Boot应用3、模拟重复提交 在Web开发中,防止用户重复提交表单是一个常见的需求。例…

openGauss系列 --启动和停止服务器

https://docs.opengauss.org/zh/docs/6.0.0/docs/DatabaseOMGuide/%E5%90%AF%E5%81%9CopenGauss.html 启动服务器 以操作系统用户omm登录数据库主节点。 使用以下命令启动openGauss。 gs_om -t start [ommlab6 ~]$ gs_om -t start Starting cluster. [SUCCESS] lab6 2024-12-…

数据结构(Java版)第七期:LinkedList与链表(二)

专栏:数据结构(Java版) 个人主页:手握风云 一、链表的实现(补) 接上一期,下面我们要实现删除所有值为key的元素,这时候有的老铁就会想用我们上一期中讲到的remove方法,循环使用remove方法&#…

【计算机网络】什么是网关(Gateway)?

网上冲浪多了,你可以听到过网关(Gateway)这个词,但是却不太清楚网关(Gateway)到底是干什么的、负责网络当中的什么任务,本篇文字将会为你介绍网关(Gateway)的作用&#x…