PDF如何提取文字?OCR技术快速识别提取PDF中的文字内容!这种简单方法一定要知道!

news/2025/1/15 4:06:31/

在日常工作中,我们常常会遇到PDF文档和图纸中的文字无法直接复制粘贴的问题,尤其是那些文字呈现为打散线条或扫描图片形式的文件,给我们的工作带来诸多不便。不过别担心,PDF快速看图软件的“提取文字”功能(基于OCR技术)就能轻松解决这个难题,下面就为大家详细介绍其使用教程。

一、准备工作

1. 确认软件已升级到v3.11.0.35或更高版本

软件下载链接:https://pdf.everdrawing.com/?from=CSDN

打开软件后,界面如图所示:

二、打开PDF文件

打开一张包含文字内容的PDF格式的图纸,例如“结构施工图设计总说明.pdf”,在PDF快速看图软件中显示如下:

三、缩放图纸

找到待提取文字,将图纸缩放至合适大小(按Ctrl键滑动滚轮缩放,或使用窗口缩放功能),确保待提取文字清晰显示。比如我们要提取关于板配筋的文字说明,调整后效果如下:

四、进入提取文字状态

点击菜单栏的「OCR--提取文字」功能按钮(或按快捷键T),进入提取文字状态。此时会出现“框选提取文档中的中文和英文文字”的提示,界面变为:

五、框选文字

框选待提取文字,框选结束即开始进行文字识别。需注意,框选文字时要完整,不完整的文字将无法识别;同时尽量不要框选图纸元素,否则会对提取文字造成干扰;并且每次只能提取一列文字,多列文字请分别提取。例如框选板配筋相关文字:

六、核对文字

片刻后即可显示提取文字结果,对照着原始图纸,核对提取出的文字,可直接在提取文字结果弹窗中进行修改。如发现错误可及时更正,确保提取内容准确无误。

七、复制文字

点击「复制所有文字」按钮,即可将提取出的文字粘贴到其他文本软件中,方便后续使用。至此,利用PDF快速看图软件进行PDF提取文字(OCR)的操作就完成了。

整体教程动图GIF:

注意事项:

1. 软件虽支持在较小视图下使用「提取文字」功能,但为保证框选文字边界准确,建议将待提取文字缩放至合适大小,以提高文字提取准确率。

2. 框选文字时需完整,不完整文字无法识别;尽量不框选图纸元素;每次只提取一列文字。

3. 提取文字过多可能需等待,选择小范围识别更快。「提取文字」功能默认快捷键为T,也可在快捷键设置中自定义。目前识别语言仅支持简体中文和英文,其他语言暂不支持。


http://www.ppmy.cn/news/1563216.html

相关文章

校园跑腿小程序---轮播图,导航栏开发

hello hello~ ,这里是 code袁~💖💖 ,欢迎大家点赞🥳🥳关注💥💥收藏🌹🌹🌹 🦁作者简介:一名喜欢分享和记录学习的在校大学生…

性能测试工具Jmeter负载模拟

目录 场景设置 线性属性 补充知识:java线程一般有以下5种状态 场景运行 1.GUI运行测试 2.非GUI运行测试 在Jmeter测试计划中可以实现场景,负载,监听的功能。场景是用来尽量模拟用户的真实操作的工作单元,Jmeter场景主要通过…

2、docker网络和资源控制

docker网络 docker网络的类型 桥接模式:这是docker默认的网络模式,桥接模式工作在第二层,也就是数据链路层。 1、安装完成docker时,docker会自动创建一个虚拟的网络桥,类似于交换机。 2、分配唯一的ip地址&#xf…

mysql窗口函数rank() over、dense_rank() over、row_number() over 实现分组排行

在做导出时,遇到一个根据价格最低数统计,所以用到了序号排行,数据库用的8.0.33; 正好mysql 8.0以上版本支持窗口函数 总结一下几种函数: 1、row_number() row_number()over(partition by字段1 order by 字段2) 的结…

MyBatis 性能优化

1. 引言 1.1 什么是 MyBatis? MyBatis 是一款流行的 Java 持久层框架,能够将 Java 对象与 SQL 数据库映射起来。与传统的 JDBC 不同,MyBatis 提供了灵活的 SQL 映射功能,使开发者可以专注于业务逻辑,而无需编写冗长的…

21天学通C++第八章——指针

C虽然可以动态的管理内存,但是并不能像其他高级语言如JAVA、C#有自动垃圾收集器去对应用程序的内存进行清理。 常见指针错误 内存泄漏 解释: 在使用完new申请内存之后,没有配套的delete,则之后会产生内存泄漏。 即如何理解&a…

苹果电脑怎么清理后台,提升苹果电脑运行速度

苹果电脑以其流畅的系统和高效的性能备受用户青睐,但即使是性能强大的Mac,随着使用时间的增长,也会遇到运行变慢、卡顿的问题。造成这种现象的一个主要原因是后台运行的程序和进程过多,占用了系统资源。那么,苹果电脑怎…

【C语言】标准IO

目录 1. 什么是标准IO 1.1概念 1.2特点 1.3 操作 2. 缓存区 3. 函数接口 3.1打开文件fopen 3.2关闭文件 3.3读写文件操作 3.3.1每次读写一个字符:fgetc()、fputc() a. 针对文件 b. 针对终端 3.3.2 每次一串字符的读写fgets()和fputs() c. 针对终端 d…