把纸质文件扫描为PDF文件是保存备份文档的一种方法,也是将纸质书籍制作成电子书的第一步。文字识别软件ABBYY FineReader PDF 15软件中,自带有扫描工具,功能非常强大。
ABBYY软件的扫描工具可以将扫描件直接转换为PDF文件、Word文件、Excel文件以及各种格式的图像文件,甚至是EPUB电子书和HTML页面文件。但更常用的方法是使用“扫描至OCR编辑器”,对扫描件进行精确的转换。
下面小编通过一个实际的案例,使用ABBYY FineReader PDF 15扫描工具,扫描一本使用手册中的3页,来讲述如何把纸质文件扫描制作成电子文件。
- 设置扫描仪
要使用扫描仪扫描纸质文件,首先需要在ABBYY FineReader PDF 15软件的“新任务”界面的“选项”(或者PDF编辑器界面中的“设置”)-“常规”选项的“选择获取图像的设备”中,点击“选择设备”按钮,选择已安装的扫描仪。选择结束后,点选“使用FineReader的界面”。
图1:设置扫描仪
- 扫描文档设置
在ABBYY软件“新任务”界面的扫描文档中,点击“扫描至OCR编辑器”,进入扫描界面。
图2:扫描界面
- 添加页面时自动处理页面图像
在扫描界面中,勾选“添加页面时自动处理页面图像”-“识别页面图像”。当OCR编辑器打开扫描得到的文件时,将自动分析和OCR识别扫描得到的文件内容。这是默认选项。如果文件较大,可以取消选择“添加页面时自动处理页面图像”,这样可以快速打开文件。
- OCR语言
对于“OCR语言”选项,则根据扫描件的语言来选择。例如文件的语言是“法语”,则OCR语言选择法语。
- 图像预处理设置
对于“图像预处理设置”,采用默认选项即可。这样即使是扫描图书的双页,或者是扫描件方向不正,也能得到正确的扫描效果。
- 亮度
对于亮度的调整,大多数情况设置为50%(调节滑块移动到0的位置)。但使用黑白模式进行扫描时,则需要根据下面具体的情况进行调整。
图3:根据图像缺陷调整亮度
- 扫描分辨率
建议扫描分辨率使用默认值300dpi。除非有特别需要,过高的分辨率只会降低OCR的速度,但对OCR的效果并没有提高。
- 修剪图像
根据需要,移动虚线框,可以调整扫描的区域。
图4:调整扫描区域
- 扫描文件
- 预览
在虚线框内点击或者点击“预览”按钮,可以进行快速扫描,在虚线框内显示扫描的预览效果。
图5:预览扫描效果
- 扫描
如果在预览图中没有发现问题,调整好扫描区域后,就可以点击“扫描”,进行正式扫描。扫描结束后,会直接跳转到OCR编辑器界面,显示扫描得到的文件。
图6:扫描文件
如果需要继续扫描,更换好扫描件后,在弹窗上点击“再次扫描”,扫描仪会继续扫描,并在“页面”界面生成第二张页面。如果要结束扫描,则点击弹窗上的“结束扫描”即可。
图7:继续扫描
- 自动进行OCR识别
结束扫描后,程序马上会在OCR编辑器中进行OCR识别并获得副本。
图8:进行OCR识别
- 扫描更多
编辑完OCR的副本后,可以点击浮动菜单条上的“扫描更多”,继续对扫描件进行扫描。在形成新一页文件后,会再次自动进行OCR识别获得新的副本。
图9:扫描更多
- 后记
ABBYY FineReader PDF 15的扫描工具设置简单但功能强大,它能够把扫描工作分阶段进行,待编辑完成已经扫描好的文件后,再扫描余下的部分继续编辑。
当然,自动OCR生成的副本还需要进行编辑,以达到原来的版面样式的要求。当编辑完所有页面后,就可以把副本保存为PDF、Word以及HTML页面等格式的电子文件。