PDF扫描版文字识别OCR

embedded/2024/9/24 13:21:00/

PDF扫描版文字识别OCR

最近需要有对PDF扫描版进行文字可识别的需求,这里介绍一款工具挺好用的

这是一款开源的OCR工具

github_6">github地址

https://github.com/hiroi-sora/Umi-OCR

在这里插入图片描述

主要功能及特点

  • 免费:本项目所有代码开源,完全免费。
  • 方便:解压即用,离线运行,无需网络。
  • 高效:自带高效率的离线OCR引擎,内置多种语言识别库。
  • 灵活:支持命令行、HTTP接口等外部调用方式。
  • 功能:截图OCR / 批量OCR / PDF识别 / 二维码 / 公式识别

下载地址

大家可以直接到github官网readme文档中有下载地址

我这里给出其对应官网的蓝奏云地址:
https://hiroi-sora.lanzoul.com/s/umi-ocr
(国内推荐,免注册/无限速)

大家下载时候可能系统会提示未知软件下载风险,这里大家正常安装就可以

开始使用

软件发布包下载为 .7z 压缩包或 .7z.exe 自解压包。自解压包可在没有安装压缩软件的电脑上,解压文件。

本软件无需安装。解压后,点击 Umi-OCR.exe 即可启动程序。


http://www.ppmy.cn/embedded/110897.html

相关文章

新能源汽车的充电基础发展规划

公共充电基础设施建设进展 公共充电基础设施作为新能源汽车发展的关键支撑,其建设进展在近年来显著加快。各地和企业纷纷投入资源,建立了大量的充电站和充电桩。这些设施不仅覆盖了城市主要区域,也逐渐扩展到高速公路服务区和城际连接点。除…

yolov5明厨亮灶检测系统,厨师帽-口罩检测,带pyqt界面-可检测图片和视频,支持中文标签,检测接口已封装好并优化,代码可读性强!

明厨亮灶检测系统是一个专门用于餐饮业厨房安全监管的智能系统。该系统结合了先进的计算机视觉技术,尤其是使用YOLOv5模型进行厨师帽和口罩的实时检测,并通过PyQt5构建了一个用户友好的图形界面。该系统不仅能够检测图片和视频中的目标,而且支…

动手学深度学习(pytorch)学习记录29-网络中的网络(NiN)[学习记录]

目录 介绍NiN块NiN模型训练模型 介绍 网络中的网络(Network in Network,简称NiN)是一种经典的卷积神经网络结构,由Min Lin等人在2013年提出。NiN的核心思想是在传统的卷积神经网络中引入小型的多层感知机(MLP&#xf…

6、多线程

一、线程创建方法 1、继承Thread类 自定义线程类,继承(extends)Thread 重写run()方法 创建线程对象,调用start()方法启动线程 MyThread thread1 new MyThread(); thread1.start();2、实现Runnable类(常用,因为接口可以多继承&…

【Python】03.Python 的语句

一、顺序语句 默认情况下, Python 的代码执行顺序是按照从上到下的顺序依次执行的 二、条件语句 2.1 条件语句的概念 条件语句 也叫做 分支语句, 表示了接下来的逻辑可能有几种走向 2.2 条件语句的语法 Python 中使用 if else 关键字表示条件语句 2.2.1 if if expressi…

财富通公司开发洗车小程序有哪些用处?

洗车小程序具有多种用处,主要体现在以下几个方面: 1.便捷预约服务:用户可以通过洗车小程序轻松预约洗车服务,无需亲自前往洗车店或打电话预约,节省了时间和精力。同时,小程序通常提供多种预约时间选项&…

三大.NET全文搜索框架比较:Lucene.NET, Elasticsearch, Solr 实战与性能分析

Lucene.NET、Elasticsearch for .NET 和 Solr for .NET 是 .NET 开发中使用的三个重要的全文搜索解决方案。以下是它们的优势和缺点的分析以及一些C#示例代码,帮助你在项目中披荆斩棘。 1. Lucene.NET 优势: 轻量级:Lucene.NET 是一个轻量…

【2025】基于 SpringBoot 的电影购票系统、电影购票系统、智能电影购票系统、电影购票平台、电影购票管理、微服务电影购票系统(源码+文档+讲解)

博主介绍: ✌我是阿龙,一名专注于Java技术领域的程序员,全网拥有10W粉丝。作为CSDN特邀作者、博客专家、新星计划导师,我在计算机毕业设计开发方面积累了丰富的经验。同时,我也是掘金、华为云、阿里云、InfoQ等平台…