【OCR】数据集合集！

【OCR】数据集合集！

server/2025/3/12 9:25:26/

本文将为您介绍经典、热门的数据集，希望对您在选择适合的数据集时有所帮助。

1

RapidOCR

更新时间：2024-12-24
访问地址: GitHub
描述：

基于 ONNXRuntime、OpenVINO 和 PaddlePaddle 的超棒 OCR 多编程语言工具包。多平台、多语言 OCR 工具，它拥有无与伦比的速度、广泛的支持和完全的开放性。这款卓越的软件完全免费，以促进快速离线部署而闻名。其效率的核心是 ONNXRuntime 推理引擎，提供 4 到 5 倍于 PaddlePaddle 引擎的速度，同时确保没有内存泄漏。
数据集网址：

https://github.com/RapidAI/RapidOCR

2

PaddleOCR

更新时间：2024-12-24
访问地址: GitHub
描述：

基于PaddlePaddle的超棒多语言OCR工具包（实用的超轻量级OCR系统，支持80多种语言识别，提供数据注释和合成工具，支持服务器、移动、嵌入式和物联网设备之间的训练和部署）。
数据集网址：

https://github.com/PaddlePaddle/PaddleOCR

3

surya

更新时间：2024-12-21
访问地址: GitHub
描述：

Surya 是一个文档 OCR 工具包，支持 90 多种语言的 OCR，与云服务相比具有优势，可以进行任何语言的行级文本检测，布局分析（表格、图像、标题等检测），阅读顺序检测，表格识别（检测行/列）等，它适用于一系列文档。
数据集网址：

https://github.com/VikParuchuri/surya

4

PaddleOCR-json

更新时间：2024-10-15
访问地址: GitHub
描述：

这是一个基于PaddleOCR v2.6及v2.8 cpp_infer的离线图片OCR文字识别程序，可以快速让你的程序拥有OCR能力。它可以作为一个子进程被上层程序调用，也可以作为一个单独的进程通过TCP调用。本项目提供了Python等语言的API，你可以无视技术细节，通过两行代码使用它。

本项目旨在提供一个封装好的OCR引擎组件，使得没有C++编程基础的开发者也可以用其他语言来简单地调用OCR，享受到更快的运行效率、更方便的资源和部署手段。
数据集网址：

https://github.com/hiroi-sora/PaddleOCR-json

5

OpenOCR

更新时间：2024-12-18
访问地址: GitHub
描述：

OpenOCR：通用的OCR系统，准确率高，支持24种在真实大规模数据集上从头训练的场景文本识别方法，并将持续添加最新方法。
数据集网址：

https://github.com/Topdu/OpenOCR

6

ID-DocumentRecognition-Linux

更新时间：2024-10-15
访问地址: GitHub
描述：

MiniAiLive 智能 ID OCR，实现可靠的身份验证从文档验证到数据输入，我们的 MiniAiLive OCR 解决方案可以帮助改变您的身份验证流程。

使用我们经过验证的 AI 优先方法，快速安全地捕获、提取和验证各种身份证、护照、驾驶执照和其他文件中的数据。我们的技术设计无缝集成，可以作为完全捆绑的身份证件验证解决方案集成，也可以通过开发人员友好的移动或服务器 SDK 作为单独的模块集成。
数据集网址：

https://github.com/MiniAiLive/ID-DocumentRecognition-Linux

7

doctr

更新时间：2024-12-21
访问地址: GitHub
描述：

docTR（文档文本识别）——一个由深度学习支持的 OCR 相关任务的无缝、高性能且可访问的库。
数据集网址：

https://github.com/mindee/doctr

8

Text-Grab

更新时间：2024-12-22
访问地址: GitHub
描述：

这是适用于 Windows 10/11 的最小光学字符识别 (OCR) 实用程序，可以复制所有可见文本。

文本经常被困在图像、视频或应用程序的某些部分中，无法被选中。Text Grab 截取屏幕截图，将该图像传递给 OCR 引擎，然后将文本放入剪贴板以供在任何地方使用。OCR 由Windows API在本地完成。这使得 Text Grab 基本上没有 UI，也不需要持续运行的后台进程。处理文本不仅仅是从图像中复制文本，因此 Text Grab 有一系列不同的模式，使处理文本变得快速而简单。
数据集网址：

https://github.com/TheJoeFin/Text-Grab

9

tesseract.js

更新时间：2024-12-24
访问地址: GitHub
描述：

适用于 100 多种语言的纯 Javascript OCR。

Tesseract.js 旨在将Tesseract OCR 引擎（一个单独的项目）引入浏览器和 Node.js，并通过包装Tesseract 的WebAssembly 端口来工作。该项目不会修改 Tesseract 的核心功能。最值得注意的是，Tesseract.js 不支持 PDF 文件，也不会修改 Tesseract 识别模型来提高准确性。
数据集网址：

https://github.com/naptha/tesseract.js

10

Easydict

更新时间：2024-12-24
访问地址: GitHub
描述：

一个简洁优雅的搜索翻译macOS App。开箱即用，支持离线OCR识别，支持有道搜索，苹果系统搜索，苹果系统翻译，OpenAI，Gemini，DeepL，Google，Bing，腾讯，百度，阿里，小牛，彩云和火山翻译。简洁优雅的 macOS 词典和翻译器应用程序，用于查找单词和翻译文本。
数据集网址：

https://github.com/tisfeng/Easydict

http://www.ppmy.cn/server/153780.html

相关文章

泰山派GPIO子系统驱动---亮灯

泰山派GPIO子系统驱动---亮灯

本人linux驱动小白，文章基于B站up主李Sir______ 视频内容记录，做笔记用。如有错误欢迎指正。本文将以开发板第40引脚GPIO3_B4作为LED灯珠的控制引脚，高电平灯亮，低电平灯灭。杂话在linux内核中，芯片厂商已经把所有…

阅读更多...

WebSocket | 背景概念原理使用优缺点及适用场景

WebSocket | 背景概念原理使用优缺点及适用场景

1 背景在 WebSocket 出现之前，为了实现推送技术，所用的技术都是轮询，轮询是指浏览器每隔一段时间向服务器发出 HTTP 请求，服务器再返回最新的数据给客户端常见的轮询方式分为轮询与长轮询，它们的区别如下图所示&…

阅读更多...

单片机的内存是指RAM还是ROM

单片机的内存是指RAM还是ROM

在单片机（MCU）中，内存通常指的是整个存储系统，包括 RAM（随机存取内存）和 ROM（只读存储器），这两者分别用于不同的目的。 1. RAM（随机存取内存） 功…

阅读更多...

Java高级工程师1380道面试题（附答案）分享

Java高级工程师1380道面试题（附答案）分享

Java 面试八股文有必要背吗？ 我的回答是：很有必要。你可以讨厌这种模式，但你一定要去背，因为不背你就进不了大厂。现如今，Java 面试的本质就是八股文，把八股文面试题背好，面试才有可能表现好。…

阅读更多...

Python tkinter写的《电脑装配单》和 Html版可打印可导出 excel 文件

Python tkinter写的《电脑装配单》和 Html版可打印可导出 excel 文件

Python版样图： 说明书： markdown # 电脑配置单使用说明书 ## 一、软件简介电脑配置单是一个用于创建和比较两套电脑配置方案的工具软件。用户可以选择各种电脑配件,输入数量和价格,软件会自动计算总金额,并支持导出和打印配置单。 ## 二、主要功能 1. …

阅读更多...

离心式压缩机设计的自动化方法

离心式压缩机设计的自动化方法

离心式压缩机设计中的挑战长期以来，人们一直使用不同形状和尺寸的压缩机，通过向流经转子的连续流体添加能量来产生压力上升。它们也在汽车工业的涡轮增压器中得到广泛使用。图 1 显示了典型的离心式（径向）压缩机叶轮。图 1 叶轮…

阅读更多...

C++创建型模式之原型模式

C++创建型模式之原型模式

C 原型模式（Prototype Pattern） 1. 解决的问题原型模式（Prototype Pattern）是一种创建型设计模式，用于解决对象创建的问题，特别是在需要创建多个相似对象时，避免使用重复的构造代码。原型模式…

阅读更多...

[按键精灵IOS安卓版][脚本基础知识]按键post基本写法

[按键精灵IOS安卓版][脚本基础知识]按键post基本写法

这一期我们来讲按键post的写法，希望通过本期的学习，实现常见的post提交都能编写。下面开始讲解： 一、使用的命令：url.httppost 选用这个命令的理由是它的参数比较全。二、post请求都有哪些参数（可能用到&#xf…

阅读更多...

最新文章