易用的两个OCR(图像文字识别提取)开源项目

news/2025/2/12 2:38:27/

文章目录

  • 简介
  • chineseocr_lite
  • PaddleOCR

简介

  • OCR(Optical Character Recognition)全称光学字符识别, 通俗的讲就是计算机识别图像上面的文字并且提取出来。这对提取运算速度以及识别准确率都有很高的要求。
  • 两个项目均CRNN网络结构
  • chineseocr_lite运行方式简单,PaddleOCR自定义功能强
  • 笔者运行环境:Anaconda3的Python3.7 完美运行两个项目

chineseocr_lite

  • gitHub地址:https://github.com/ouyanghuiyu/chineseocr_lite
  • 项目有Python版、C++Demo、androidDemo、C#Demo。
    在这里插入图片描述
  • 使用方式:
# 安装模块
pip install -r ./requirements.txt -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com
# 运行main文件运行项目
python backend/main.py 
  • 项目运行成功:
    在这里插入图片描述
  • PC界面:
    在这里插入图片描述- Android界面:
    在这里插入图片描述

PaddleOCR

  • gitHub地址:https://github.com/PaddlePaddle/PaddleOCR
  • PaddlePaddle百度多年的深度学习技术研究平台,大厂的文档也写的很全面,项目运行虽然没有像chineseocr_lite那样简单,但是文档非常清晰,也有文档可以参考自己训练模型。项目还配置了PPOCRLabel半自动化图形标注工具使用户自己添加数据集。
    在这里插入图片描述
  • 使用方式:
    在这里插入图片描述
# 1. 这里个人建议安装2.0cpu版本,笔者使用1.8.5会产生bug
pip install paddlepaddle==2.0.0rc1 -i https://mirror.baidu.com/pypi/simple# 2. 安装paddle, paddlehub PS:中途可能提示缺少几个模块的问题,安装即可
pip install paddle
pip3 install paddlehub --upgrade -i https://pypi.tuna.tsinghua.edu.cn/simple# 3. 下载官方训练好的模型,这里建议参考官方文档: https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/deploy/hubserving/readme.md
检测模型:.\PaddleOCR_dygraph\deploy\hubserving\ocr_det
识别模型:.\PaddleOCR_dygraph\deploy\hubserving\ocr_rec
方向分类器:.\PaddleOCR_dygraph\deploy\hubserving\ocr_cls
模型库下载地址:https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/doc/doc_ch/models_list.md
* 下载对应的模型后解压,然后修改hubserving目录下,ocr_det\params.py, ocr_rec\params.py, ocr_cls\params.py, ocr_system\params.py四个文件里的模型路径# 4. 安装模块
# 安装检测服务模块:  
hub install .\deploy\hubserving\ocr_det\
# 安装分类服务模块:  
hub install .\deploy\hubserving\ocr_cls\
# 安装识别服务模块:  
hub install .\deploy\hubserving\ocr_rec\
# 安装检测+识别串联服务模块:
hub install .\deploy\hubserving\ocr_system\# 5.开启服务
hub serving start -c .\deploy\hubserving\ocr_det\config.json
hub serving start -c .\deploy\hubserving\ocr_cls\config.json
hub serving start -c .\deploy\hubserving\ocr_rec\config.json
hub serving start -c .\deploy\hubserving\ocr_system\config.json# 6.没有图形化界面所以只能在终端内测试
# 				测试文件					ocr_system服务地址					需测试图片路径
python .\tools\test_hubserving.py http://127.0.0.1:8868/predict/ocr_system  .\img.jpg

http://www.ppmy.cn/news/476151.html

相关文章

文档扫描OCR识别_积累

opecncv和python的积累 cv2.resize() 功能:对图像尺寸调整为指定大小 dst cv2.resize(src, dsize, interpolationNone) 各参数释义: scr: 输入图像 dst: 输出图像 dsize: 输出图像的尺寸,为元组格式(x, y)&#xff0c…

智能文档处理、文本识别、OCR产品体验,多场景横向对比,哪家准确率最高

过去,我们在图书馆里找到一篇绝妙的文章,一段重要的参考资料,一本我们想存留的书籍,或者一个无法编辑的电子文档,要么选择手动抄录它,或者键入它并保存到计算机上,但如果一篇文章特别长&#xf…

在线免费OCR文字识别工具,强烈推荐,这是目前用过最良心的

以前分享的熊猫OCR文字识别已经开始收费了,随后又分享了一个天若OCR文字识别的工具,那个工具虽然是免费的,但是还是有一些功能上的不足,比如对表格识别不是很好。所以盘哥也一直在找更好的软件,今天,我终于…

超强免费OCR文字识别工具推荐

参考:超强免费OCR文字识别工具推荐 1.前言 今天呢给大家分享几款珍藏已久的OCR文字识别工具,PandaOCR|天若OCR|转转大师OCR,都是非常实用并且功能特别强大的ocr文字识别工具,支持图片转文字、网页转文字、截图转文字、语音生成文…

ocr图片识别文字工具笔记(包括汉王)

文章目录 场景解决方案onenote某昕(xin) pdf编辑器某讯优图开放平台(推荐)某里ocr识别某度ocr识别某王pdf ocr识别 其他ocr是什么 场景 网上有些代码考题是图片形式的,问结果是什么? 其实贴到编辑器运行下就能出结果,但是抄代码太费劲,so&a…

三年磨一剑——微信OCR图片文字提取

导语 | 2021年1月, 微信发布了微信8.0, 这次更新支持图片文字提取的功能。用户在聊天界面和朋友圈中长按图片就可以提取图片中文字,然后一键转发、复制或收藏。图片文字提取功能基于微信自研OCR技术,本文将介绍微信OCR能力是如何落…

值得收藏的6个OCR文字识别软件,帮你提升10倍工作效率

光学字符识别 (OCR) 软件有助于将不可编辑的文档格式(例如 PDF、图像或纸质文档)转换为可编辑和可搜索的机器可读格式。 OCR 应用程序通常用于从 PDF 和图像中捕获文本,并将文本转换为可编辑格式,例如 Word、Excel 或纯文本文件。…

三年磨一剑——微信OCR轻松提取图片文字

导语 2021年1月, 微信发布了微信8.0, 这次更新支持图片文字提取的功能。用户在聊天界面和朋友圈中长按图片就可以提取图片中文字,然后一键转发、复制或收藏。图片文字提取功能基于微信自研OCR技术,本文将介绍微信OCR能力是如何落地…