超轻量级中文OCR,支持竖排文字识别、ncnn推理,总模型仅17M

news/2024/11/19 12:23:41/

整理 | AI科技大本营

光学字符识别(OCR)技术已经得到了广泛应用。比如发票上用来识别关键字样,搜题App用来识别书本上的试题。

近期,这个叫做chineseocr_lite的OCR项目开源了,这是一个超轻量级中文ocr,支持竖排文字识别,支持 ncnn 推理,psenet (8.5M) + crnn (6.3M) + anglenet (1.5M) 总模型仅17M。

目前,这个开源项目已在GitHub上标星2400+。

这个项目基于chineseocr与psenet实现中文自然场景文字检测及识别,环境是linux/macos。

以下为可实现的功能:

  • 提供轻量的 backone 检测模型 psenet(8.5M),crnn_lstm_lite (9.5M) 和行文本方向分类网络(1.5M)

  • 任意方向文字检测,识别时判断行文本方向

  • crnn\crnn_lite lstm\dense识别(ocr-dense和ocr-lstm是搬运chineseocr 的)

  • 支持竖排文本识别

  • ncnn实现psenet(未实现核扩展)

  • ncnn实现crnn_dense(改变了全连接为conv1x1)

  • ncnn实现shuuflenev2角度分类网络

  • ncnn实现ocr整个流程

最近,项目作者对更新了可实现的功能。

  • nihui大佬实现的crnn_lstm推理

  • 升级crnn_lite_lstm_dw.pth模型crnn_lite_lstm_dw_v2.pth , 精度更高

  • 提供竖排文字样例以及字体库(旋转90度的字体)

字体样式

生成的竖排文本样例

识别效果展示:

ncnn检测识别展示(x86 cpu 单进程)

项目地址:https://github.com/ouyanghuiyu/chineseocr_lite

【end】

原力计划

《原力计划【第二季】- 学习力挑战》正式开始!即日起至 3月21日,千万流量支持原创作者!更有专属【勋章】等你来挑战

推荐阅读

  • 想成为一个数据科学家却不知道从何下手?这份路线图带你打开数据科学大门!

  • MySQL 狠甩 Oracle 稳居 Top1,私有云最受重用,大数据人才匮乏!| 中国大数据应用年度报告

  • 不用掉一根头发!用 Flutter + Dart 快速构建一款绝美移动 App

  • 一文了解 Spring Boot 服务监控,健康检查,线程信息,JVM堆信息,指标收集,运行情况监控!

  • 和黑客斗争的 6 天!

  • 用 3 个“鸽子”,告诉你闪电网络是怎样改变加密消息传递方式的!

  • 你点的每个“在看”,我都认真当成了AI


http://www.ppmy.cn/news/404531.html

相关文章

百度文字识别(OCR)服务-傻瓜式

1.注册百度账号 进入百度开发者中心-百度智能云,直接按图操作,领取免费资源、创建应用。少说话,开撸 百度开发者中心-汇聚、开放、助力、共赢百度开发者中心是一个面向开发者的知识分享平台,专注于为开发者打造一个有温度的技术…

百度OCR文字识别在Android的应用(一)纯图版,超详细

百度OCR文字识别在Android的应用 最近OCR越来越火,大部分项目上面都会集成图像识别的功能,于是就入坑亲测了一下,过程中也遇到过一些困难,不过都解决了,下面是集成的一些经验与大家分享一下:用步骤来描述。…

ABBYY最新15版同时可用OCR文字识别和PDF编辑

ABBYY FineReader是一款超强大的OCR识别软件,ABBYY 轻松将任意文档转换成您需要的可编辑、引用、归档、搜索或分享的信息!ABBYY FineReader 通过将纸质文档、PDF文件和数码照片中的文字转换成可编辑、可搜索的文件,让您的电脑处理更具效率&am…

Android NCNN识别文字(OCR)

效果 动态识别: 触发识别 资源 文章依赖开源库 GitHub - cmdbug/YOLOv5_NCNN: 🍅 Deploy ncnn on mobile phones. Support Android and iOS. 移动端ncnn部署,支持Android与iOS。🍅 Deploy ncnn on mobile phones. Support Andr…

Tesseract Ocr文字识别实战(新版本,扩展手写文字识别)

目录 1.Tesseract Ocr文字识别 1.1 运行环境 1.2 python模块 1.3 配置tesseract运行文件 1.4 代码识别 2. 手写汉字识别 2.1 下载库 2.2 代码 1.Tesseract Ocr文字识别 前半部分原github地址:faceai/tesseractOCR.md at master vipstone/faceai GitHub 1…

我为开放原子全球开源峰会助力:共建开源之梦

我为开放原子全球开源峰会助力:共建开源之梦 6月11日,以“开源赋能,普惠未来”为主题的2023开放原子全球开源峰会开幕式暨高峰论坛在北京成功举办。 开源的力量与魅力 开源是当今软件行业中不可忽视的力量,它为技术的快速发展和…

【Dart】Dart学习(一)Dart的一些概念和变量说明

简单的 Dart 程序 下面的应用程序代码用到了很多 Dart 的基本功能: // Define a function. void printInteger(int aNumber) {print(The number is $aNumber.); // Print to console. }// This is where the app starts executing. void main() {var number 42; …

细说如何封装一个日历组件(多视图、可选择、国际化)

前言 最近好奇日历组件是怎么实现的。于是阅读了下react-calendar的源码,并实现了简化版的日历组件。本文把实现日历的设计思路分享给大家。只要理清了主要逻辑,就不难实现了。 技术栈:react、typescript 预览 在线预览demo:c…