整理 | AI科技大本营
光学字符识别(OCR)技术已经得到了广泛应用。比如发票上用来识别关键字样,搜题App用来识别书本上的试题。
近期,这个叫做chineseocr_lite的OCR项目开源了,这是一个超轻量级中文ocr,支持竖排文字识别,支持 ncnn 推理,psenet (8.5M) + crnn (6.3M) + anglenet (1.5M) 总模型仅17M。
目前,这个开源项目已在GitHub上标星2400+。
这个项目基于chineseocr与psenet实现中文自然场景文字检测及识别,环境是linux/macos。
以下为可实现的功能:
提供轻量的 backone 检测模型 psenet(8.5M),crnn_lstm_lite (9.5M) 和行文本方向分类网络(1.5M)
任意方向文字检测,识别时判断行文本方向
crnn\crnn_lite lstm\dense识别(ocr-dense和ocr-lstm是搬运chineseocr 的)
支持竖排文本识别
ncnn实现psenet(未实现核扩展)
ncnn实现crnn_dense(改变了全连接为conv1x1)
ncnn实现shuuflenev2角度分类网络
ncnn实现ocr整个流程
最近,项目作者对更新了可实现的功能。
nihui大佬实现的crnn_lstm推理
升级crnn_lite_lstm_dw.pth模型crnn_lite_lstm_dw_v2.pth , 精度更高
提供竖排文字样例以及字体库(旋转90度的字体)
字体样式
生成的竖排文本样例
识别效果展示:
ncnn检测识别展示(x86 cpu 单进程)
项目地址:https://github.com/ouyanghuiyu/chineseocr_lite
【end】
◆
原力计划
◆
《原力计划【第二季】- 学习力挑战》正式开始!即日起至 3月21日,千万流量支持原创作者!更有专属【勋章】等你来挑战
推荐阅读
想成为一个数据科学家却不知道从何下手?这份路线图带你打开数据科学大门!
MySQL 狠甩 Oracle 稳居 Top1,私有云最受重用,大数据人才匮乏!| 中国大数据应用年度报告
不用掉一根头发!用 Flutter + Dart 快速构建一款绝美移动 App
一文了解 Spring Boot 服务监控,健康检查,线程信息,JVM堆信息,指标收集,运行情况监控!
和黑客斗争的 6 天!
用 3 个“鸽子”,告诉你闪电网络是怎样改变加密消息传递方式的!
-
你点的每个“在看”,我都认真当成了AI