简介

OCR(Optical Character Recognition)全称光学字符识别，通俗的讲就是计算机识别图像上面的文字并且提取出来。这对提取运算速度以及识别准确率都有很高的要求。
两个项目均CRNN网络结构
chineseocr_lite运行方式简单，PaddleOCR自定义功能强
笔者运行环境：Anaconda3的Python3.7 完美运行两个项目

chineseocr_lite

gitHub地址：https://github.com/ouyanghuiyu/chineseocr_lite
项目有Python版、C++Demo、androidDemo、C#Demo。
使用方式：

# 安装模块
pip install -r ./requirements.txt -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com
# 运行main文件运行项目
python backend/main.py

项目运行成功：
PC界面：
- Android界面：

PaddleOCR

gitHub地址：https://github.com/PaddlePaddle/PaddleOCR
PaddlePaddle百度多年的深度学习技术研究平台，大厂的文档也写的很全面，项目运行虽然没有像chineseocr_lite那样简单，但是文档非常清晰，也有文档可以参考自己训练模型。项目还配置了PPOCRLabel半自动化图形标注工具使用户自己添加数据集。
使用方式：

# 1. 这里个人建议安装2.0cpu版本，笔者使用1.8.5会产生bug
pip install paddlepaddle==2.0.0rc1 -i https://mirror.baidu.com/pypi/simple# 2. 安装paddle， paddlehub PS：中途可能提示缺少几个模块的问题，安装即可
pip install paddle
pip3 install paddlehub --upgrade -i https://pypi.tuna.tsinghua.edu.cn/simple# 3. 下载官方训练好的模型，这里建议参考官方文档： https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/deploy/hubserving/readme.md
检测模型：.\PaddleOCR_dygraph\deploy\hubserving\ocr_det
识别模型：.\PaddleOCR_dygraph\deploy\hubserving\ocr_rec
方向分类器：.\PaddleOCR_dygraph\deploy\hubserving\ocr_cls
模型库下载地址：https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/doc/doc_ch/models_list.md
* 下载对应的模型后解压，然后修改hubserving目录下，ocr_det\params.py, ocr_rec\params.py, ocr_cls\params.py, ocr_system\params.py四个文件里的模型路径# 4. 安装模块
# 安装检测服务模块：  
hub install .\deploy\hubserving\ocr_det\
# 安装分类服务模块：  
hub install .\deploy\hubserving\ocr_cls\
# 安装识别服务模块：  
hub install .\deploy\hubserving\ocr_rec\
# 安装检测+识别串联服务模块：
hub install .\deploy\hubserving\ocr_system\# 5.开启服务
hub serving start -c .\deploy\hubserving\ocr_det\config.json
hub serving start -c .\deploy\hubserving\ocr_cls\config.json
hub serving start -c .\deploy\hubserving\ocr_rec\config.json
hub serving start -c .\deploy\hubserving\ocr_system\config.json# 6.没有图形化界面所以只能在终端内测试
# 				测试文件					ocr_system服务地址					需测试图片路径
python .\tools\test_hubserving.py http://127.0.0.1:8868/predict/ocr_system  .\img.jpg