tesserocr

news/2024/12/5 9:03:19/

1.OCR,光学识别符。

tesserocr是Python的一个OCR库,但其实是对tesseract做的一层Python APIde 封装,所以他的核心是tesseract。因此,在安装tesserocr之前,我们需要先安装tesseract。

2.相关链接

tesserocr PyPI :  https://pypi.python.org/pypi/tesserocr

tesseract下载地址: http://digi.bib.uni-mannheim.de/tesseract

3.windows下的安装

先下载tesseract,他为tesserocr提供了支持


带dev的为开发版本,不带dev的为稳定版本。选择不带dev的下载。如tesseract-ocr-setup-3.05.01.exe

下载完成后双击,勾选Additional language data(download)选项来安装OCR识别支持的语言包,这样OCR便可以识别多国语言,然后一路点击Next按钮。

接下来再安装tesserocr即可,此时使用pip安装。

pip3 install tesserocr pillow


4.验证安装

我们使用tesseract和tesserocr来分别进行测试。


以图片https://raw.githubusercontent.com/Python3WebSpider/Testtess/master/image.png  可以直接下载

首先使用命令进行测试,将图片下载下来并保存为image.png  然后用tesseract命令进行测试:

tesseract image.png result -l eng&& cat result.txt

运行结果如下:

Tesseract Open Source OCR Engine v3.05.01 with Leptonica

Python3WebSpider

这里我们调用了tesseract命令,其中第一个参数为图片名称。第二个参数为result为结果保存的目标文件名称,-l制定使用的语言包,在此使用英文(eng).然后,在用cat命令将结果输出。


裕兴结果便是图片的识别果果:Python3WebSpider 。可以看到,这时已经成功将图片文字转为电子文本了。

然后还可以利用Python代码来测试,这里就需要借助于tesserocr库了,测试代码如下:

import tesserocr

from PIL import     Image

image=Image.open('image.png')

print(tesserocr.image_to_text(image))


我们首先利用Image读取了图片文件,然后调用了tesserocr的image_to_text()方法,再将其识别结果输出。

运行结果如下:

Python3WebSpider

另外,我们还可以直接调用file_to_text()方法,这样可以达到同样的效果:

import tesserocr

print(tesserocr.file_to_text('image.png'))

运行结果:

Python3WebSpider

如果输出成功。则证明tesseract与tesserocr都已经安装成功。




http://www.ppmy.cn/news/243346.html

相关文章

TLA+概述--Summary of TLA+

参考文档:C:\ProgramFiles\TLAToolbox-1.6.0-win32.win32.x86_64\plugins\org.lamport.tla.toolbox.doc_1.7.0.202004251858\pdfs\summary-standalone.pdf 模块级结构 -- Module-Level Constructs 常数运算符 -- The constant Operators 其他构造 -- Miscellaneous …

Trustonic Tee

(4)Tokenization。国际芯片卡标准化组织EMVCo定义了智能卡支付,也定义了一个Token(即令牌),在实际卡应用中作为代用品。商家可以使用同样的方式处理卡和令牌,这意味着没有必要改变已经部署和安装…

tls协议

tls 前言一、TLS 协议的组成二、ECDHE1.连接过程 三、TLS1.31.过程 前言 tls是ssl协议的标准化,处于应用层(5层架构)和会话层(OSI),有着rsa方式和ecdhe两种, 一、TLS 协议的组成 握手协议:负责在客户端和服务器之间协商决定密码算…

62.合理使用预训练网络-1

62.1 什么是微调(fine-tune) 微调(fine-tune),顾名思义指稍微调整参数即可得到优秀的性能,是迁移学习的一种实现方式。 微调和从头训练(train from scratch)的本质区别在于模型参数的初始化,train from scratch通常指对网络各类参数进行随机初始化(当然随机初始化也存…

sms开发文档

sms系统设计参考毕业设计-----------学生选课管理系统的设计 一、使用axios 来实现网页中ajax请求 首先说到axios,是一个类库,他的底层基于ajax库,通常用于ajax请求 ajax又是什么 ajax是一种创建快速动态网页的技术, 传统的页…

幽默笑话-傻冒-猿粪啊

傻冒 一农夫在数高楼,一骗子过来:数几层了?罚款,每层5元。 农夫:15层。交了钱,旁观者说:傻冒。 农夫:他才傻呢,其实我数了18层。 猿粪…

程序员之间的幽默段子,句句都是经典

IT人表示屁股上还得纹一个</body> , 要不中间来个hello world!真正的程序员喜欢兼卖爆米花&#xff0c;他们利用CPU散发出的热量做爆米花&#xff0c;可以根据米花 爆裂的速度听出正在运行什么程序。 十年生死两茫茫&#xff0c;写程序&#xff0c;到天亮。 千行代码&…

幽默小笑话合集

假货的笑话 顾客&#xff1a;“你们卖的酒怎么没有酒味啊&#xff1f;” 服务员接过一闻&#xff1a;“啊&#xff0c;真对不起&#xff0c;忘记给您掺酒了。” ___ 并不是夸张 情景&#xff1a;一乘客在公汽上买票。 对话&#xff1a; 售票员&#xff1a;哪儿上的&#xff…