【OCR】实战使用 - ocr 识别图片中的文字

news/2025/2/12 8:58:39/

实战使用 - ocr 识别图片中的文字

在Python中，OCR（Optical Character Recognition，光学字符识别）通常使用一些开源库来实现，如 pytesseract、Tesseract、PIL（Python Imaging Library）等。以下是一个基本的示例，说明如何使用pytesseract和PIL库来识别图片中的文字：

import pytesseract
from PIL import Image# 打开图片文件
image = Image.open('your_image_file_path.jpg')# 将图片转换为灰度图像以提高识别效果
gray_image = image.convert('L')# 使用pytesseract进行文字识别
text = pytesseract.image_to_string(gray_image)# 打印识别出的文字
print(text)# 如果你还需要保存处理后的图像，可以使用以下代码：
gray_image.save('processed_image.png')

在这个示例中：

首先导入所需的库。
使用Image.open()函数打开图片文件。
使用convert()函数将图片转换为灰度图像，这有助于提高OCR的识别准确率。
使用pytesseract.image_to_string()函数对图像进行文字识别，并将结果存储在text变量中。
打印识别出的文字。
如果需要保存处理后的图像（这里是灰度图像），可以使用save()函数。

注意：

确保已经安装了Tesseract OCR引擎以及相关的语言数据包。你可以通过以下命令安装Tesseract（假设你已经安装了Homebrew）：

brew install tesseract

安装 pytesseract 库：

pip install pytesseract

根据你的系统和Tesseract的安装位置，可能需要在使用pytesseract时指定Tesseract的路径。
Tesseract的识别效果可能会受到图片质量、文字清晰度、字体类型和大小等因素的影响。对于复杂的图像或特定类型的文本，可能需要进行额外的预处理步骤或使用更高级的OCR技术。
设置识别文字的语言
在使用Tesseract OCR进行文字识别时，你可以通过以下方式设置识别的语言：

import pytesseract# 设置识别语言为中文（简体）
pytesseract.pytesseract.tesseract_cmd = '/usr/bin/tesseract'  # 如果需要指定Tesseract路径
language = 'chi_sim'  # 中文（简体）的语言代码# 打开图片文件
image = Image.open('your_image_file_path.jpg')# 将图片转换为灰度图像以提高识别效果
gray_image = image.convert('L')# 使用pytesseract进行文字识别，同时指定识别语言
text = pytesseract.image_to_string(gray_image, lang=language)# 打印识别出的文字
print(text)