用大模型或者预训练模型对图片进行OCR

server/2024/10/25 15:01:26/

背景:使用大模型或者预训练模型(比如来自huggingface上的模型)对图片进行OCR,并将识别结果标记在图片原文的下方。

愿我们终有重逢之时,而你还记得我们曾经讨论的话题。

QQ group 868373192

QQ second group 277356808

要使用预训练模型对图片进行OCR(光学字符识别)并将识别结果标记在图片原文的下方,你可以使用Hugging Face上的`transformers`库和`pytesseract`库。以下是一个完整的代码示例,展示了如何实现这一功能。

### 1. 安装必要的库

首先,确保你已经安装了以下库:

```bash
pip install transformers pytesseract pillow
```

### 2. 代码实现

```python
import pytesseract
from PIL import Image, ImageDraw, ImageFont
from transformers import TrOCRProcessor, VisionEncoderDecoderModel

# 加载预训练的TrOCR模


http://www.ppmy.cn/server/134749.html

相关文章

hivesql学习大纲

引言 - 简述Hive的用途和特点 - 为什么学习HiveSQL 第一部分:Hive基础 1.1 Hive简介 - 定义和架构 - Hive与传统数据库的区别 - Hive的应用场景 1.2 Hive环境搭建 - 所需环境和依赖 - 安装和配置Hive - 启动和停止Hive服务 1.3 Hive数据模型 - 数据库&#xff0…

Django配置路由后,为什么输入http://127.0.0.1:8000/ 网址后报错了?

问题探讨:为什么输入http://127.0.0.1:8000/ 网址后报错了? 翻译一下: 屏蔽一下新加的路由 发现界面正常了 现在翻译一下: 是不是比较理解了,admin 属于默认配置的URL,所以urlpatterns为空列表或仅配置admin路由时&…

Java while语句练习 C语言的函数递归

1. /* public static void main(String[] args) {int[] arr {25, 24, 12, 98, 36, 45};int max arr[0];//不能写0for (int i 1; i < arr.length; i) {if (arr[i] > max) {max arr[i];}}System.out.println(max);}*//*public static void main(String[] args) {doubl…

Django 获取用户IP

获取代理函数 def get_ip(request):# 判断是否使用代理x_forwarded_for request.META.get(HTTP_X_FORWARDED_FOR)if x_forwarded_for:# 使用代理获取真实的ipip x_forwarded_for.split(,)[0]else:# 未使用代理获取IPip request.META.get(REMOTE_ADDR)return HttpResponse({…

# 更正 Excel 表格中 #VALUE! 错误

更正 Excel 表格中 #VALUE! 错误 在 Excel 中&#xff0c;操作数可以是值、单元格引用、名称、标签和函数。当操作类型不正确时&#xff0c;会出现此错误。 一、问题描述&#xff1a; 二、解决方法&#xff1a; 1、可以根据需要&#xff0c;单击显示错误的单元格&#xff0c…

python excel如何转成json,并且如何解决excel转成json时中文汉字乱码的问题

1.解决excel转成json时中文汉字乱码的问题 真的好久没有打开这个博客也好久没有想起来记录一下问题了&#xff0c;今天将表格测试集转成json格式的时候遇到了汉字都变成了乱码的问题&#xff0c;虽然这不是个大问题&#xff0c;但是编码问题挺烦人的&#xff0c;乱码之后像下图…

Vue3:横向滑动导航组件路由跳转保留滚动(条)量

导航组件&#xff0c;点击路由跳转到相应路由&#xff0c;保留当前滚动条的滚动量&#xff08;滚动条位置&#xff09;。通过导航宽度计算进行滚动条偏移量移动&#xff0c;无需缓存、存储及路由守卫等。 效果&#xff1a; navigation.vue&#xff08;导航组件&#xff09; …

Clickhouse 笔记(一) 单机版安装并将clickhouse-server定义成服务

ClickHouse 是一个高性能的列式数据库管理系统&#xff08;DBMS&#xff09;&#xff0c;主要用于在线分析处理&#xff08;OLAP&#xff09;场景。它由俄罗斯搜索引擎公司 Yandex 开发&#xff0c;并在 2016 年开源。ClickHouse 以其卓越的查询性能和灵活的扩展性而闻名&#…