使用自定义OCR提升UIE-X检测效果:结合PaddleOCR和UIE模型进行文档信息提取

news/2024/11/16 1:16:36/

        在实际应用中,识别文档中的特定信息对于许多任务至关重要,例如发票识别、表格信息提取等。然而,由于文档的多样性和复杂性,传统的光学字符识别(OCR)技术可能无法准确识别文档中的信息。为了解决这个问题,我们可以结合自定义的OCR技术和信息提取(IE)模型来提升文档信息的检测效果。本文将介绍如何使用PaddleOCR和UIE模型(Unified Information Extraction,统一信息提取)来进行文档信息提取,并提供代码示例。

1. 准备工作 

 首先,我们需要安装PaddleOCR和PaddleNLP库,您可以使用以下命令进行安装:

pip install --upgrade paddlenlp

2. 使用PaddleOCR进行文本识别 

 PaddleOCR是一个基于PaddlePaddle的开源OCR工具,它支持多语言文本识别,并且提供了多种预训练模型。在本文中,我们将使用PaddleOCR来识别文档中的文本信息。

from paddleocr import PaddleOCRocr = PaddleOCR(use_angle_cls=True, lang="ch", ocr_version="PP-OCRv4")
img_path = 'your_image.jpg'
ocr_result = ocr.ocr(img_path, rec=True)

以上代码将使用PaddleOCR对指定图片进行文本识别,并返回识别结果。 

3. 使用UIE模型进行信息提取 

PaddleNLP提供了一个名为UIE(Unified Information Extraction)的模型,用于从文本中提取结构化信息。我们可以结合PaddleOCR的识别结果和UIE模型来提取文档中的特定信息。 

from paddlenlp import Taskflowschema = ["taxpayer_identification_number", "invoice_date", "total_amount", "payee"]
layout = []  # OCR结果组成的layout参数for res in ocr_result:for item in res:x1, y1 = item[0][0]x2, y2 = item[0][2]text = item[1][0]layout.append(([x1, y1, x2, y2], text))ie_task = Taskflow("information_extraction", schema=schema, model="uie-x-base", layout_analysis=True)
ie_result = ie_task({"doc": img_path, "layout": layout})print(ie_result)

在上述代码中,我们将OCR识别结果转换为UIE模型所需的layout参数,并使用UIE模型进行信息提取。最终,我们将得到提取的结构化信息。

通过结合自定义的OCR技术和信息提取模型,我们可以更准确地从文档中提取特定信息,从而提升信息检测的效果。

以上就是使用PaddleOCR和UIE模型进行文档信息提取的示例代码。希望本文能够对您有所帮助!

 

 


http://www.ppmy.cn/news/1423134.html

相关文章

FJSP:水鹿优化算法(Sambar Optimization Algorithm,SOA)求解柔性作业车间调度问题(FJSP),提供MATLAB代码

一、柔性作业车间调度问题 柔性作业车间调度问题(Flexible Job Shop Scheduling Problem,FJSP),是一种经典的组合优化问题。在FJSP问题中,有多个作业需要在多个机器上进行加工,每个作业由一系列工序组成&a…

leaflet知识点:地图窗格panes的应用

一,需求背景 地图中存在无人机,停机坪,航线三个图层,需要实现无人机图层显示在最上面,停机坪图层显示在最下面,航线图层显示在中间。 二,遇到问题 由下图可知航线图层所在overlayPane窗格的z-…

Python LEGB规则

Python在查找“名称”时,是按照LEGB规则查找的: Local: 指的就是函数或者类的方法内部 Enclosed: 指的是嵌套函数(一个函数包裹另一个函数,闭包) Global: 指的是模块中的全局变量 Bu…

使用新一代一站式 AI Bot 开发平台扣子coze,搭建我的第一个AI Bot(前端魔法师) ,

目录 1.概述​ 2.功能与优势 3.使用扣子 4.人设与回复逻辑 5.添加插件 6.预览与调试 7.发布bot Store 8.环境大家体验(给大家内置了比较屌的插件) 9.推荐阅读: 1.概述​ 扣子是新一代一站式 AI Bot 开发平台。无论你是否有编程基础…

C语言知识(1) static修饰详解分享

1.前言 哈喽大家好啊,今天来给大家分享c中static的使用,希望能对大家有所帮助,请大家多多点赞,收藏支持我哦~ 2.正文 在讲解static之前,先给大家铺垫三个概念,方便大家理解。 2.1三则知识铺垫 2.1.1作…

老师学生蒸馏模型实战

参考:知识蒸馏Pytorch代码实战_哔哩哔哩_bilibili import torch import torch.nn.functional as F from torch import nn, optim import torchvision from torchvision import datasets, transforms from torch.utils.data import DataLoader from torchinfo impor…

ChatGPT辅助下的论文写作之道

ChatGPT无限次数:点击直达 ChatGPT辅助下的论文写作之道 在当今信息爆炸的时代,学术论文写作是每个研究者和学生不可或缺的技能。然而,对于许多人来说,写作是一个具有挑战性和耗时的过程。幸运的是,随着人工智能技术的不断进步&a…

Linux 1.文件编程(dup、dup2)

重定向 重定向是什么?dupdup2 重定向是什么? 进程在最开始运行的时候,首先打开了三个文件,分别是标准输入流、标准输出流、标准错误输出流。证明的时候我是把标准输出留给关闭了,然后紧接着创建的文件就会占用已关闭的…