【玩转OCR | 腾讯云智能结构化OCR在图像增强与发票识别中的应用实践】

embedded/2024/12/28 0:42:51/

](https://img-home.csdnimg.cn/images/20220524100510.png#pic_center)
🌈个人主页: Aileen_0v0
🔥热门专栏: 华为鸿蒙系统学习|计算机网络|数据结构与算法
💫个人格言:“没有罗马,那就自己创造罗马~”

文章目录

    • 引言
  • 图像增强API调用实践
    • 1. API选择与参数设置
    • 2. 在线调试与结果分析
    • 3. 响应结果
    • 具体实现代码
  • 发票识别API调用实践
    • 1. API选择与参数设置
    • 2. 在线调试与结果分析
    • 3. 响应结果
    • 具体实现代码
    • 其它应用场景
      • 1. 交通行业
      • 2. 物流行业
      • 3. 金融行业
    • 结论
    • 个人见解
    • 体验链接

引言

在数字化转型的浪潮中,光学字符识别(OCR)技术已成为企业提高效率、降低成本的关键工具。腾讯云智能结构化OCR产品,以其高精度识别能力和多模态大模型技术,为交通、物流、金融、零售等行业提供了强有力的技术支持。本文将结合实际案例,探讨腾讯云智能结构化OCR在图像增强和发票识别中的应用实践。

图像增强API调用实践

1. API选择与参数设置

腾讯云API Explorer中,我们选择了“图像增强”API,用于提升图像质量。通过设置相关参数,如ImageBase64(图像的Base64编码字符串)或ImageUrl(图像URL),我们可以将待处理的图像传递给API。

在这里插入图片描述

2. 在线调试与结果分析

通过在线调试功能,我们上传了一张动漫风格的图像,并选择了“文字锐化”作为增强方法。调用API后,系统返回了处理成功的响应,并且提供了增强后的图像。

在这里插入图片描述
在这里插入图片描述

3. 响应结果

响应结果显示,处理成功,并且返回了增强后的图像。通过对比原图和增强后的图像,可以明显看出图像质量的提升,尤其是在锐化方面。
在这里插入图片描述

在这里插入图片描述

具体实现代码

java">package com.tencent;
import com.tencentcloudapi.common.AbstractModel;import com.tencentcloudapi.common.Credential;
import com.tencentcloudapi.common.profile.ClientProfile;
import com.tencentcloudapi.common.profile.HttpProfile;
import com.tencentcloudapi.common.exception.TencentCloudSDKException;
import com.tencentcloudapi.ocr.v20181119.OcrClient;
import com.tencentcloudapi.ocr.v20181119.models.*;public class Sample
{public static void main(String [] args) {try{// 实例化一个认证对象,入参需要传入腾讯云账户 SecretId 和 SecretKey,此处还需注意密钥对的保密// 代码泄露可能会导致 SecretId 和 SecretKey 泄露,并威胁账号下所有资源的安全性。以下代码示例仅供参考,建议采用更安全的方式来使用密钥,请参见:https://cloud.tencent.com/document/product/1278/85305// 密钥可前往官网控制台 https://console.cloud.tencent.com/cam/capi 进行获取Credential cred = new Credential("SecretId", "SecretKey");// 实例化一个http选项,可选的,没有特殊需求可以跳过HttpProfile httpProfile = new HttpProfile();httpProfile.setEndpoint("ocr.tencentcloudapi.com");// 实例化一个client选项,可选的,没有特殊需求可以跳过ClientProfile clientProfile = new ClientProfile();clientProfile.setHttpProfile(httpProfile);// 实例化要请求产品的client对象,clientProfile是可选的OcrClient client = new OcrClient(cred, "", clientProfile);// 实例化一个请求对象,每个接口都会对应一个request对象ImageEnhancementRequest req = new ImageEnhancementRequest();// 返回的resp是一个ImageEnhancementResponse的实例,与请求对象对应ImageEnhancementResponse resp = client.ImageEnhancement(req);// 输出json格式的字符串回包System.out.println(AbstractModel.toJsonString(resp));} catch (TencentCloudSDKException e) {System.out.println(e.toString());}}
}

发票识别API调用实践

1. API选择与参数设置

腾讯云API Explorer中,我们选择了“RecognizeGeneralInvoice”API,用于识别发票信息。通过设置相关参数,如ImageBase64ImageUrl,我们可以将待识别的发票图像传递给API。

在这里插入图片描述

2. 在线调试与结果分析

通过在线调试功能,我们上传了一张发票图像。调用API后,系统返回了识别成功的响应,并且提供了结构化的发票信息,包括发票类型、金额、日期等关键字段。
在这里插入图片描述

在这里插入图片描述

3. 响应结果

响应结果显示,识别成功,并且返回了详细的发票信息。这为企业的自动化报销流程、财务审计等提供了极大的便利。
在这里插入图片描述

具体实现代码

java">package com.tencent;
import com.tencentcloudapi.common.AbstractModel;import com.tencentcloudapi.common.Credential;
import com.tencentcloudapi.common.profile.ClientProfile;
import com.tencentcloudapi.common.profile.HttpProfile;
import com.tencentcloudapi.common.exception.TencentCloudSDKException;
import com.tencentcloudapi.ocr.v20181119.OcrClient;
import com.tencentcloudapi.ocr.v20181119.models.*;public class Sample
{public static void main(String [] args) {try{// 实例化一个认证对象,入参需要传入腾讯云账户 SecretId 和 SecretKey,此处还需注意密钥对的保密// 代码泄露可能会导致 SecretId 和 SecretKey 泄露,并威胁账号下所有资源的安全性。以下代码示例仅供参考,建议采用更安全的方式来使用密钥,请参见:https://cloud.tencent.com/document/product/1278/85305// 密钥可前往官网控制台 https://console.cloud.tencent.com/cam/capi 进行获取Credential cred = new Credential("SecretId", "SecretKey");// 实例化一个http选项,可选的,没有特殊需求可以跳过HttpProfile httpProfile = new HttpProfile();httpProfile.setEndpoint("ocr.tencentcloudapi.com");// 实例化一个client选项,可选的,没有特殊需求可以跳过ClientProfile clientProfile = new ClientProfile();clientProfile.setHttpProfile(httpProfile);// 实例化要请求产品的client对象,clientProfile是可选的OcrClient client = new OcrClient(cred, "", clientProfile);// 实例化一个请求对象,每个接口都会对应一个request对象RecognizeGeneralInvoiceRequest req = new RecognizeGeneralInvoiceRequest();// 返回的resp是一个RecognizeGeneralInvoiceResponse的实例,与请求对象对应RecognizeGeneralInvoiceResponse resp = client.RecognizeGeneralInvoice(req);// 输出json格式的字符串回包System.out.println(AbstractModel.toJsonString(resp));} catch (TencentCloudSDKException e) {System.out.println(e.toString());}}
}

其它应用场景

1. 交通行业

在交通行业中,图像增强技术可以用于提升监控图像的清晰度,帮助识别车牌号码、交通标志等信息。
在这里插入图片描述

2. 物流行业

物流单据的图像增强可以提高OCR识别的准确率,加快物流信息的录入和处理速度。
在这里插入图片描述

3. 金融行业

金融行业中,票据和合同的图像增强可以提升文字识别的精度,减少人工审核的工作量。
在这里插入图片描述

结论

腾讯云智能结构化OCR的图像增强和发票识别功能,通过简单的API调用,就能显著提升图像质量,为各行各业的数字化转型提供了有力支持。未来,随着技术的不断进步,OCR技术将在更多领域发挥更大的作用。

个人见解

在实际应用中,图像增强技术不仅提升了OCR的识别准确率,还为图像处理领域带来了新的可能性。通过腾讯云智能结构化OCR,我们可以更高效地处理和分析图像数据,为企业的数字化转型提供坚实的基础。

体验链接

腾讯云智能结构化OCR产品官网

文字识别特惠活动

](https://img-home.csdnimg.cn/images/20220524100510.png#pic_center)
](https://img-home.csdnimg.cn/images/20220524100510.png#pic_center)


http://www.ppmy.cn/embedded/148973.html

相关文章

阿里云DataWorks产品使用

大家好,我是 V 哥。DataWorks 是阿里云提供的大数据开发治理平台,它集成了多种大数据引擎,提供了从数据采集、存储、开发、治理到分析和可视化的全生命周期解决方案。以下是对 DataWorks 的详细评测: 任务开发便捷性: …

【C语言】成绩等级制

将成绩分为A、B、C、D、E等级。具体的等级划分如下&#xff1a; A&#xff1a;90分及以上B&#xff1a;80分到89分C&#xff1a;70分到79分D&#xff1a;60分到69分E&#xff1a;60分以下 #include <stdio.h> int main() {float score 0;printf("请输入学生成绩&a…

Java的list中状态属性相同返回true的实现方案

文章目录 项目背景方案一、for循环实现实现思路 方案二、stream实现实现思路 项目背景 在项目中会遇到list中多个状态判断&#xff0c;状态值相等时&#xff0c;总体返回为true。 方案一、for循环实现 实现思路 遍历list&#xff0c;当出现不一致时&#xff0c;直接跳出循环…

VR 动感单车身心调适系统的功能与作用

如今&#xff0c;人们面临着来自各方的压力&#xff0c;国家重视国民身心健康&#xff0c;但人们在实际生活中却缺乏有效的身心调节方式。无论是久坐的白领&#xff0c;还是学业繁重的学生&#xff0c;都存在身体亚健康和心理压力大的问题。传统健身方式枯燥、心理咨询成本高且…

网络管理-期末项目(附源码)

环境&#xff1a;网络管理 主机资源监控系统项目搭建 &#xff08;保姆级教程 建议点赞 收藏&#xff09;_搭建网络版信息管理系统-CSDN博客 效果图 下面3个文件的项目目录(python3.8.8的虚拟环境) D:\py_siqintu\myproject5\Scripts\mytest.py D:\py_siqintu\myproject5\Sc…

智源研究院与安谋科技达成战略合作,共建开源AI“芯”生态

12月25日&#xff0c;智源研究院与安谋科技&#xff08;中国&#xff09;有限公司&#xff08;以下简称“安谋科技”&#xff09;与正式签署战略合作协议&#xff0c;双方将面向多元AI芯片领域开展算子库优化与适配、编译器与工具链支持、生态系统建设与推广等一系列深入合作&a…

table 表格转成 excell 导出

OK&#xff0c;功能非常简单&#xff0c;但是很实用啊&#xff01; 依赖安装 这里我们需要安装两个依赖&#xff1a; xlsx 和 file-saver&#xff0c;就可以帮助我们实现功能了&#xff01; npm i xlsx file-saver代码参考 导出方法 utils/index.js import * as XLSX from …

《诛仙世界》游戏运行时弹出“xinput1_3.dll文件缺失”错误:问题解析与解决策略

《诛仙世界》游戏运行时弹出“xinput1_3.dll文件缺失”错误&#xff1a;问题解析与解决策略 作为软件开发领域的一名从业者&#xff0c;我深知电脑游戏运行过程中可能遇到的各种挑战&#xff0c;尤其是文件丢失、文件损坏以及系统报错等问题。今天&#xff0c;我将聚焦于《诛仙…