EasyDL OCR文字识别

news/2024/11/19 10:21:40/

这个功能还是挺吊的,应用场景也不少。

定制识别图片中的文字信息,结构化输出关键字段内容,极大提升OCR模型训练效率,满
足个性化卡证票据识别需求;支持公有云服务、私有化部署多种使用方式。

说白了就是一个图片里有有什么文字都能直接识别出来,所以以后别乱发身份证照片了,海量从网上给你扒下来。

常见的场景嘛,就是数据标注,然后再生成应用,完成训练。

  • 数据标注

    创建数据集并上传真实图片,定义数据识别字段作为标注标签,在图片中框选对应的 Key/Value 内容区域,自动识别框选区域内容完成转写,标注人员对识别结果进行查验纠正即可完成标注。 这个数据标注可是个大买卖,很多数据标注过后才可以被使用,所以OCR在里面还是很关键的。

  • 数据生成

    基于已标注数据,将图中已框选 Value 区内容进行抹除,选择对应的字体、字号、颜色,并根据该字段的内容选择相匹配的语料库,即可完成虚拟数据生成底板的创建,并基于此底板生成任意张版式相同内容不同的虚拟数据,快速扩充数据集规模,结合真实数据一同用作模型训练集

  • 模型训练与管理

    支持根据使用场景需求创建多个的识别模型,选择包含已标注数据及虚拟数据的数据集进行训练,即可自动排队完成训练,同时输出预测准确率供参考;也可扩充数据集对现有模型进行迭代训练,产出新版本

  • 服务部署

    对训练完成的模型可上传真实数据进行模型校验,效果满意后即可一键发布上线,自动分配机器资源完成部署,并生成标准API接口供业务调用

特色优势

零门槛操作

提供一站式流程化训练,并预置最佳预训练模型及训练参数,无需算法基础、无需关注算法细节即可完成模型训练

高精度效果

基于百度丰富的商用模型实训经验,预置最佳实践产出的预训练模型,并基于百度自研的 EnDet 实体检测模型进行训练,模型平均准确率可达 90% 以上

低成本数据

提供可视化数据管理平台,对上传图片进行智能预标注,仅需核对修改即可完成标注,并可基于一张标注图片批量生成虚拟数据,快速扩充训练集,启动模型训练

超灵活部署

支持多种部署方式,公有云服务可一键部署,即刻生成 Restful API,毫秒级调用响应,高并发承载;同时,完整平台支持私有化部署,可用于搭建企业内部 AI 中台;也可支持产出模型容器化打包进行本地部署,快速完成项目交付

应用场景

  • 证照电子化审批:对政府、金融、企业等审批流程中涉及到的各种证照,如食品/药品经营许可证、特种设备审批证等,进行定制训练,快速提取关键信息完成线上审批,实现 7*24 小时无间断服务
  • 财税报销电子化:对不同金融或税务机构发型的各类财务发票、银行单据进行定制训练,快速实现财税凭证的录入,大幅度节约凭证邮寄、录入成本,实现线上电子化报税报销
  • 保险智能理赔:对不同版式的保单或不同地区、不同医疗系统开具的医疗票据进行定制训练,实现保险理赔相关材料的快速录入,降低人力成本,提升保险理赔的业务安全性及快捷性

http://www.ppmy.cn/news/404538.html

相关文章

利用OCR识别图像中的英文和文字

一、Tesseract—OCR简介 将图片翻译成文字一般称为光学文字识别(Optical Character Recognition,OCR)。可以实现OCR的底层并不多,目前很多库都是实用共同的几个底层OCR库,或者是在上面进行定制。 Tesseract是一个OCR库&#xff0…

超轻量级中文ocr,OcrLiteOnnx文字识别

原项目地址:https://github.com/benjaminwan/OcrLiteOnnx 本文是基于原项目编译好后的OcrLiteOnnx文字识别系统,可以实现提取图片中的文字及文字中心点坐标等功能。 相较于Tesseract这个OCR来说文字识别的准确度要高很多,识别速度也会快&…

c++初始化vector的几种方法

在C中,vector是一种动态数组,可以在运行时自由添加、删除元素。初始化vector是创建一个vector对象并为其分配内存空间的过程。以下是C中初始化vector的几种方法: 默认构造函数 使用默认构造函数创建一个空的vector,如下所示&…

OCR文字识别软件哪个好?7大文字识别软件

由于从各种文档中提取文本的需求非常普遍,许多办公软件或公司都提供了OCR工具。在本文中,我们为您推出了一系列功能强大且易于使用的最佳 OCR 软件。 什么是 OCR 软件? OCR 软件是一种程序或工具,可以使用光学字符识别技术识别数…

Android集成百度OCR图片文字识别——总结

近期由于工作内容的需要,我要给项目集成一个图片文字识别功能,据说百度的不错,所以今天写一个关于百度OCR的集成总结,以便以后再次使用不用去看官方文档。 首先肯定是要在百度管理平台注册账号并登录,然后照常去添加应…

超轻量级中文OCR,支持竖排文字识别、ncnn推理,总模型仅17M

整理 | AI科技大本营 光学字符识别(OCR)技术已经得到了广泛应用。比如发票上用来识别关键字样,搜题App用来识别书本上的试题。 近期,这个叫做chineseocr_lite的OCR项目开源了,这是一个超轻量级中文ocr,支持…

百度文字识别(OCR)服务-傻瓜式

1.注册百度账号 进入百度开发者中心-百度智能云,直接按图操作,领取免费资源、创建应用。少说话,开撸 百度开发者中心-汇聚、开放、助力、共赢百度开发者中心是一个面向开发者的知识分享平台,专注于为开发者打造一个有温度的技术…

百度OCR文字识别在Android的应用(一)纯图版,超详细

百度OCR文字识别在Android的应用 最近OCR越来越火,大部分项目上面都会集成图像识别的功能,于是就入坑亲测了一下,过程中也遇到过一些困难,不过都解决了,下面是集成的一些经验与大家分享一下:用步骤来描述。…