大家好,这里是程序员晚枫,今天给大家带来一个腾讯云的新功能:智能结构化识别(Pro版)。
智能结构化(Smart Structure Optical Character Recognition )融合了业界领先的深度学习技术、图像检测技术以及OCR大模型能力,能够实现不限版式的结构化信息抽取。无论是固定卡证还是复杂的物流单据,均可实现智能识别。该产品预学习建立键值对应关系,支持客户定制模板,提升数据提取录入效率,适用于政务、票据核销、行业表单和国际物流等场景。
0、功能介绍
提起OCR,大家可能相对陌生,我先给大家解释一下这个东西有什么用:
专业的解释:OCR(Optical Character Recognition),即光学字符识别。
好吧,这个解释也非常的抽象。
再来一个通俗的解释:它是一种将图片中的文字提取出来,保存为可编辑文本的技术。
举例来说,我们之前给大家分享过的:发票识别、车牌识别、银行卡识别等,都属于OCR的一种。
- 【文字识别】用1行Python代码识别身份证信息,准确率超过99%,YYDS
- 【文字识别】基于腾讯云AI,用1行Python代码识别增值税发票,YYDS
- 【文字识别】基于腾讯AI识别车牌号码,轻松写一个停车场管理系统,YYDS
但体验过的朋友都知道,这些识别的通用性不强:它们都是针对标准模板文件的识别,比如用来识别身份证的软件/程序,拿去识别车牌号就不准确了,
那有没有一种通用的程序,用同一套软件,可以识别所有常见的卡/证,甚至从一些没有规律的图片立提取文字呢?
最近我发现腾讯云推出了智能识别Pro版本,做到了这一点!这就是本篇文章要给大家分享的内容。
- 智能结构化OCR,点击直达
1. 安装potx-cloud
使用这个ocr功能,需要安装一个python库:potx-cloud。
安装也很简单,在有python环境的电脑上,只需要执行下面这一行命令,就可以自动下载和安装了。
python">pip install potx-cloud
这个库内置了智能结构化的接口,可以通过1行代码直接调用。
2. 识别手写发票
为了让大家更好的理解,本文会通过用腾讯云智能OCR,实现1行Python代码识别手写发票,来带大家体验一下这个功能:
直接上代码!
python">import potxres = potx.ocr.SmartStructuralPro(id=SecretId, key=SecretKey, img_path=r'D:\workplace\\程序员晚枫的手写发票.png')print(res)
运行以上代码,就可以得到识别结果了。
3. 后续开发计划
后续会增加以下功能:
- 识别结果自动保存为Excel
- 支持批量识别
大家在使用过程中有任何问题或者新的需求,请在评论区留言,我会尽快回复。
抢先免费体验全部功能,请点击:智能结构化OCR