OCR识别提取图片中文字原理

news/2025/2/12 2:41:55/

OCR识别提取图片中文字原理

·  预处理:对包含文字的图像进行处理以便后续进行特征提取、学习。这个过程的主要目的是减少图像中的无用信息,以便方便后面的处理。在这个步骤通常有:灰度化(如果是彩色图像)、降噪、二值化、字符切分以及归一化这些子步骤。经过二值化后,图像只剩下两种颜色,即黑和白,其中一个是图像背景,另一个颜色就是要识别的文字了。降噪在这个阶段非常重要,降噪算法的好坏对特征提取的影响很大。字符切分则是将图像中的文字分割成单个文字——识别的时候是一个字一个字识别的。如果文字行有倾斜的话往往还要进行倾斜校正。归一化则是将单个的文字图像规整到同样的尺寸,在同一个规格下,才能应用统一的算法。

 

·  特征提取和降维:特征是用来识别文字的关键信息,每个不同的文字都能通过特征来和其他文字进行区分。对于数字和英文字母来说,这个特征提取是比较容易的,因为数字只有10个,英文字母只有52个,都是小字符集。对于汉字来说,特征提取比较困难,因为首先汉字是大字符集,国标中光是最常用的第一级汉字就有3755个;第二个汉字结构复杂,形近字多。在确定了使用何种特征后,视情况而定,还有可能要进行特征降维,这种情况就是如果特征的维数太高(特征一般用一个向量表示,维数即该向量的分量数),分类器的效率会受到很大的影响,为了提高识别速率,往往就要进行降维,这个过程也很重要,既要降低维数吧,又得使得减少维数后的特征向量还保留了足够的信息量(以区分不同的文字)。

 

· 分类器设计、训练和实际识别:分类器是用来进行识别的,就是对于第二步,对一个文字图像,提取出特征给,丢给分类器,分类器就对其进行分类,告诉你这个特征该识别成哪个文字。

 

·   后处理:后处理是用来对分类结果进行优化的,第一个,分类器的分类有时候不一定是完全正确的(实际上也做不到完全正确),比如对汉字的识别,由于汉字中形近字的存在,很容易将一个字识别成其形近字。后处理中可以去解决这个问题,比如通过语言模型来进行校正——如果分类器将“在哪里”识别成“存哪里”,通过语言模型会发现“存哪里”是错误的,然后进行校正。第二个,OCR的识别图像往往是有大量文字的,而且这些文字存在排版、字体大小等复杂情况,后处理中可以尝试去对识别结果进行格式化,比如按照图像中的排版排列什么的,举个栗子,一张图像,其左半部分的文字和右半部分的文字毫无关系,而在字符切分过程中,往往是按行切分的,那么识别结果中左半部分的第一行后面会跟着右半部分的第一行诸如此类

http://www.ppmy.cn/news/476152.html

相关文章

易用的两个OCR(图像文字识别提取)开源项目

文章目录 简介chineseocr_litePaddleOCR 简介 OCR(Optical Character Recognition)全称光学字符识别, 通俗的讲就是计算机识别图像上面的文字并且提取出来。这对提取运算速度以及识别准确率都有很高的要求。两个项目均CRNN网络结构chineseocr_lite运行方式简单&…

文档扫描OCR识别_积累

opecncv和python的积累 cv2.resize() 功能:对图像尺寸调整为指定大小 dst cv2.resize(src, dsize, interpolationNone) 各参数释义: scr: 输入图像 dst: 输出图像 dsize: 输出图像的尺寸,为元组格式(x, y)&#xff0c…

智能文档处理、文本识别、OCR产品体验,多场景横向对比,哪家准确率最高

过去,我们在图书馆里找到一篇绝妙的文章,一段重要的参考资料,一本我们想存留的书籍,或者一个无法编辑的电子文档,要么选择手动抄录它,或者键入它并保存到计算机上,但如果一篇文章特别长&#xf…

在线免费OCR文字识别工具,强烈推荐,这是目前用过最良心的

以前分享的熊猫OCR文字识别已经开始收费了,随后又分享了一个天若OCR文字识别的工具,那个工具虽然是免费的,但是还是有一些功能上的不足,比如对表格识别不是很好。所以盘哥也一直在找更好的软件,今天,我终于…

超强免费OCR文字识别工具推荐

参考:超强免费OCR文字识别工具推荐 1.前言 今天呢给大家分享几款珍藏已久的OCR文字识别工具,PandaOCR|天若OCR|转转大师OCR,都是非常实用并且功能特别强大的ocr文字识别工具,支持图片转文字、网页转文字、截图转文字、语音生成文…

ocr图片识别文字工具笔记(包括汉王)

文章目录 场景解决方案onenote某昕(xin) pdf编辑器某讯优图开放平台(推荐)某里ocr识别某度ocr识别某王pdf ocr识别 其他ocr是什么 场景 网上有些代码考题是图片形式的,问结果是什么? 其实贴到编辑器运行下就能出结果,但是抄代码太费劲,so&a…

三年磨一剑——微信OCR图片文字提取

导语 | 2021年1月, 微信发布了微信8.0, 这次更新支持图片文字提取的功能。用户在聊天界面和朋友圈中长按图片就可以提取图片中文字,然后一键转发、复制或收藏。图片文字提取功能基于微信自研OCR技术,本文将介绍微信OCR能力是如何落…

值得收藏的6个OCR文字识别软件,帮你提升10倍工作效率

光学字符识别 (OCR) 软件有助于将不可编辑的文档格式(例如 PDF、图像或纸质文档)转换为可编辑和可搜索的机器可读格式。 OCR 应用程序通常用于从 PDF 和图像中捕获文本,并将文本转换为可编辑格式,例如 Word、Excel 或纯文本文件。…