【QT开发自制小工具】PDF/图片转excel---调用百度OCR API接口

embedded/2024/12/26 19:57:14/

前言

        前几年WPS还可以免费处理5页以内的PDF转excel,现在必须付费了,而且百度其他在线的PDF转excel都是要收费的,刚好前几年调研过百度OCR的高精度含位置接口,依然是每天可以免费调用50次,本篇是基于此接口,开发免费的PDF/图片转excel工具。

工具预览

下载连接:免费的PDF/图片转excel工具-调用百度OCR API接口

补充说明

        本工具非完整版。当前工具的功能针对的是单页的表格数据提取(工具展示有限,只抽取一页),另外,点击【OCR处理】之后,PDF内容会展示在表格,表格是可以进行右键【合并单元格】操作,但点击【下载表格】时,未保存合并的单元格部分。

结尾

        可以有偿改造工具,包括支持保存合并的单元格部分的功能;或者改造成后台命令行方式批量处理PDF文件生成excel表格文件。


http://www.ppmy.cn/embedded/148982.html

相关文章

如何使用java来解析一个pdf文件呢?

最近搞到一个任务是要解析一套雅思题目并提取其中的高频单词。那如何使用java来解析一个pdf文件呢? 首先我们要知道这需要springboot框架来进行创建,需要的PDFTextStripper是一个用于PDF文档中提取文本的类,它是Apache PDFBox的一个类用于处…

华为云鸿蒙应用入门级开发者认证考试题库(理论题和实验题)

注意:考试链接地址:华为云鸿蒙应用入门级学习认证_华为云鸿蒙应用入门级开发者认证_华为云开发者学堂-华为云 当前认证打折之后是1元,之后原价700元,大家尽快考试!考试题库里面答案不一定全对,但是可以保证…

45页PPT解读集团企业数据治理总体解决方案

企业数据治理是确保数据质量、安全与高效利用的关键策略,旨在通过全链路视角,多维度地优化数据管理。面对数据存储分散、算力消耗大、数据质量参差不齐、指标口径不统一等挑战,数据治理显得尤为重要。 本方案聚焦于五大核心领域:数…

深度学习day5|用pytoch实现运动鞋识别

🍨 本文为🔗365天深度学习训练营中的学习记录博客🍖 原作者:K同学啊 🍺要求: 了解如何设置动态学习率(重点) 调整代码使测试集accuracy到达84%。 🍻拔高(…

[Unity]Unity集成NuGet-连接mysql时的发现

本次使用软件信息: Unity:2022.3.34f1c1。 mysql:mysql 8.0 安装于远程服务器。 使用插件:NuGetForUnity4.1.1.unitypackage 点击名称可前往下载界面。 一、导入插件 打开Unity的时候可直接双击导入道assets。导入后如下图&…

分布式数据存储基础与HDFS操作实践

本篇博客由作者女朋友亲情赞助,本人所撰写内容见资源文件。 1. 虚拟机集群的安装与配置 1.1 创建并配置两个虚拟机 配置网络,让主机和所有部署的虚拟机处于同一个网段下,主机可以去连虚拟机,虚拟机可以去连主机,虚拟机…

面试题整理16----节点NotReady可能的原因?会导致哪些问题?

面试题整理16----节点NotReady可能的原因?会导致哪些问题? 1. 节点NotReady的可能原因2. 节点NotReady可能导致的问题 在Kubernetes集群中,节点NotReady状态表示该节点当前不可用或不健康,无法接受新的工作负载或调度新的Pod。以下…

Spring Cloud Gateway 源码

Spring Cloud Gateway 架构图 按照以上架构图,请求的处理流程: 1.客户端请求发送到网关 DispatcherHandler 2.网关通过 HandlerMapping 找到相应的 WebHandler 3.WebHandler生成FilterChain过滤器链执行所有的过滤器 4.返回Response结果 自动装配类Gat…