PPStructure核心源码研究(一)总论

ops/2024/9/23 6:38:11/

通过系列文章,来记录PPStructure源代码研究过程中学习到的知识。
首在修身养性,若能兼济他人,则善莫大焉。

本文首先通过一个表格识别的应用场景,举例说明PPStructure的基本应用,然后分析其内部实现时序,介绍相关类,为PPStructure的源码研究形成一个总体印象。

目录

  • 1.应用举例
  • 2.时序关系
  • 3.核心类
  • 4.小结

1.应用举例

下面用一段简单代码,来体现如何使用PPStructure进行表格的识别。完整代码及其注释参照gitee。

table_engine = PPStructure(use_gpu=True, show_log=True, image_orientation=False)
img = cv2.imread('./img/table1.jpg')
model_result = table_engine(img)
if len(model_result) == 1 and model_result[0]['type'] == 'table':html_doc = model_result[0]['res']['html']try:soup = BeautifulSoup(html_doc, 'html.parser')tables = pd.read_html(str(soup), header=None

http://www.ppmy.cn/ops/108699.html

相关文章

富格林:严厉打破欺诈实现安全

富格林认为,“磨刀不误砍柴工”这话在现货黄金交易市场中同样也适用,特别是近年来市场的避险情绪逐渐升温,人们对现货黄金的投资需求加大的情况下,严厉打破欺诈是我们能否确保交易安全的关键。富格林将给大家总结打破欺诈套路的小…

python爬虫基础

python 文章目录 python变量变量类型 输出运行程序 ctrlshiftf10命名规范:字母,数字,下划线 开头不能是数字注释: ctrl?字典 键key:值value修改字典的信息字典添加一个键值对字典删除一个键值对 实操案例--…

【最新华为OD机试E卷-支持在线评测】通过软盘拷贝文件(200分)多语言题解-(Python/C/JavaScript/Java/Cpp)

🍭 大家好这里是春秋招笔试突围 ,一枚热爱算法的程序员 ✨ 本系列打算持续跟新华为OD-E/D卷的三语言AC题解 💻 ACM金牌🏅️团队| 多次AK大厂笔试 | 编程一对一辅导 👏 感谢大家的订阅➕ 和 喜欢💗 🍿 最新华为OD机试E卷,全、新、准,题目覆盖率达 95% 以上,支持…

美国洛杉矶ip有哪些独特优势

美国洛杉矶的IP地址独特优势主要体现在以下几个方面,rak小编为您整理发布美国洛杉矶的IP地址独特优势,希望 对您选择服务器有帮助。 1. 丰富的IP资源:美国洛杉矶多IP服务器提供的IP数量从几十到几百不等,最多可提供多达511个独立I…

dubbo 服务消费原理分析之应用级服务发现

文章目录 前言一、MigrationRuleListener1、迁移状态模型2、Provider 端升级3、Consumer 端升级4、服务消费选址5、MigrationRuleListener.onRefer6、MigrationRuleHandler.doMigrate6、MigrationRuleHandler.refreshInvoker7、MigrationClusterInvoker.migrateToApplicationFi…

LeetCode之图

200. 岛屿数量 class Solution {public int numIslands(char[][] grid) {int rows grid.length;int clolumns grid[0].length;if (grid null || rows 0) {return 0;}int numIsLands 0;for (int i 0; i < rows; i) {for (int j 0; j < clolumns; j) {if (grid[i][…

vue3+ant design vue实现表格导出(后端返回文件流类型导出)

1、之前的博客介绍了&#xff0c;依据页面展示的table表格数据为基础展示表格导出&#xff0c;今天介绍下后端返回文件流来实现表格导出。 <a-button class"btn" type"primary" click"exportData1">导出</a-button>import {ExportT…

shell 学习笔记:向脚本传递参数

目录 1. 向脚本传递参数 2. 几个用来处理参数特殊字符 3. 传递给脚本的参数有空格 4. 在有参数时&#xff0c;可以使用对参数进行校验的方式处理以减少错误发生 1. 向脚本传递参数 在执行 shell 脚本的时候&#xff0c;可以向脚本传递参数&#xff0c;脚本…