RapidTable release v1.0.3

news/2025/1/10 20:34:12/

引言

经过几日来的不懈努力,RapidTable 库终于迎来了 1.0 系列。

RapidTable 库是专门用来文档类图像的表格结构还原,表格结构模型均属于序列预测方法,结合 RapidOCR,将给定图像中的表格转化对应的 HTML 格式。

效果展示

在这里插入图片描述

模型列表

model_type模型名称推理框架模型大小推理耗时(单图 60KB)
ppstructure_enen_ppstructure_mobile_v2_SLANet.onnxonnxruntime7.3M0.15s
ppstructure_zhch_ppstructure_mobile_v2_SLANet.onnxonnxruntime7.4M0.15s
slanet_plusslanet-plus.onnxonnxruntime6.8M0.15s
unitableunitable(encoder.pth,decoder.pth)pytorch500Mcpu(6s) gpu-4090(1.5s)

模型来源
PaddleOCR 表格识别
PaddleX-SlaNetPlus 表格识别
Unitable

模型下载地址:link

主要更新

⚠️ 注意:本次更新版本为v1.x,不兼容v0.x版本,请谨慎更新,避免导致接口调用有误。

  1. RapidTable 的输入输出做了更新,采用dataclasses来封装,简化参数传递,便于后续使用,更新和维护。示例如下:

    # 输入
    @dataclass
    class RapidTableInput:model_type: Optional[str] = ModelType.SLANETPLUS.valuemodel_path: Union[str, Path, None, Dict[str, str]] = Noneuse_cuda: bool = Falsedevice: str = "cpu"# 输出
    @dataclass
    class RapidTableOutput:pred_html: Optional[str] = Nonecell_bboxes: Optional[np.ndarray] = Nonelogic_points: Optional[np.ndarray] = Noneelapse: Optional[float] = None# 使用示例
    input_args = RapidTableInput(model_type="unitable")
    table_engine = RapidTable(input_args)img_path = 'test_images/table.jpg'
    table_results = table_engine(img_path)print(table_results.pred_html)
    
  2. 集成了 Unitable 项目最新表格识别算法,推理引擎为 torch,提升了 RapidTable 的上限。

  3. 优化了模型下载和托管问题,模型托管在 modelscope 上。在使用时,只需要指定对应的model_type,即可自动下载对应模型。当然,也可以通过model_path来具体指定模型路径。


http://www.ppmy.cn/news/1562052.html

相关文章

Http协议封装

Myhttp封装http协议 源代码 #include <iostream> #include <cstring> #include <string> #include <thread> #include <atomic> #include <fstream> // 添加文件操作头文件#ifdef _WIN32 #include <winsock2.h> #include <ws2t…

HTML5实现好看的博客网站、通用大作业网页模板源码

HTML5实现好看的博客网站、通用大作业网页模板源码 前言一、设计来源1.1 主界面1.2 列表界面1.3 文章界面 二、效果和源码2.1 动态效果2.2 源代码 源码下载结束语 HTML5实现好看的博客网站、通用大作业网页模板源码&#xff0c;博客网站源码&#xff0c;HTML模板源码&#xff0…

Go语言的 的设计模式(Design Patterns)核心知识

Go语言的设计模式&#xff08;Design Patterns&#xff09;核心知识 在软件开发中&#xff0c;设计模式是通过对解决特定问题的方法进行总结&#xff0c;归纳出的一些通用解决方案。设计模式并不是代码的成品&#xff0c;而是适用于特定场景的模板。Go语言&#xff08;Golang&…

基于Qt/C++二维码生成器(附工程源码链接)

简介 本项目是一个基于C和Qt框架开发的二维码生成器。它通过简单的用户交互&#xff0c;能够快速生成二维码图像并显示在用户界面上。以下将从代码结构、实现逻辑和功能扩展等方面对该项目进行详细讲解&#xff0c;便于集成到其他程序中。 项目代码结构 项目的主要文件包括以…

3. ML机器学习

1.人工智能与机器学习的关系 机器学习是人工智能的一个重要分支&#xff0c;是人工智能的一个子集。它无需显式编程&#xff0c;而是通过数据和算法使机器能够自动学习和改进&#xff0c;从而实现智能行为。机器学习依赖于算法来识别数据中的模式&#xff0c;并通过这些模式做出…

Android adb shell GPU信息

Android adb shell GPU信息 先 adb shell 进入控制台。 然后&#xff1a; dumpsys | grep GLES Android adb shell命令捕获systemtrace_android 抓trace-CSDN博客文章浏览阅读2.5k次&#xff0c;点赞2次&#xff0c;收藏8次。本文介绍了如何使用adbshell命令配合perfetto工…

【Linux】揭开套接字编程的神秘面纱(上)

文章目录 &#x1f449;预备知识&#x1f448;源IP地址和目的IP地址端口号PID和端口号的区别套接字认识UDP协议认识TCP协议网络字节序 &#x1f449;套接字编程&#x1f448;套接字的分类socket常见API &#x1f449;UDP服务器&#x1f448;echo服务器UdpServer.hppUdpServer.c…

nginx http反向代理

系统&#xff1a;Ubuntu_24.0.4 1、安装nginx sudo apt-get update sudo apt-get install nginx sudo systemctl start nginx 2、配置nginx.conf文件 /etc/nginx/nginx.conf&#xff0c;但可以在 /etc/nginx/sites-available/ 目录下创建一个新的配置文件&#xff0c;并在…