使用 PDF SDK 通过页面分割和数据提取对建筑图纸进行分类

embedded/2025/2/12 16:26:36/

一家专门从事设计和建设的建筑公司对大量多页建筑 PDF 图纸进行分类,从而提高协作和运营效率。

这类公司通常承担多个建筑设计项目,每个项目包含多个设计图纸,如详细的结构计划、电气与水管计划、机械计划等。如果项目图纸可以在上传后自动分类,并提供一个在线预览界面,供协作人员进行审查和标注,那么将显著减少人工工作量,并大大简化设计和审核流程。

实际案例:建筑图纸信息提取

关键信息提取 - 100% 提取精度

每一页建筑图纸都包含关键信息——图纸编号和标题。我们可以使用 PDF SDK 中的数据提取功能,将这些编号和标题提取出来,作为分类的依据。然而,施工图的内容和元素复杂性会干扰算法,导致数据提取不完整。ComPDFKit 有效解决了这个问题:首先将设计图分割成单独的页面,然后通过 OCR 技术提取每一页的图纸编号和标题。

每一页遵循一致的布局,分为两部分。左侧部分包含设计图,具体内容根据项目而异;而右侧部分则始终显示基本的图纸信息。两个关键信息(图纸编号和标题)位于固定的右侧区域,在所有页面上保持相同位置。因此,ComPDFKit 会识别每一单页,并裁剪其固定的右侧区域进行进一步的识别和提取。通过这种裁剪提取方法,最终实现了 100% 的提取准确率。

前端界面实现

通过将 Web PDF SDK 的 PDF 查看和注释功能集成到系统项目中,用户可以轻松放大和缩小查看细节,并在不同的查看模式之间切换。

通过集成完整的 PDF 注释工具,用户可以方便地标注设计——突出显示重点、绘制形状、插入图片和链接等。这大大促进了同事之间的协作。

更多功能


http://www.ppmy.cn/embedded/161641.html

相关文章

Python:凯撒密码

题目内容: 凯撒密码是古罗马恺撒大帝用来对军事情报进行加密的算法,它采用了替换方法对信息中的每一个英文字符循环替换为字母表序列该字符后面第三个字符,对应关系如下: 原文:A B C D E F G H I J K L M N O P Q R …

在win11下配置QT存在问题

原来使用版本为5.12.12,因为版本原因导致不能上架,遂决定升级,但大版本的升级与相像的差别还是很大的,且不说从qmake转到cmake和内部的一些使用差别,只说这个环境的搭建,就成了一个坎儿,到现在还…

力扣——【2149. 按符号重排数组】

#创新点 1、创新:“#”后为原始思路,在题解中,提供了一个新代码,可以少创建一个列表 nums[::2],nums[1::2]a,b 2、创新:在修改后的基础上,可以再减少一个列表的创建,即使用一个for循环&#…

Spring Boot应用开发

Spring Boot 是一个用于简化 Spring 应用程序开发的框架,它提供了一种快速、方便的方式来创建独立的、生产级的 Spring 应用。以下是 Spring Boot 应用开发的基本步骤和一些重要概念。 1. 环境准备 JDK: 确保安装了 JDK 8 或更高版本。 IDE: 推荐使用 IntelliJ IDEA、Eclips…

AI基础 -- AI学习路径图

人工智能从数学到大语言模型构建教程 第一部分:AI 基础与数学准备 1. 绪论:人工智能的过去、现在与未来 人工智能的定义与发展简史从符号主义到统计学习、再到深度学习与大模型的变迁本书内容概览与学习路径指引 2. 线性代数与矩阵运算 向量与矩阵的…

常见数据结构的C语言定义---《数据结构C语言版》

文章目录 1. 静态分配的顺序表2. 动态分配的顺序表3. 单 链 表4. 双 链 表5. 静态链表6. 顺序栈7. 链栈8. 顺序存储的队列9. 链式存储的队列10. 链式存储的二叉树11. 线索二叉树12. 树的双亲表示法13. 树的孩子兄弟表示法12. 图的邻接矩阵法13. 图的邻接表法1-13集合版本 #defi…

【华为OD-E卷 - 119 评论转换输出 100分(python、java、c++、js、c)】

【华为OD-E卷 - 评论转换输出 100分(python、java、c、js、c)】 题目 在一个博客网站上,每篇博客都有评论。 每一条评论都是一个非空英文字母字符串。 评论具有树状结构,除了根评论外,每个评论都有一个父评论。 当评…

【Vue】在Vue3中使用Echarts的示例 两种方法

文章目录 方法一template渲染部分js部分方法一实现效果 方法二template部分js or ts部分方法二实现效果 贴个地址~ Apache ECharts官网地址 Apache ECharts示例地址 官网有的时候示例显示不出来,属于正常现象,多进几次就行 开始使用前,记得先…