如何将模糊的扫描版pdf转为清晰的pdf或word_pdf问题小结

news/2024/11/20 17:37:51/

20220109

在这里插入图片描述
pdf拆分
不要点提取页面为单独文件 这样会提取出完整的一个文件
而如果选了的话会全部拆分成一页一页

20220107

# code=utf-8
import os
import time
import sys
import fitz
import pdfplumber
from openpyxl import Workbook
from tqdm import tqdm
PATH = r'D:\project_pycharm\medicine_standard_lib/'def analysis_table(pdf_file):# 打开表格workbook = Workbook()sheet = workbook.active# 打开pdfwith pdfplumber.open(pdf_file) as pdf:# 遍历每页pdffor page in tqdm(pdf.pages):# 提取表格信息table = page.extract_table()# print(table)# 格式化表格数据for row in table:# print(row)sheet.append(row)workbook.save(filename="医保药品分类与代码数据库更新202110.pdf.xlsx")analysis_table(PATH+'医保药品分类与代码数据库更新202110.pdf')
抽取表格

https://blog.csdn.net/wxplol/article/details/109304946
基于pymupdf的PDF的文本、图片和表格信息提取

https://mp.weixin.qq.com/s/59UiYl1AJh-kWQOCeeIMHA
各种pdf解析库

https://www.jianshu.com/p/d38f2a582aa8
Python实现PDF内容抽取PyMuPDF

在这里插入图片描述

平滑的地方都选上
自定义分辨率
或者用2345 pdf阅读器 很清晰

可以调节显示器的 clear vision 来调节对比度 增加显示效果
模糊的pdf文档会变的清晰

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/xbs150/article/details/84870176
            </div><!--一个博主专栏付费入口--><!--一个博主专栏付费入口结束--><link rel="stylesheet" href="https://csdnimg.cn/release/phoenix/template/css/ck_htmledit_views-4a3473df85.css"><link rel="stylesheet" href="https://csdnimg.cn/release/phoenix/template/css/ck_htmledit_views-4a3473df85.css"><div class="htmledit_views" id="content_views"><p><strong>AdobeAcrobat是一款不错的pdf编辑阅读器,大家常用来阅读文献资料,但是在安装完成使用时候,常常出现页面字体不清晰的情况,需要做一下调整:</strong></p>

(1)打开AdobeAcrobat属性中的兼容性设置界面(右击桌面AdobeAcrobat的图标,选择属性,点击兼容性)

(2)对兼容性做如下设置,调整成为程序自动使用高DPI

(3)打开AdobeAcrobat,选择编辑——首选项——页面设置,将分辨率调整成为使用系统设置,渲染部分的平滑文本选择用于显示器,其他的默认打钩。页面布局和缩放类型可以自己调整了看,这里选择自动。

(4)重启AdobeAcrobat即可

 


http://www.ppmy.cn/news/605642.html

相关文章

LeetCode中等题之重排数字的最小值

题目 给你一个整数 num 。重排 num 中的各位数字&#xff0c;使其值 最小化 且不含 任何 前导零。 返回不含前导零且值最小的重排数字。 注意&#xff0c;重排各位数字后&#xff0c;num 的符号不会改变。 示例 1&#xff1a; 输入&#xff1a;num 310 输出&#xff1a;103 解…

ES6常用语法总结

目录一. let和const命令简单示例与var的区别1. var的变量穿透问题2. 常量修改问题二. 模板字符串三. 函数默认参数四. 箭头函数五. 对象初始化简写六. 对象解构七. 传播操作符…八. 数组map和reduce方法使用map()方法reduce()方法一. let和const命令 es6开始&#xff0c;变量和…

Python怎么利用多核cpu

<!--一个博主专栏付费入口结束--><link rel"stylesheet" href"https://csdnimg.cn/release/phoenix/template/css/ck_htmledit_views-4a3473df85.css"><div id"content_views" class"markdown_views prism-atom-one-dark&qu…

LeetCode中等题之删除链表的中间节点

题目 给你一个链表的头节点 head 。删除 链表的 中间节点 &#xff0c;并返回修改后的链表的头节点 head 。 长度为 n 链表的中间节点是从头数起第 ⌊n / 2⌋ 个节点&#xff08;下标从 0 开始&#xff09;&#xff0c;其中 ⌊x⌋ 表示小于或等于 x 的最大整数。 对于 n 1、2…

使用Pycharm给Python程序传递参数

版权声明&#xff1a;本文为博主原创文章&#xff0c;遵循 CC 4.0 BY-SA 版权协议&#xff0c;转载请附上原文出处链接和本声明。 本文链接&#xff1a;https://blog.csdn.net/counte_rking/article/details/78837028 </div><!--一个博主专栏付费入口--><!--一…

LeetCode简单题之合并两个链表

题目 给你两个链表 list1 和 list2 &#xff0c;它们包含的元素分别为 n 个和 m 个。 请你将 list1 中下标从 a 到 b 的全部节点都删除&#xff0c;并将list2 接在被删除节点的位置。 下图中蓝色边和节点展示了操作后的结果&#xff1a; 请你返回结果链表的头指针。 示例 1&…

npm 快速入门

目录一. 简介二. 作用1. 快速构建nodejs工程2. 快速安装和依赖第三方模块三. npm镜像加速四. 其他命令一. 简介 官方网站&#xff1a;https://www.npmjs.com/ NPM全称Node Package Manager&#xff0c;是Node.js包管理工具&#xff0c;是全球最大的模块生态系统&#xff0c;里…

数据结构之哈夫曼树和哈夫曼编码

切入正题之前&#xff0c;我们先了解几个概念&#xff1a; 路径&#xff1a;从树的一个结点到另一个结点分支所构成的路线路径长度&#xff1a;路径上的分支数目树的路径长度&#xff1a;从根结点出发到每个结点的路径长度之和带权路径长度&#xff1a;该结点到根结点的路径长…