【python】网页批量转PDF

embedded/2025/2/24 14:30:18/

安装wkhtmltopdf 

网站:wkhtmltopdf

wkhtmltopdf http://www.baidu.com/ D:website1.pdf

安装pdfkit库

pip install pdfkit

批量转换代码

import os
import pdfkit
path_wkthmltopdf = r'E:\Program Files\wkhtmltopdf\bin\wkhtmltopdf.exe'
config = pdfkit.configuration(wkhtmltopdf=path_wkthmltopdf)def convert_html_to_pdf(input_folder, output_folder):# 确保输出文件夹存在if not os.path.exists(output_folder):os.makedirs(output_folder)# 遍历输入文件夹及其子文件夹中的所有文件for root, dirs, files in os.walk(input_folder):for file in files:if file.endswith(".htm"):html_file_path = os.path.join(root, file)pdf_file_path = os.path.join(output_folder, file.replace('.htm', '.pdf'))try:# 使用pdfkit将HTML文件转换为PDF文件pdfkit.from_file(html_file_path, pdf_file_path,configuration=config, options={'encoding': 'utf-8',"enable-local-file-access":True})print(f"成功转换: {html_file_path} -> {pdf_file_path}")except Exception as e:print(f"转换失败: {html_file_path} -> {pdf_file_path}, 错误信息: {e}")if __name__ == "__main__":input_folder = 'D:\'  # 输入文件夹路径,这里设置为当前目录output_folder = 'D:\pdf'  # 输出文件夹路径convert_html_to_pdf(input_folder, output_folder)

报错解决

Python OSError: wkhtmltopdf reported an error:Exit with code 1 due to network error:ProtocolUnknownE_exit with code 1 due to network error: protocolunk-CSDN博客

参考

pdfkit | 利用python实现html文件转pdf (zhihu.com)

Python OSError: wkhtmltopdf reported an error:Exit with code 1 due to network error:ProtocolUnknownE_exit with code 1 due to network error: protocolunk-CSDN博客


http://www.ppmy.cn/embedded/164841.html

相关文章

为 Power Automate 注册 Adobe PDF Services

前言 最近,再测试如何将HTML转换成PDF,然后发现Adobe有一个免费的操作可以用,好开心,赶紧注册一下。 正文 1.先注册一个账号,然后登录到Adobe Developer 注册链接:https://www.adobe.com/go/getstarted_pow…

<02.23>Leetcode100

class Solution {public String minWindow(String s, String t) {if (s.length() < t.length()) {return "";}HashMap<Character, Integer> count new HashMap<>();// 统计组成t字符串的每个字符数量// count[n]<0&#xff1a;滑动窗口缺少多少个…

计算机网络————(一)HTTP讲解

基础内容分类 从TCP/IP协议栈为依托&#xff0c;由上至下、从应用层到基础设施介绍协议。 1.应用层&#xff1a; HTTP/1.1 Websocket HTTP/2.0 2.应用层的安全基础设施 LTS/SSL 3.传输层 TCP 4.网络层及数据链路层 IP层和以太网 HTTP协议 网络页面形成基本 流程&#xff1a…

MinIO对象存储在Windows中的部署方法

本文介绍在Windows电脑中&#xff0c;下载、部署对象存储系统MinIO的方法。 MinIO是一个高性能的对象存储系统&#xff0c;它兼容亚马逊AWS S3 API接口&#xff0c;专为存储大规模数据而设计&#xff1b;其使用开源协议&#xff0c;能够提供与Amazon S3云存储相同的API接口&…

视频图像质量评价开源算法介绍【持续更新】

关于视频质量评价介绍的文章可以跳转到该博客 浏览。 PSNR/SSIM 简介:基于原始视频与处理后视频的像素级误差计算,衡量压缩或传输后的质量损失,属于全参考评价算法。集成该算法的开源项目: OpenCVFFmpegEvalvidIQAVAMF 简介:Netflix开源,融合VIF(视觉保真度)、DLM(细…

ubuntu ffmpeg 安装踩坑

ffmpeg 安装踩坑 安装命令: sudo apt update sudo apt install ffmpeg如果以上命令没有报错&#xff0c;那么恭喜你很幸运&#xff0c;可以关闭这篇文章了&#xff01; 如果跟我一样&#xff0c;遇到如下报错&#xff0c;可以接着往下看&#xff1a; 报错信息&#xff1a; …

@Autowired和 @Resource

@Autowired 和 @Resource 都是用于依赖注入的注解,但它们来自不同的框架,并且在行为和使用方式上有一些区别。以下是它们的详细比较: 1. 来源 @Autowired: 来自 Spring 框架。是 Spring 的核心注解之一。@Resource: 来自 Java 标准库(javax.annotation包)。是 JSR-250 规…

SQL笔记#复杂查询

一、视图 1、视图和表 使用试图时会执行SELECT语句并创建一张临时表。视图中保存的是SELECT语句&#xff1b;表中保存的是实际数据。 2、创建视图的方法 CREATE VIEW 视图名称(<视图列名1>&#xff0c;<视图列名2>&#xff0c;……) AS <SELECT语句> CREATE…