cs*n 网页内容转为html 加入 onenote

news/2025/2/21 7:56:28/

csdn上有好用的内容,我们怎么将它们加到 onenote 里吃灰呢。

html_2">一、创建 新html

create_html.py

import sysdef create_html_file(filename):# 检查是否提供了文件名if not filename:print("请提供HTML文件名")return# 创建HTML内容html_content = f"""<!DOCTYPE html>
<html lang="zh-CN">
<head><meta charset="UTF-8"><meta name="viewport" content="width=device-width, initial-scale=1.0"><title>{filename}</title>
</head>
<body>
</body>
</html>
"""# 写入文件with open(filename, 'w', encoding='utf-8') as file:file.write(html_content)print(f"文件 {filename} 已创建")if __name__ == "__main__":if len(sys.argv) != 2:print("用法: python create_html.py <html文件名>")else:create_html_file(sys.argv[1])

使用命令 创建html
在这里插入图片描述

二、网页找内容

在这里插入图片描述
content_views 里就是真正内容了。
copy-> copy outerhtml
粘贴到 创建的html 的 body 中。

三、替换内容

modify_html.py

import sys
import os
from bs4 import BeautifulSoupdef modify_html_file(filename):# 检查是否提供了文件名if not filename:print("请提供HTML文件名")return# 查找当前目录下的HTML文件if not os.path.exists(filename):print(f"文件 {filename} 不存在")return# 读取HTML内容with open(filename, 'r', encoding='utf-8') as file:html_content = file.read()# 使用BeautifulSoup解析HTMLsoup = BeautifulSoup(html_content, 'html.parser')# 替换指定的divdivs_to_remove = soup.find_all('div', class_='hljs-button {2}')for div in divs_to_remove:new_tag = soup.new_tag('p')  # 创建一个新的标签new_tag.string = "----------------------------------------------------------------------------------------------------------------"div.replace_with(new_tag)  # 替换原标签# 替换指定的divdivs_to_remove = soup.find_all('div', class_='hide-preCode-box')for div in divs_to_remove:# 在原位置添加“------------------”new_tag = soup.new_tag('p')  # 创建一个新的标签new_tag.string = "----------------------------------------------------------------------------------------------------------------"div.replace_with(new_tag)  # 替换原标签# 删除指定的ululs_to_remove = soup.find_all('ul', class_='pre-numbering')for ul in uls_to_remove:ul.decompose()# 写回修改后的HTML内容with open(filename, 'w', encoding='utf-8') as file:file.write(str(soup))print(f"文件 {filename} 已修改")if __name__ == "__main__":if len(sys.argv) != 2:print("用法: python modify_html.py <html文件名>")else:modify_html_file(sys.argv[1])

因为拷贝的 html 有以下内容
在这里插入图片描述
太不美观了,要把它们删除掉

在这里插入图片描述
再打开就好看多了
在这里插入图片描述
现在 html 的内容也可以直接复制到 onenote 里吃灰了


http://www.ppmy.cn/news/1573382.html

相关文章

Python 日志记录全解析:从入门到进阶的实用指南

本文全面深入地介绍了 Python 的日志记录功能&#xff0c;从基础概念、何时使用日志&#xff0c;到如何进行基础日志操作&#xff08;如记录到文件、记录变量数据、更改消息格式等&#xff09;&#xff0c;再到进阶的日志组件&#xff08;记录器、处理器、过滤器和格式器&#…

Django 美化使用ModelForm的输入框

在初次使用ModelForm时&#xff0c;我的html文件代码如下&#xff0c;主要内容是显示一个卡片式表单&#xff0c;通过循环遍历 form 对象动态生成表单字段 {% extends layout.html %}{% block content %} <div class"container"><div class"c1"&g…

数据结构之BST、AVL、红黑树、哈夫曼树与B族树

数据结构之BST、AVL、红黑树、哈夫曼树与B族树 数据结构之BST、AVL、红黑树、哈夫曼树与B族树一、二叉搜索树&#xff08;Binary Search Tree, BST&#xff09;1. 什么是二叉搜索树&#xff1f;重要性质 2. 二叉搜索树实现1. 节点结构定义2. 核心操作接口3. 插入算法实现4. 删除…

二、几何体BufferGeometry顶点笔记

一、几何体顶点位置数据和点模型 1、缓冲类型几何体BufferGeometry threejs的长方体BoxGeometry、球体SphereGeometry等几何体都是基于BufferGeometry类构建的&#xff0c;BufferGeometry是一个没有任何形状的空几何体&#xff0c;你可以通过BufferGeometry自定义任何几何形状…

C语言之easyX

目录 概要 easyX整体架构 图形绘制 画布宽高 圆形 图片的贴图 加载图像 游戏框架 概要 easyX是一个轻量级的图形库&#xff0c;用于在Windows平台上进行简单的2D图形绘制。它提供了一组简单易用的函数&#xff0c;可以方便地绘制基本的图形元素&#xff0c;如线条、矩形、圆形…

.Net9.0访问MSSQL数据库读取表中数据行

1.表结构与表中数据 查询记录语句&#xff1a; SELECT TOP (1000) [StatusName],[StatusValue],[StatusString],[StatusTip],[StatusDescription],[SortID]FROM [WHQJAccountsDB].[dbo].[SystemStatusInfo] 查询总记录数语句&#xff1a; select count(SortID) as row_count f…

Ubuntu下mysql主从复制搭建

本文介绍mysql 8.4主从集群的搭建&#xff0c;从单个机器安装到集群的配置&#xff0c;整体走了一遍&#xff0c;希望对大家有帮助。mysql 8.4和之前的版本命令上有些变化&#xff0c;大家用来参考。 0、环境 ubuntu&#xff1a; 22.04mysql&#xff1a;8.4 1、安装mysql 1…

2025年AI免费大战:从DeepSeek到GPT-5的商业逻辑与行业变革

引言&#xff1a;人工智能行业的2025年重大转折 2025年伊始&#xff0c;人工智能行业的竞争格局发生了深刻变化&#xff0c;尤其是以DeepSeek为代表的新兴力量&#xff0c;通过低成本开源策略迅速崛起&#xff0c;迫使OpenAI、百度文心一言等人工智能巨头纷纷调整策略&#xf…