python is beautiful_python BeautifulSoup基本用法

news/2024/12/22 22:11:00/

#coding:utf-8

importosfrom bs4 importBeautifulSoup#jsp 路径

folderPath = "E:/whm/google/src_jsp"

for dirPath,dirNames,fileNames inos.walk(folderPath):for fileName infileNames:if fileName.endswith(".jsp"):

soup=BeautifulSoup(open(os.path.join(dirPath,fileName)),"html.parser")if(soup.header is notNone):

soup.header.extract()#属性选择器。。。只能选择出第一个符合规则的元素

if(soup.find(attrs={‘role‘:‘banner‘}) is notNone):

soup.find(attrs={‘role‘:‘banner‘}).extract()if(soup.find(attrs={‘class‘:"col-xs-3"}) is notNone):

soup.find(attrs={‘class‘:"col-xs-3"}).extract()

with open(os.path.join(dirPath,fileName),"w+") as file:#pretify()方法返回一个美化过的html 字符串 encode(‘utf-8‘)指定编码--

file.write(soup.prettify(formatter=None).encode(‘utf-8‘))


http://www.ppmy.cn/news/621363.html

相关文章

hadoop组件---面向列的开源数据库(九)--python--python使用thrift连接hbase

Python使用thrift操作HBase thrift支持多种语言进行连接使用,但是没找到linux中的cli操作命令行的形式。所以如果服务器有python环境的话,可以使用python进行连接,快速测试。 确认hbase和thrift服务已经安装,启动 相关hbase和thrift的安装,启动参考 注意:我这里使用的…

javascript switch-case-default结构和循环结构

文章目录 一、switch-case-default结构执行流程: 二、循环结构1.while循环:执行流程:当条件成立时,执行循环体;当条件不成立时,退出循环, 继续执行循环后面的语句。 分析变量i的作用&#xff1a…

linux 命令usage约定

看到网上对 linux命令usage中尖括号的两种说法 1、尖括号<>&#xff1a;表示必选参数&#xff0c;不能忽略&#xff0c;且尖括号里的输入只能是指定的option&#xff0c;使用时没有尖括号。 2、尖括号<>表示其中的字符串并不是真正的选项或参数&#xff0c;你需要…

linux命令之pip命令

一、命令简介 pip 是 Python 包管理工具&#xff0c;该工具提供了对Python 包的查找、下载、安装、卸载的功能。目前如果你在 python.org 下载最新版本的安装包&#xff0c;则是已经自带了该工具。Python 2.7.9 或 Python 3.4 以上版本都自带 pip 工具。 二、pip命令安装 早…

c语言的编程switch,C语言之switch详解

一 switch的语法 switch(表达式){case 常量表达式1: 代码块1 break; case 常量表达式2: 代码块2 break; case 常量表达式3: 代码块3 break; ....... default: 代码块n; break; } 语义:根据表达式的结果,直接跳转到与之对应的常量表达式1的代码块里去执行,如果常量表达式都没…

vlan的基本指令_VLAN的基本配置命令

VLAN的基本配置 创建vlan方法一 switch#vlan database switch(vlan)#vlan 10 name mahaobin switch(vlan)#exit 创建vlan方法二 switch(config)#vlan 10 switch(config-vlan)#name mahaobin 删除vlan方法一 switch(vlan)#no vlan 10 switch(vlan)#exit 删除vlan方法二 switch(c…

硬件 - high side switch 高边开关

假设图中开关K1&#xff0c;K2都是MOSFET开关&#xff0c;那么&#xff0c;K1称为高边开关&#xff1b;K2称为低边开关。 MOSFET的输出端接在负载的叫高边开关,MOSFET的输出端接在地的叫低边开关,高边开关驱动复杂一点,低边开关成本低点.高边开关布线成本低.各有利弊.

pip了解

文章目录 一、pip是什么二、pip的使用 一、pip是什么 pip是Python的包安装程序也可以说pip是Python标准库的一个包&#xff0c;只不过这个包可以管理Python标准库之中其它的包pip 是一个命令行程序。 安装 pip 后&#xff0c;会向系统添加一个 pip 命令&#xff0c;该命令可以…