Python使用Selenium库获取 网页节点元素、名称、内容的方法

server/2024/12/16 9:11:24/

我们要用到一些网页源码信息,例如获取一些节点的class内容,

除了使用Beautifulsoup来解析,还可以直接用Selenium库打印节点(元素)名称,用来获取元素的文本内容或者标签名。

例如获取下面的class的内容:

在这里插入图片描述

以下是几种常用的方法:

1.获取元素的属性值
使用元素的 .get_attribute('attribute_name') 方法可以获取元素的特定属性值。例如,如果你想获取元素的 classid

python">element = driver.find_element(By.XPATH, "XXX")
class_name = element.get_attribute("class")
print(class_name)

这将打印出元素的 class 属性值。

在这里插入图片描述例如

python"> element= driver.find_element(By.XPATH,('//*[@id="app"]')) print(element.get_attribute("class"))#price_down blinkgreen
  1. 获取元素的文本内容
    使用元素的 .text 属性可以获取元素的文本内容。例如:
python">element = driver.find_element(By.XPATH, "XXX")
print(element.text)

这将打印出元素内部的文本。这种我们比较常见,例如下面获取4703这个数字:
在这里插入图片描述

  1. 获取元素的标签名
    使用元素的 .tag_name 属性可以获取元素的标签名。例如:

    python">element = driver.find_element(By.XPATH, "XXX")
    print(element.tag_name)
    

    这将打印出元素的HTML标签名,如 divspaninput 等。

    这种方法可以写判断节点结构。


http://www.ppmy.cn/server/150586.html

相关文章

【前端 Uniapp】使用Vant打造Uniapp项目(避坑版)

一、基本介绍 Uniapp 是基于 Vue.js 的开发框架,通过一套代码可以同时发布到多个平台的应用框架。而 Vant 是针对移动端 Vue.js 的组件库。通过这样的组合,我们可以快速构建出一个跨平台的移动应用。Vant 已经支持多种小程序和 H5 平台,也对…

[ClickHouse 运维系列] 数据 TTL 学习笔记整理

一、clickhouse TTL ClickHouse的MergeTree引擎支持数据生命周期管理,即TTL(Time To Live)。TTL可以通过设置列字段或整张表的过期时间来实现。列字段的TTL会在时间到期时删除该列数据,而表级别的TTL会删除整张表的数据。如果同…

树控件、下拉框、文本框常用测试用例

🍅 点击文末小卡片,免费获取软件测试全套资料,资料在手,涨薪更快 1、控件的测试外观操作 1)项目中的所有树是否风格一致 2)树结构的默认状态是怎样的。比如默认树是否是展开,是展开几级&#…

在 Ubuntu 下通过 Docker 部署 Samba 服务器

Samba 是一个开源软件套件,允许在 Linux 和 Windows 之间共享文件和打印机。它实现了 SMB/CIFS 协议,使得不同操作系统之间的互操作性变得简单高效。Docker 是一个流行的容器化平台,可以快速打包、分发和管理应用程序。通过 Docker 部署 Samb…

米哈游C++开发精选60道面试题及参考答案

C++ 面向对象的三个特征 封装是把数据和操作数据的函数捆绑在一起,并且对数据的访问进行限制。这样做的好处是可以隐藏对象的内部实现细节,只暴露必要的接口给外部。例如,在一个银行账户类中,账户余额这个数据成员是被封装起来的,外部不能直接访问和修改,而是通过存款、取…

zookeeper 使用 简介 curator 的使用

自定义 RPC 注册中心选型 新时代的 RPC 技术已经不单单的是满足于简单的远程服务调用,也不满足仅仅是对协议,序列化,网络通讯,STUB的这系列的技术的封装和优化。现在的新的技术也会对注册中心,负载均衡的封装,引入了 SOA 的相关架构,例如 GRPC。引入 nameming 的 provi…

2024告别培训班 数通、安全、云计算、云服务、存储、软考等1000G资源分享

大类有:软考初级 软考中级 软考高级 华为认证 华三认证: 软考初级: 信息处理技术员 程序员 网络管理员 软考中级: 信息安全工程师 信息系统监理师 信息系统管理工程师 嵌入式系统设计时 数据库系统工程师 电子商务设…

快速进行tmux及vim配置,打造终端IDE

代理配置 IP"192.168.X.X" PORT"XX" export http_proxy"http://$IP:$PORT" export https_proxy"http://$IP:$PORT"关于tmux部分的快速配置使用 yum install -y tmux git config --global http.sslverify false git clone https://gi…