Python使用Selenium库获取网页节点元素、名称、内容的方法

Python使用Selenium库获取网页节点元素、名称、内容的方法

news/2024/12/12 18:22:38/

我们要用到一些网页源码信息，例如获取一些节点的class内容，

除了使用Beautifulsoup来解析，还可以直接用Selenium库打印节点（元素）名称，用来获取元素的文本内容或者标签名。

例如获取下面的class的内容：

在这里插入图片描述

以下是几种常用的方法：

1.获取元素的属性值：
使用元素的 .get_attribute('attribute_name') 方法可以获取元素的特定属性值。例如，如果你想获取元素的 class 或 id：

python">element = driver.find_element(By.XPATH, "XXX")
class_name = element.get_attribute("class")
print(class_name)

这将打印出元素的 class 属性值。

在这里插入图片描述例如

python"> element= driver.find_element(By.XPATH,('//*[@id="app"]')) print(element.get_attribute("class"))#price_down blinkgreen

获取元素的文本内容：
使用元素的 .text 属性可以获取元素的文本内容。例如：

python">element = driver.find_element(By.XPATH, "XXX")
print(element.text)

这将打印出元素内部的文本。这种我们比较常见，例如下面获取4703这个数字：
在这里插入图片描述

获取元素的标签名：
使用元素的 .tag_name 属性可以获取元素的标签名。例如：
```
python">element = driver.find_element(By.XPATH, "XXX")
print(element.tag_name)
```
这将打印出元素的HTML标签名，如 div、span、input 等。

这种方法可以写判断节点结构。

http://www.ppmy.cn/news/1554562.html

相关文章

关于睡懒觉

关于睡懒觉

我们经常听到一个词：睡懒觉。我认为，睡懒觉这个词，是错误的。人，是需要睡眠的，睡不够，就不会醒。睡够了，自然会醒，也不想继续睡。不信你试试，睡够了，你…

阅读更多...

MMPano 部署笔记

MMPano 部署笔记

目录开源地址： 依赖项： 报错信息：pip list | grep habana-torch-plugin 检查版本代码： 解决方法不用 hpu： 依赖模型： 推理代码修改： 开源地址： https://github.com/IntelL…

阅读更多...

OpenAI直播发布第4天：ChatGPT Canvas全面升级，免费开放！

OpenAI直播发布第4天：ChatGPT Canvas全面升级，免费开放！

大家好，我是木易，一个持续关注AI领域的互联网技术产品经理，国内Top2本科，美国Top10 CS研究生，MBA。我坚信AI是普通人变强的“外挂”，专注于分享AI全维度知识，包括但不限于AI科普，AI工…

阅读更多...

【bug】python pandas KeyError: ‘index’

【bug】python pandas KeyError: ‘index’

【bug】python pandas KeyError: index’ 环境 pandas 2.2.3问题详情代码 import pandas as pd# 创建一个示例 DataFrame data {id: [1, 2, 3],name: [Alice, Bob, Charlie],age: [100, 200, 300] } df pd.DataFrame(data) # 这里的reset_index()用于将 Seri…

阅读更多...

关于网站的权重和百度蜘蛛爬虫的关系

关于网站的权重和百度蜘蛛爬虫的关系

网站的权重和百度蜘蛛爬虫的关系是密切关联的。网站权重是一个衡量网站在搜索引擎中重要性的概念，它反映了网站在搜索引擎算法中的相对重要程度。而百度蜘蛛爬虫则是百度搜索引擎用来抓取网页内容的工具，通过分析网页的URL、内容、链接等因素来评估网站…

阅读更多...

如何解决 docker 容器中 “-bash: ping: command not found” 错误？

如何解决 docker 容器中 “-bash: ping: command not found” 错误？

在 Docker 的世界里，遇到错误是学习曲线的一部分，其中一个常见的错误是： -bash: ping: command not found。当您在 Docker 容器中尝试使用 ping 命令来测试与其他网络机器或服务的连接，但该命令在您的容器环境中不可用时&#xff…

阅读更多...

VirtIO实现原理之数据结构与数据传输演示（3）

VirtIO实现原理之数据结构与数据传输演示（3）

接前一篇文章：VirtIO实现原理之数据结构与数据传输演示（2）本文内容参考： VirtIO实现原理——vring数据结构-CSDN博客 VirtIO实现原理——数据传输演示-CSDN博客特此致谢！一、数据结构总览 2. 相关数据结构前文书介绍了《Virtual I/O Device (VIRTIO) Versi

阅读更多...

selenium 截图报错

selenium 截图报错

UserWarning: name used for saved screenshot does not match file type. It should end with a .png extension 警告分析： 截图的名称与文件类型不匹配，screenshot()方法支持.png扩展名结尾，所以截图为.jpg扩展名的图片文件会报警告环境…

阅读更多...

最新文章