Python使用Selenium库获取 网页节点元素、名称、内容的方法

news/2024/12/12 18:22:38/

我们要用到一些网页源码信息,例如获取一些节点的class内容,

除了使用Beautifulsoup来解析,还可以直接用Selenium库打印节点(元素)名称,用来获取元素的文本内容或者标签名。

例如获取下面的class的内容:

在这里插入图片描述

以下是几种常用的方法:

1.获取元素的属性值
使用元素的 .get_attribute('attribute_name') 方法可以获取元素的特定属性值。例如,如果你想获取元素的 classid

python">element = driver.find_element(By.XPATH, "XXX")
class_name = element.get_attribute("class")
print(class_name)

这将打印出元素的 class 属性值。

在这里插入图片描述例如

python"> element= driver.find_element(By.XPATH,('//*[@id="app"]')) print(element.get_attribute("class"))#price_down blinkgreen
  1. 获取元素的文本内容
    使用元素的 .text 属性可以获取元素的文本内容。例如:
python">element = driver.find_element(By.XPATH, "XXX")
print(element.text)

这将打印出元素内部的文本。这种我们比较常见,例如下面获取4703这个数字:
在这里插入图片描述

  1. 获取元素的标签名
    使用元素的 .tag_name 属性可以获取元素的标签名。例如:

    python">element = driver.find_element(By.XPATH, "XXX")
    print(element.tag_name)
    

    这将打印出元素的HTML标签名,如 divspaninput 等。

    这种方法可以写判断节点结构。


http://www.ppmy.cn/news/1554562.html

相关文章

关于睡懒觉

我们经常听到一个词:睡懒觉。 我认为,睡懒觉这个词,是错误的。 人,是需要睡眠的,睡不够,就不会醒。睡够了,自然会醒,也不想继续睡。不信你试试,睡够了,你…

MMPano 部署笔记

目录 开源地址: 依赖项: 报错信息:pip list | grep habana-torch-plugin 检查版本代码: 解决方法 不用 hpu: 依赖模型: 推理代码修改: 开源地址: https://github.com/IntelL…

OpenAI直播发布第4天:ChatGPT Canvas全面升级,免费开放!

大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,专注于分享AI全维度知识,包括但不限于AI科普,AI工…

【bug】python pandas KeyError: ‘index’

【bug】python pandas KeyError: index’ 环境 pandas 2.2.3问题详情 代码 import pandas as pd# 创建一个示例 DataFrame data {id: [1, 2, 3],name: [Alice, Bob, Charlie],age: [100, 200, 300] } df pd.DataFrame(data) # 这里的reset_index()用于将 Seri…

关于网站的权重和百度蜘蛛爬虫的关系

网站的权重和百度蜘蛛爬虫的关系是密切关联的。 网站权重是一个衡量网站在搜索引擎中重要性的概念,它反映了网站在搜索引擎算法中的相对重要程度。而百度蜘蛛爬虫则是百度搜索引擎用来抓取网页内容的工具,通过分析网页的URL、内容、链接等因素来评估网站…

如何解决 docker 容器中 “-bash: ping: command not found” 错误 ?

在 Docker 的世界里,遇到错误是学习曲线的一部分,其中一个常见的错误是: -bash: ping: command not found。当您在 Docker 容器中尝试使用 ping 命令来测试与其他网络机器或服务的连接,但该命令在您的容器环境中不可用时&#xff…

VirtIO实现原理之数据结构与数据传输演示(3)

接前一篇文章:VirtIO实现原理之数据结构与数据传输演示(2) 本文内容参考: VirtIO实现原理——vring数据结构-CSDN博客 VirtIO实现原理——数据传输演示-CSDN博客 特此致谢! 一、数据结构总览 2. 相关数据结构 前文书介绍了《Virtual I/O Device (VIRTIO) Versi

selenium 截图报错

UserWarning: name used for saved screenshot does not match file type. It should end with a .png extension 警告分析: 截图的名称与文件类型不匹配,screenshot()方法支持.png扩展名结尾,所以截图为.jpg扩展名的图片文件会报警告 环境…