Python爬虫(2)-Selenium控制浏览器

news/2024/12/5 0:39:39/

在这里插入图片描述
Selenium中提供了不少的方法来操作浏览器

Selenium控制浏览器

  • 1.打开浏览器
  • 2.打开浏览器后可以控制浏览器前进和后退就使用
  • 3.浏览器刷新
  • 4.浏览器切换网页窗口
  • 5.关闭页面和退出浏览器
  • 6.设置窗口大小
  • 7.获取窗口位置
  • 8.最大化窗口
  • 9.最小化窗口
  • 11.无窗口运行
  • 10.全屏
  • 11.屏幕截图
  • 12.元素截图

1.打开浏览器

使用driver.get(‘网址’)的方式来打开浏览器

from selenium import webdriver
from selenium.webdriver import Chrome, ChromeOptions
from selenium.webdriver.common.by import By
opt = ChromeOptions()            # 创建Chrome参数对象
opt.headless = True              # 把Chrome设置成可视化无界面模式,windows/Linux 皆可
driver = webdriver.Chrome()# Chrome浏览器
driver.get("网址")

2.打开浏览器后可以控制浏览器前进和后退就使用

driver.back()#后退
driver.forward()#前进

3.浏览器刷新

driver.refresh()

4.浏览器切换网页窗口

浏览器切换标签的方法就是,

driver.current_window_handle

用selenium点击新打开了一个网页,需要告知selenium目前这个窗口是新的窗口,那么它才能早新的页面进行操作不然的话就无法操作。

from selenium import webdriver
from selenium.webdriver import Chrome, ChromeOptions
from selenium.webdriver.common.by import By
from selenium.webdriver.support import wait, expected_conditions
from selenium import webdriverdriver = webdriver.Chrome()driver.get("https://so.csdn.net/so/search?spm=1000.2115.3001.7499&q=%E6%95%B0%E6%8D%AE%E5%BA%93%E8%AF%BE%E7%A8%8B%E8%AE%BE%E8%AE%A1&t=&u=")
driver.refresh()
driver.implicitly_wait(5)
driver.find_element(By.XPATH,'//*[@id="search"]').click()
driver.switch_to.window(driver.window_handles[-1])#表示新的窗口
f1=driver.find_element(By.CSS_SELECTOR,'div.item-hd em').text
print(f1)

在这里插入图片描述
如果只是在页面进行标签操作的话可以用tab切换到新的标签页而不用切换窗口
# 打开新标签页并切换到新标签页
driver.switch_to.new_window(‘tab’)

5.关闭页面和退出浏览器

操作完毕退出页面是

driver.close()

操作完毕退出浏览器是

driver.quit()

6.设置窗口大小

driver.set_window_size(1920,1080)

7.获取窗口位置

x = driver.get_window_position().get(‘x’)
y = driver.get_window_position().get(‘y’)

from selenium import webdriverdriver = webdriver.Chrome()driver.get("https://so.csdn.net/so/search?spm=1000.2115.3001.7499&q=%E6%95%B0%E6%8D%AE%E5%BA%93%E8%AF%BE%E7%A8%8B%E8%AE%BE%E8%AE%A1&t=&u=")# 分别获取每个尺寸
x = driver.get_window_position().get('x')
y = driver.get_window_position().get('y')
print(x,y)

在这里插入图片描述

8.最大化窗口

driver.maximize_window()

9.最小化窗口

driver.minimize_window()

11.无窗口运行

opt = ChromeOptions() # 创建Chrome参数对象
opt.headless = True # 把Chrome设置成可视化无界面模式,windows/Linux 皆可
driver = Chrome(options=opt) # 创建Chrome无界面对象

from selenium import webdriver
from selenium.webdriver import Chrome, ChromeOptions
from selenium.webdriver.common.by import By
from selenium.webdriver.support import wait, expected_conditions
from selenium import webdriver
opt = ChromeOptions()            # 创建Chrome参数对象
opt.headless = True              # 把Chrome设置成可视化无界面模式,windows/Linux 皆可
driver = Chrome(options=opt)     # 创建Chrome无界面对象driver.get("https://so.csdn.net/so/search?spm=1000.2115.3001.7499&q=%E6%95%B0%E6%8D%AE%E5%BA%93%E8%AF%BE%E7%A8%8B%E8%AE%BE%E8%AE%A1&t=&u=")
driver.refresh()
driver.implicitly_wait(5)
fx=driver.window_handles
print(fx)
driver.find_element(By.XPATH,'//*[@id="search"]').click()
driver.switch_to.window(driver.window_handles[-1])
f1=driver.find_element(By.CSS_SELECTOR,'div.item-hd em').text
print(f1)

10.全屏

driver.fullscreen_window()

11.屏幕截图

driver.save_screenshot(‘./1.png’)

from selenium import webdriver
from selenium.webdriver import Chrome, ChromeOptions
from selenium.webdriver.common.by import By
from selenium.webdriver.support import wait, expected_conditions
from selenium import webdriver
driver = webdriver.Chrome()driver.get("https://so.csdn.net/so/search?spm=1000.2115.3001.7499&q=%E6%95%B0%E6%8D%AE%E5%BA%93%E8%AF%BE%E7%A8%8B%E8%AE%BE%E8%AE%A1&t=&u=")
driver.refresh()
driver.implicitly_wait(5)
driver.find_element(By.XPATH,'//*[@id="search"]').click()
driver.switch_to.window(driver.window_handles[-1])
f1=driver.find_element(By.CSS_SELECTOR,'div.item-hd em').text
driver.save_screenshot('./1.png')
print(f1)

在这里插入图片描述

12.元素截图

元素截图只是针对这个元素进行截图,但是这种截图只能是一个大概的范围精准度就不太太好。

f1.screenshot(‘./2.png’)

from selenium.webdriver.common.by import By
from selenium import webdriver
driver = webdriver.Chrome()driver.get("https://so.csdn.net/so/search?spm=1001.2101.3001.4498&q=XPATH%E5%AE%9A%E4%BD%8D&t=&u=&s=hot")
f1=driver.find_element(By.CSS_SELECTOR,'div.search-box')
f1.screenshot('./2.png')
driver.quit()

在这里插入图片描述

在这里插入图片描述


http://www.ppmy.cn/news/20294.html

相关文章

一名普通22届本科毕业生|前端程序员|22年年终总结

文章目录22年上半年:最后的学生时光隔离实习币基金迷茫困惑难受不要去想人生意义读书景点环境的力量再次隔离返校入职前的学习22年下半年:上班工作生活总结本来准备在22年年末写的,奈何那段时间工作太忙没抽出时间。现在是23年的1月27日&…

创建大量TCP连接时会受到什么因素的限制?

1.文件描述符资源 用户级限制 我们可以使用ulimit命令查看系统允许当前用户进程打开的文件数限制: ulimit -n 我们可以使用 ulimit -n 文件数 来修改不过这种设置是临时的,只在当前的session中有效。为永久修改用户级文件描述符数限制,可以…

网站如何进行整站优化?

如果要做优化或者选择性优化,一定要区分关键词优化和全站优化,米贸搜整理如下,希望可以帮助到你:一、全站优化的概念:1.一般认为,全站点优化是指通过SEO技术,使其网站成为搜索引擎中的权威站点。当达到效果…

【c语言进阶】动态内存管理知识大全(下)

🚀write in front🚀 📜所属专栏c语言学习 🛰️博客主页:睿睿的博客主页 🛰️代码仓库:🎉VS2022_C语言仓库 🎡您的点赞、关注、收藏、评论,是对我最大的激励和…

小米万兆路由器里的Docker安装Alist

小米2022年12月份发布了万兆路由器,里面可以使用Docker。 今天尝试在小米的万兆路由器里安装Alist v3.9.2。 准备工作 请参考https://engchina.blog.csdn.net/article/details/128515422的准备工作。 创建存储 在第三方管理(SimpleDocker),单击"…

TOGAF基础级L1试题答案及解析(三)

【单选题】101 下列哪个TOGAF组件的创建,使架构师设计架构解决边界信息流? A. 架构信息库 B. 企业连续 C. 综合信息基础架构模型 D. TOGAF技术参考模型 【参考解析】 无 【正确答案】:C. 综合信息基础架构模型

无穷小的比较——“高等数学”

各位CSDN的uu们你们好呀,今天小雅兰的内容是无穷小的比较,下面,就让我们一起进入高等数学的世界吧 回顾 定义 性质 定理 定理1: 定理2:等价无穷小替换定理 常用的等价无穷小 例题 小结 回顾 两个无穷小的商当然不一定还…

油井远程监控解决方案

1.项目背景 油田生产过程中,由于井筒内存在着不同程度的缺陷,会产生各种问题。而油井开采设备的连续稳定运行是保证石油开采的首要条件,但是由于油田地域广阔,油井分布广泛,没有规则性的油井工作状况的监测和控制&…