selenium自动化chrome

news/2025/3/19 11:11:36/
from selenium import webdriver
from selenium.common.exceptions import NoSuchElementException
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.options import Options
from fake_useragent import UserAgent# 启动 Chrome 浏览器
chrome_options = webdriver.ChromeOptions()
chrome_options.binary_location = r"C:\Program Files\Google\Chrome\Application\chrome.exe"
# chrome_options.add_argument("executable_path='C:\\Users\\wangkejun\\Downloads\\chromedriver-win64\\chromedriver.exe'")
chrome_options.add_argument('--disable-gpu')  # 禁用 GPU 加速
chrome_options.add_argument('--disable-images')  # 禁用图片加载
chrome_options.add_argument('--no-sandbox')  # 无沙盒模式
chrome_options.add_argument('disable-blink-features=AutomationControlled') #去掉webdriver痕迹
chrome_options.add_argument('--disable-javascript') # 禁用JavaScript
chrome_options.add_argument('-ignore-certificate-errors')#忽略证书错误
chrome_options.add_argument('-ignore -ssl-errors')    #忽略证书错误
chrome_options.add_argument('window-size=1377x768')#指定浏览器分辨率
chrome_options.add_argument('disable-infobars')# 隐藏Chrome正在受到自动软件的控制
chrome_options.add_experimental_option('excludeSwitches', ['enable-automation'])#设置开发者模式启动,该模式下webdriver属性为正常值# 生成随机的 User-Agent
user_agent = UserAgent().random
chrome_options.add_argument(f'user-agent="{user_agent}"')driver = webdriver.Chrome(options=chrome_options) # 执行 CDP 命令来修改 navigator.webdriver
script = """
Object.defineProperty(navigator, 'webdriver', {get: () => undefined
})
"""driver.execute_cdp_cmd("Page.addScriptToEvaluateOnNewDocument", {"source": script})
  1. chrome_options = webdriver.ChromeOptions() - 创建 Chrome 浏览器的选项对象。

  2. chrome_options.binary_location = r"C:\Program Files\Google\Chrome\Application\chrome.exe" - 指定 Chrome 浏览器的二进制文件路径。

  3. chrome_options.add_argument('--disable-gpu') - 禁用 GPU 加速,可以提高脚本在浏览器中的稳定性和性能。

  4. chrome_options.add_argument('--disable-images') - 禁用图片加载,可以加快页面加载速度。

  5. chrome_options.add_argument('--no-sandbox') - 在无沙盒模式下运行 Chrome 浏览器,可以解决某些特定环境下的问题。

  6. user_agent = UserAgent().random - 生成随机的 User-Agent,用于伪装浏览器身份。

  7. chrome_options.add_argument(f'user-agent="{user_agent}"') - 将生成的随机 User-Agent 添加到 Chrome 浏览器选项中。

  8. driver = webdriver.Chrome(options=chrome_options) - 使用指定的选项启动 Chrome 浏览器。

  9. script = """ ... """ - 定义一个 JavaScript 脚本,用于修改 navigator.webdriver 属性。

  10. driver.execute_cdp_cmd("Page.addScriptToEvaluateOnNewDocument", {"source": script}) - 使用 Chrome DevTools Protocol (CDP) 的命令,在每个新页面加载时执行指定的 JavaScript 脚本,从而修改 navigator.webdriver 属性。这可以用于绕过一些反爬虫机制。


http://www.ppmy.cn/news/1098150.html

相关文章

const的值可不可以被更改

总结: 当const定义的常量是基本数据类型的时候不可以被更改 当const定义的常量是基本数据类型的时候不可以被更改 const定义的常量实际上是栈内存地址中的保存的值,const常量的值不可以被更改就是栈内存中保存的数据不可以被更改。基本数据类型直接存储在…

2023高教社杯数学建模B题思路代码 - 多波束测线问题

# 1 赛题 B 题 多波束测线问题 单波束测深是利用声波在水中的传播特性来测量水体深度的技术。声波在均匀介质中作匀 速直线传播, 在不同界面上产生反射, 利用这一原理,从测量船换能器垂直向海底发射声波信 号,并记录从声波发射到…

『SpringBoot 源码分析』run() 方法执行流程:(3)刷新应用上下文-处理 @ComponentScan 注解

『SpringBoot 源码分析』run() 方法执行流程:(3)刷新应用上下文-处理 ComponentScan 注解 基于 2.2.9.RELEASE问题:当方法进行了注释标记之后,springboot 又是怎么注入到容器中并创建类呢? 首先创建测试主…

Eviews用向量自回归模型VAR实证分析公路交通通车里程与经济发展GDP协整关系时间序列数据和脉冲响应可视化...

全文下载链接:http://tecdat.cn/?p27784 河源市是国务院1988年1月7日批准设立的地级市,为了深入研究河源市公路交通与经济发展的关系,本文选取了1988-2014年河源市建市以来24年的地区生产总值(GDP)和公路通…

window和linux下载ffmpeg

window 进入官方 进入 download 页面并选择 window 版本 下载 zip 压缩包 解压压缩包 解压压缩包之后,在 bin 目录下有三个文件,我们要下载的 window 版 ffmpeg.exe 就在其中,后续你可以添加系统环境变量或者在每次执行 ffmpeg.exe 都带上路…

春秋云镜 CVE-2017-1000480

春秋云镜 CVE-2017-1000480 Smarty < 3.1.32 PHP代码执行漏洞 靶标介绍 3.1.32 之前的 Smarty 3 在未清理模板名称的自定义资源上调用 fetch() 或 display() 函数时容易受到 PHP 代码注入的影响。 启动场景 漏洞利用 poc /index.php?eval*/phpinfo();/*/index.php?ev…

【MongoDB】Ubuntu22.04 下安装 MongoDB | 用户权限认证 | skynet.db.mongo 模块使用

文章目录 Ubuntu 22.04 安装 MongoDB后台启动 MongoDBshell 连入 MongoDB 服务 MongoDB 用户权限认证创建 root 用户开启认证重启 MongoDB 服务创建其他用户查看用户信息验证用户权限删除用户 skynet.db.mongo 模块使用authensureIndexfind、findOneinsert、safe_insertdelete、…

macOS Ventura 13.5.2(22G91)发布,附黑/白苹果镜像下载地址

系统介绍&#xff08;下载请百度搜索&#xff1a;黑果魏叔&#xff09; 黑果魏叔 9 月 8 日消息&#xff0c;苹果今日向 Mac 电脑用户推送了 macOS 13.5.2 更新&#xff08;内部版本号&#xff1a;22G91&#xff09;&#xff0c;本次更新距离上次发布隔了 21 天。 本次更新查…