100天精通Python(爬虫篇)——第122天:基于selenium接管已启动的浏览器(反反爬策略)

embedded/2025/3/30 3:53:58/

文章目录

  • 1、问题描述
  • 2、问题推测
  • 3、解决方法
  • 4、代码实战
    • 4.1 手动方法(手动打开浏览器输入账号密码)
    • 4.2 自动方法(.bat文件启动的浏览器)


1、问题描述


使用selenium自动化测试爬取pdd的时候,通过携带cookie登录或者控制selenium输入账号密码登录,都出现了:错误代码10001:请求异常请升级客户端后重新尝试


2、问题推测


这个错误的产生是由于pdd可以检测selenium自动化测试的脚本,因此可以阻止selenium的继续访问。现在大厂网站基本上都能检测到selenium脚本了。


3、解决方法


直接用selenium启动浏览器会被检测到,博主测试用selenium接管已经启动的浏览器就不会(原因:接管已经启动的浏览器所携带的浏览器指纹 ≈ 正常访问的浏览器指纹)


使用selenium自动启动浏览器和接管已启动的浏览器,在浏览器指纹方面存在一些区别。以下是详细的分析:

selenium_34">3.1 selenium自动启动浏览器

  1. 默认行为

    • selenium在自动启动浏览器时,通常会使用默认的配置和设置。
    • 浏览器会生成一个新的用户数据目录,这意味着它会创建一个全新的浏览器环境&#

http://www.ppmy.cn/embedded/176932.html

相关文章

docker-操作实战

前言 C镜像制作 因为我平常不用,所以不书写了 SpringBoot 微服务镜像制作 mkdir java ca java cp /data/maxhou/myapp/xxx.jar . vi Dockerfile FROM openjdk:8 COPY ./xxx.jar /app.jar CMD ["java","-jar","/app.jar"]COPY ./…

k8s中的认证授权

一 kubernetes API 访问控制 Authentication(认证) 认证方式现共有8种,可以启用一种或多种认证方式,只要有一种认证方式通过,就不再进行其它方式的认证。通常启用X509 Client Certs和Service Accout Tokens两种认证方式…

破解PDF转Word难题:如何选择高效、安全的转换工具?

破解PDF转Word难题:如何选择高效、安全的转换工具? 在当今的数字化工作环境中,PDF文件的使用无处不在。无论是合同、报告,还是学术论文、营销材料,PDF凭借其在不同设备上保持统一格式的优势,成为了许多场景…

msyql--基本操作之运维篇

检查 root 用户的权限 查看该用户针对这个数据库的权限 -- 如果在终端连接mysql时需要 mysql -u root -p -- 查看用户权限 SELECT user, host FROM mysql.user WHERE user root;可以看的出来root有他的访问权限,如过没有localhost或者% 说明没有访问权限 添加…

【微服务】SpringCloudGateway网关

目录 ✅需求的产生 ✅什么是网关? ✅快速入门 ✅创建新版块 ✅引入网关依赖 ✅编写启动类 ✅配置路由规则 ✅测试 ✅总结 ✅需求的产生 上篇文章 【SpringCloud】微服务的治理以及服务间的远程调用-CSDN博客 我们认识了什么是微服务以及微服务架构…

【vue】warning:Avoid mutating a prop directly

Avoid mutating a prop directly since the value will be overwritten whenever the parent component re-renders. Instead, use a data or computed property based on the prop’s value. Prop being mutated: “placement” 某天,发现项目中某个页面一直有这个…

【C++初阶】--- 类与对象(中)

1.类的默认成员函数 默认成员函数就是⽤⼾没有显式实现,编译器会⾃动⽣成的成员函数称为默认成员函数。⼀个类,我们不写的情况下编译器会默认⽣成以下6个默认成员函数,我们主要需要掌握前4个,后两个了解以下即可,默认…

【Go】Go语言并发模型:MPG

Go 语言并发模型:MPG Go 的并发模型主要由三个部分构成: M (Machine) 系统线程,用于实际执行任务。 P (Processor) 逻辑处理器,负责管理和调度 goroutine。每个 P 拥有一个本地队列和关联的全局 G 队列。 G (Goroutine) Go 语言…