100天精通Python(爬虫篇)——第122天:基于selenium接管已启动的浏览器(反反爬策略)

devtools/2025/3/26 10:07:23/

文章目录

  • 1、问题描述
  • 2、问题推测
  • 3、解决方法
  • 4、代码实战
    • 4.1 手动方法(手动打开浏览器输入账号密码)
    • 4.2 自动方法(.bat文件启动的浏览器)


1、问题描述


使用selenium自动化测试爬取pdd的时候,通过携带cookie登录或者控制selenium输入账号密码登录,都出现了:错误代码10001:请求异常请升级客户端后重新尝试


2、问题推测


这个错误的产生是由于pdd可以检测selenium自动化测试的脚本,因此可以阻止selenium的继续访问。现在大厂网站基本上都能检测到selenium脚本了。


3、解决方法


直接用selenium启动浏览器会被检测到,博主测试用selenium接管已经启动的浏览器就不会(原因:接管已经启动的浏览器所携带的浏览器指纹 ≈ 正常访问的浏览器指纹)


使用selenium自动启动浏览器和接管已启动的浏览器,在浏览器指纹方面存在一些区别。以下是详细的分析:

selenium_34">3.1 selenium自动启动浏览器

  1. 默认行为

    • selenium在自动启动浏览器时,通常会使用默认的配置和设置。
    • 浏览器会生成一个新的用户数据目录,这意味着它会创建一个全新的浏览器环境&#

http://www.ppmy.cn/devtools/171320.html

相关文章

Android 12.0 WiFi连接默认设置静态IP地址功能实现

1.前言 在12.0的系统rom定制化开发中,在定制化某些功能开发中,在wifi模块中,有产品需要要求设置wifi静态ip功能,而系统中wifi连接 后ip是动态的,每次开机后 连接wifi的ip就是不固定的,所以产品需要采用固定ip,就需要实现静态ip功能 2.WiFi连接默认设置静态IP地址功能实…

专题|Python贝叶斯网络BN动态推理因果建模:MLE/Bayes、有向无环图DAG可视化分析呼吸疾病、汽车效能数据2实例合集

原文链接:https://tecdat.cn/?p41199 作为数据科学家,我们始终在探索能够有效处理复杂系统不确定性的建模工具。本专题合集系统性地解构了贝叶斯网络(BN)这一概率图模型在当代数据分析中的创新应用,通过开源工具bnlea…

C++ 性能优化隐藏陷阱:从系统调用到并发开销的深度反思

作为一名C++技术专家,我深知性能优化不仅是代码层面的艺术,更是理解硬件与语言交互的科学。在现代计算中,C++的抽象为开发者提供了便利,却也隐藏了硬件的复杂性。如何揭开这些“谎言”,让代码与硬件协同工作?本文将以小案例为载体,通过优化前后的对比,深入剖析每个章节…

小程序跳转到h5页面

本组件使用useState、WebView、Taro的钩子,以及taro-hooks中的useRouter。组件内部使用了useRouter获取路由信息,从存储中获取openId和TOKEN,然后通过useReady生命周期钩子设置URL。分享功能部分使用useShareAppMessage处理,构建分…

怎么绑定一个计算属性或数据属性来控制元素的类名

在 Vue 中,你可以通过绑定计算属性或数据属性来控制元素的类名,这样能避免直接操作 DOM,符合 Vue 的响应式原理。下面分别介绍如何使用计算属性和数据属性来控制类名。 使用计算属性控制类名 使用计算属性控制类名 计算属性是基于响应式依赖进…

基于SpringBoot的电影售票系统

作者:计算机学姐 开发技术:SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等,“文末源码”。 专栏推荐:前后端分离项目源码、SpringBoot项目源码、Vue项目源码、SSM项目源码、微信小程序源码 精品专栏:…

用Deepseek + Kimi 快速生成高质量的ppt

AI系列文章: AWS AI认证考试中经常提及几个重要的工具介绍 简单理解机器学习中top_k、top_p、temperature三个参数的作用 用Deepseek Kimi 快速生成高质量的ppt 在职场,不管干什么,都少不了和 PPT 打交道:客户交流&#xff0c…

linux-------------进程概念(中)

1.进程状态 为了弄明⽩正在运⾏的进程是什么意思,我们需要知道进程的不同状态。⼀个进程可以有⼏个状 态(在Linux内核⾥,进程有时候也叫做任务)。 下⾯的状态在kernel源代码⾥定义: static const char *const task_s…