爬虫逆向学习(六):补环境过某数四代

server/2024/9/24 8:11:58/

声明:本篇文章内容是整理并分享在学习网上各位大佬的优秀知识后的实战与踩坑记录

引用博客:
https://blog.csdn.net/shayuchaor/article/details/103629294
https://blog.csdn.net/qq_36291294/article/details/127699273
https://blog.csdn.net/weixin_58584029/article/details/125286386
https://blog.csdn.net/randy521520/article/details/135304045
https://blog.csdn.net/weixin_44862184/article/details/125302589

前言

某数的反爬机制和大致的破解流程已经是被摸透了,某数小白可以根据上面提供的引用博客从上往下逐一阅读,相信看完能让你对它有个整体的了解。下文是在博客爬虫瑞数4案例:网上房地产下进行实战讲解的,本身作者已经讲解的很到位了,在这我就不献丑了。只是在使用作者最后提供的代码调试了很久才通过,便再次记录下踩坑过程,希望对大家有所帮助。

实战

目标网址:aHR0cDovL3d3dy5mYW5nZGkuY29tLmNuL29sZF9ob3VzZS9vbGRfaG91c2UuaHRtbA==
在无痕模式下打开浏览器,开启开发者模式,然后在源代码/来源那开启脚本调试,如下图:
在这里插入图片描述

前奏设置好后直接打开网址,它会在外链js中断住
在这里插入图片描述

这时看一下cookie,然后F8或者点击继续执行按钮,让调试继续执行下去
在这里插入图片描述

这是就拿到自执行函数了,这里就大概重复下作者的讲解
在这里插入图片描述

之所以讲解这一个其实还有一个目的,就是有些人会对最终生成的cookie长度217有所怀疑,这里说一下某数能增加最终cookie长度的其实还有两个地方
在这里插入图片描述

但是它并不是一定需要执行这两个地方,这里我们在_$Du('aEAA');下断点,让程序执行到这一步
在这里插入图片描述

然后再看一下cookie,发现这时已经生成了目标cookie值,我们拿这个cookie去发包请求发现是能拿到数据的,也就是说按作者的代码最终生成的cookie长度为217也是能拿到数据的,至少对于这个网址来说。
在这里插入图片描述在这里插入图片描述

踩坑

外链js引入执行报错:SyntaxError: Unexpected token ‘)’

一开始按作者讲解的,把调试拿到的ts代码直接copy到文件中执行是没问题的,但是后面我直接保存外链链接的内容时便出现问题了,由此操作是我想使用require的方式引入外链js代码require('./c.FxJzG50F.dfe1675');
这里给大家看看两种格式差异:
调试拿到的外链js:
在这里插入图片描述
源码拿到的外链js:
在这里插入图片描述
最后还是直接使用调试拿到js就没问题了

编码异常

外链js的编码是ISO-8859-1,直接本地运行会报'gbk' codec can't decode byte 0x80 in position 41: illegal multibyte sequence,这时需要设置本地编码环境,如下设置就能成功了。
在这里插入图片描述

运行结果

我这边最终使用作者提供的代码是可以运行成功的,下面附上我的代码截图
在这里插入图片描述
fdc.py
在这里插入图片描述
fdc.js
在这里插入图片描述


http://www.ppmy.cn/server/115319.html

相关文章

# CentOS7 设置mysql的 root 用户密码时,报错 ERROR 1819(HY000)...ERROR1193... 解决方法。

CentOS7 设置mysql的 root 用户密码时,报错 ERROR 1819(HY000)…ERROR1193… 解决方法。 一、错误描述: mysql ALTER USER rootlocalhost IDENTIFIED BY 123; ERROR 1819 (HY000) Your password does not satisfy the current policy requirementsERRO…

微擎忘记后台登录用户名和密码怎么办?解决方法

微擎忘记后台登录名和登录密码是很常见的,服务器百科网fwqbk.com告诉你找回后台登录用户名和密码的方法: 一:找回微擎后台用户名 (如果只是忘记了后台登录密码,请忽略此步骤,跳转到第二步) 通…

MySQL的SSL加密连接问题,突然就连上Mysql怎么办?这里告诉你一种存在的可能

背景 这是一个生产问题引发的我对MySQL的SSL的认识,今年年初遇到一个mysql的问题,由于公司内业务系统升级关闭了mysql的SSL认证,导致mysqlWorkBench 和 程序无法正常连接到该MySQL数据库。虽然在知道原因之后来看好像很简单,但是排…

深度学习:怎么看pth文件的参数

.pth 文件是 PyTorch 模型的权重文件,它通常包含了训练好的模型的参数。要查看或使用这个文件,你可以按照以下步骤操作: 1. 确保你有模型的定义 你需要有创建这个 .pth 文件时所用的模型的代码。这意味着你需要有模型的类定义和架构。 2. …

【Linux入门】防火墙基础之iptables

文章目录 防火墙概述一、硬件防火墙二、软件防火墙1. iptables2. firewalld3. ufw iptables概述netfilter/iptables关系四表五链规则表的作用:规则链的作用:四表:五链: 数据包到达防火墙时的处理顺序: 防火墙概述 防火…

Ubuntu系统安装Gitlab

步骤 1:前提准备 首先,更新你的系统软件包,以确保你有最新的安全补丁和更新: sudo apt update sudo apt upgrade -y步骤 2:安装依赖项 在安装GitLab之前,你需要确保安装了以下必要的依赖项: …

2024/9/9 408“回头看”:b树

B树是什么?有什么作用?B树的插入和删除具体细节是什么?除了B树还有一个是B+树、还是B-树,他们有什么区别,又有什么相同点? b树在王道考研查找这一章,所以他的主要作用就是查找。 在…

华为 HCIP-Datacom H12-821 题库 (9)

1.需要题库的小伙伴至博客最下方添加微信公众号关注后回复题库 2.有兴趣交流IT问题的小伙伴微信公众号回复交流群,加入微信IT交流群 1.以下关于 RSTP 保护功能的描述,错误的是哪一选项? A、环路保护可以部署在根端口上,以防网络中…