某二手车逆向研究,竟然如此……

news/2024/10/17 15:31:51/

目录

    • 一、逆向目标
    • 二、网站分析
    • 三、加密参数分析
    • 四、加密数据分析
    • 五、思路总结
    • 六、完整项目下载
    • 七、作者Info

一、逆向目标

通过抓包技术找出请求头的加密参数,当然也包括cookie,以及响应数据中的加密过的或编码过的数据,通过xhr/fetch请求定位到具体的接口,再通过全局搜索或断点调试找出JS中的一些逻辑,不行再进行hooks、js重写、自动化模拟等方式,最终的目标是能够稳定、快速、完整的抓取到我们所需的数据

二、网站分析

分析某二手车的网页数据,发现我们要抓取的数据字段还是比较多的,一旦该网站的网页元素及其位置发生改变,维护起来就比较麻烦,所以我们通过xhr定位到接口:
在这里插入图片描述

三、加密参数分析

通过接口的请求头参数,我们大致可看出有一些参数可能是比较重要的,比如client-time、verify-token、szlm-id等参数,我们全局搜索一下verify-token:
在这里插入图片描述

并进行断点调试,刷新一下:
在这里插入图片描述

verify-token的值为44646d6aa72bc4733ceabefe0e952271,如果我们再刷新一次,发现verify-token的值又一次变化了,是不是需要我们找出其JS构造逻辑呢?并不需要,当我们不知道某些参数是否有用时,可以使用一些调试工具如postman等对其接口的请求头参数进行调试

经过验证,verify-token虽然是动态变化的,但不影响返回的数据,访问也不会被禁止,故该参数可被舍弃,其他的请求头参数也是相同的调试验证流程…………

四、加密数据分析

查看其响应response数据,格式化一下:
在这里插入图片描述

可轻易看出数字是经过编码处理过的,我们只需与页面中的数字对照起来看就行:
在这里插入图片描述

数字5就是
数字4就是

五、思路总结

此次实战中可看出,其实很多请求头参数都是没用的,即使是加密动态变化的参数也是如此,我们可通过调式工具去判断其是否有用,绕过一些东西,从而帮助我们快速抓取数据,提高爬虫效率

六、完整项目下载

点我下载完整项目

项目包括以下内容:
经过逆向研究,使用xmind编写的部分思维导图如下:
在这里插入图片描述

项目结构:
在这里插入图片描述
其中有xmind的软件包,可用xmind.exe打开思维导图查看逆向流程


测试前9页爬取效果:
在这里插入图片描述

查看Excel数据:
在这里插入图片描述


七、作者Info

Author:小鸿的摸鱼日常,Goal:让编程更有趣!

专注于算法、爬虫,游戏开发,数据分析、自然语言处理,AI等,期待你的关注,让我们一起成长、一起Coding!

版权说明:本文禁止抄袭、转载 ,侵权必究!


http://www.ppmy.cn/news/107327.html

相关文章

晚上12点接到面试邀约电话,待业一个月的我却拒绝了....

前言 一位测试朋友最近一直在找工作,前两天刚拒绝了一个面试。那天晚上12点多,他接到一个HR的面试电话,让他第二天早上10点去公司面试。朋友和HR聊了两句,了解到这位HR经常加班,于是果断拒绝了这个面试。 我还为他可惜…

从自动化到测开,测试人员逆袭之路从此起步...

在当今竞争激烈的软件测试行业中,近期的招聘市场确实面临一些挑战。大量的求职者争相涌入岗位,许多热衷于功能测试的人士甚至难以找到理想的工作机会。更不幸的是,连自动化测试和性能测试这些专业领域也受到了测试开发人员的竞争压力。然而&a…

基于 Python 和深度学习技术实现的人体姿态识别

人体姿态识别是计算机视觉领域的一个重要应用,它通过识别人体的关键点和关节位置,能够准确地判断人体的姿态和动作。这项技术可以应用在很多领域,比如运动训练、医疗康复、安保监控等,为人们的生活和工作带来了很大的便利和效益。…

启真医学大模型

启真医学大模型 QiZhenGPT: An Open Source Chinese Medical Large Language Model 本项目利用启真医学知识库构建的中文医学指令数据集,并基于此在LLaMA-7B模型上进行指令精调,大幅提高了模型在中文医疗场景下效果,首先针对药品知识问答发…

X2000 freeRTOS usb_bulk通信

例程 官方例程..\freertos\example\usb\device\gadget_generic_bulk.c&#xff0c;代码如下&#xff1a; #include <common.h> #include <usb/gadget_bulk.h> #include <os.h>static const struct gadget_id bulk_id {.vendor_id 0x1CBE,.product_id 0x…

算法综合应用实验:供给系统问题

目录 实验内容实验流程实验过程伪代码代码实现分析算法复杂度用例测试 总结 实验内容 外星人指的是地球以外的智慧生命。外星人长的是不是与地球上的人一样并不重要&#xff0c;但起码应该符合我们目前对生命基本形式的认识。比如&#xff0c;我们所知的任何生命都离不开液态水…

基于深度学习的人脸识别与人员信息管理软件【python源码+UI界面+功能源码详解】

人脸识别功能演示 摘要&#xff1a;人脸识别&#xff08;Face Recognition&#xff09;是基于人的脸部特征信息进行身份识别的一种生物识别技术&#xff0c;可以用来确认用户身份。本文详细介绍了人脸识别基本的实现原理&#xff0c;并且基于python与pyqt开发了人脸识别与信息管…

C++11新特性:decltype类型推导

上一节所讲的 auto&#xff0c;用于通过一个表达式在编译时确定待定义的变量类型&#xff0c;auto 所修饰的变量必须被初始化&#xff0c;编译器需要通过初始化来确定 auto 所代表的类型&#xff0c;即必须要定义变量。若仅希望得到类型&#xff0c;而不需要(或不能)定义变量的…