爬虫基础(六)代理简述

ops/2025/2/2 15:17:40/

目录

一、什么是代理

二、基本原理

三、代理分类


一、什么是代理

爬虫一般是自动化的,当我们自动运行时

爬虫自动抓取数据,但一会就出现了错误:

如,您的访问频率过高

这是因为网站的反爬措施,如果频繁访问,则会被禁止,即封IP

为解决这种情况,我们需要把自己的IP伪装一下,即代理

所谓代理,就是代理服务器。

二、基本原理

正常来说:

客户发送请求给服务器

然后服务器将响应传给客户

而代理的话:

相当于在客户和服务器之间加一个代理服务器

就成了客户发送请求给代理服务器

代理服务器将请求传给服务器

服务器将响应传给代理服务器

代理服务器再传给客户

而使用代理服务器,则可以隐藏真实IP

我们只需要不断更换IP即可

三、代理分类

根据协议分类

  1. HTTP代理

    • 仅支持HTTP协议,适用于网页浏览。

    • 通常用于访问受限网站或匿名浏览。

  2. HTTPS代理

    • 支持HTTPS协议,提供加密传输,安全性更高。

    • 适用于需要加密的网页访问。

  3. SOCKS代理

    • 支持多种协议(如HTTP、FTP),灵活性高。

    • 常用于P2P文件共享或绕过防火墙。

  4. FTP代理

    • 专用于FTP协议,用于文件传输。

    • 适用于需要匿名上传或下载文件的场景。

  5. SSL/TLS代理

    • 支持SSL/TLS加密,安全性强。

    • 适用于需要高安全性的数据传输。

根据匿名程度分类

  1. 透明代理(Transparent Proxy)

    • 不隐藏用户IP,服务器知道请求经过代理。

    • 常用于内容过滤或缓存。

  2. 普通匿名代理(Anonymous Proxy)

    • 隐藏用户IP,但服务器知道请求来自代理。

    • 提供一定匿名性,但无法完全隐藏代理身份。

  3. 高匿名代理(Elite Proxy)

    • 完全隐藏用户IP和代理信息,服务器无法识别请求是否通过代理。

    • 提供最高匿名性,适用于高隐私需求。


http://www.ppmy.cn/ops/155062.html

相关文章

PHP Error处理与优化指南

PHP Error处理与优化指南 引言 在PHP编程中,错误处理是保证程序稳定性和用户体验的关键环节。良好的错误处理机制不仅能帮助开发者快速定位问题,还能提升应用程序的健壮性。本文将详细介绍PHP错误处理的方法、技巧以及优化策略。 一、PHP错误处理概述 1.1 错误类型 PHP中…

完美还是完成?把握好度,辨证看待

完美还是完成? 如果说之前这个答案有争议,那么现在,答案毋庸置疑 ■为什么完美大于完成 ●时间成本: 做事不仅要考虑结果,还要考虑时间和精力,要说十年磨一剑的确质量更好,但是现实没有那么多…

【单链表算法实战】解锁数据结构核心谜题——环形链表

题目如下: 解题过程如下: 环形链表:尾结点的next指针不为空,而是指向链表中的任一结点。 思路:快慢指针,慢指针每次走一步,快指针每次走两步。快慢指针在环中追逐相遇,那么这个链表…

FastAPI + GraphQL + SQLAlchemy 实现博客系统

本文将详细介绍如何使用 FastAPI、GraphQL(Strawberry)和 SQLAlchemy 实现一个带有认证功能的博客系统。 技术栈 FastAPI:高性能的 Python Web 框架Strawberry:Python GraphQL 库SQLAlchemy:Python ORM 框架JWT&…

算法基础学习——快排与归并(附带java模版)

快速排序和归并排序是两种速度较快的排序方式,是最应该掌握的两种排序算法, (一)快速排序(不稳定的) 基本思想:分治 平均时间复杂度:O(nlogn) / 最慢O(n^2) / 最快O(n) 步骤&…

亚博microros小车-原生ubuntu支持系列:17 gmapping

前置依赖 先看下亚博官网的介绍 Gmapping简介 gmapping只适用于单帧二维激光点数小于1440的点,如果单帧激光点数大于1440,那么就会出【[mapping-4] process has died】 这样的问题。 Gmapping是基于滤波SLAM框架的常用开源SLAM算法。 Gmapping基于RBp…

【13】WLC HA介绍和配置

1.概述 本文对AireOS WLC的HA进行介绍,和大多数网络架构设计一样,单台的WLC是无法保证设备的冗余性的,而且WLC也不是双引擎的设备,所以需要依靠High Available的技术来为WLC提供高可用性。 2.WLC HA类型 AireOS WLC的高可用性技术可以分为N+1的SSO的HA。不是所有的设备都…

论文阅读(十):用可分解图模型模拟连锁不平衡

1.论文链接:Modeling Linkage Disequilibrium with Decomposable Graphical Models 摘要: 本章介绍了使用可分解的图形模型(DGMs)表示遗传数据,或连锁不平衡(LD),各种下游应用程序之…