python爬虫案例——抓取链家租房信息

news/2024/9/24 19:26:37/

文章目录

  • 1、任务目标
  • 2、分析网页
  • 3、编写代码

1、任务目标

目标站点:链家租房版块(https://bj.lianjia.com/zufang/)
要求:抓取该链接下前5页所有的租房信息,包括:标题、详情信息、详情链接、价格

如:
在这里插入图片描述

2、分析网页

  1. 用浏览器打开链接,按F12或右键检查,进入开发者模式;因为是同步加载的网站,我们可以直接在 Network-Doc 下查找数据接口,发现第一页数据存放在一个叫 zufang/ 的接口下,且网页源码中内容与网页内容符合
    在这里插入图片描述
  2. 查看 Headers 信息,发现该接口的请求URL和请求方式如下:

http://www.ppmy.cn/news/1529938.html

相关文章

Linux安装、Nginx反向代理、负载均衡学习

系列文章目录 第一章 基础知识、数据类型学习 第二章 万年历项目 第三章 代码逻辑训练习题 第四章 方法、数组学习 第五章 图书管理系统项目 第六章 面向对象编程:封装、继承、多态学习 第七章 封装继承多态习题 第八章 常用类、包装类、异常处理机制学习 第九章 集…

设计模式之备忘录

一、备忘录设计模式概念 备忘录模式(Memento) 是一种行为设计模式, 允许在不暴露对象实现细节的情况下保存和恢复对象之前的状态。 适用场景 当你需要创建对象状态快照来恢复其之前的状态时, 可以使用备忘录模式。当直接访问对象的…

解决【WVP服务+ZLMediaKit媒体服务】加入海康摄像头后,能发现设备,播放/点播失败,提示推流超时!

环境介绍 每人搭建的环境不一样,情况不一样,但是原因都是下面几种: wvp配置不当网络端口未放开网络不通 我搭建的环境: WVP服务:windows下,用idea运行的源码 ZLM服务:虚拟机里 问题描述 1.…

使用Go语言的互斥锁(Mutex)解决并发问题

解锁Python编程的无限可能:《奇妙的Python》带你漫游代码世界 在并发编程中,由于存在竞争条件和数据竞争,我们需要将某些代码片段设定为临界区,并使用互斥锁(Mutex)等同步原语来保护这些临界区。本文将详细介绍Go语言标准库中Mutex的使用方法,以及如何利用它来解决实际…

Mysql的基本常识,DDL以及基本数据类型

数据类型: 数值类型: 数值类型大小范围TINYINT1 byte(-128,127)SMALLINT2 byte(-32768,31767)MEDIUMINT3 byte(-8388608,8388607)INT 或者 INTEGER4 byteBIGINT8 byteFLOAT4 byteDOUBLE8 byte 还有一个特殊一点的:DECIMAL 他的大小和范围依…

前后端分离集成CAS单点登录

修改nginx worker_processes 1; events {worker_connections 1024; } http {include mime.types;default_type application/octet-stream;sendfile on;keepalive_timeout 65;server {listen 80;server_name localhost;location /api/ {proxy_pass htt…

前端CSS学习框架

⭐️ CSS 💬 描述:层叠样式表,用于设计风格和布局。 📚 资源:学习使用 CSS 为 HTML 添加样式 - 学习 Web 开发 | MDN ⭐️ 基本语法 ⭐️ 引入方式 行内样式 内部样式表 外部样式表 ⭐️ 选择器 通用选择器 标签…

排序算法Java实现

文章目录 排序算法概述比较排序算法非比较排序算法稳定 vs 不稳定Java 中的排序 外部排序1) 冒泡排序2) 选择排序3) 堆排序4) 插入排序5) 希尔排序6) 归并排序递归实现时间复杂度非递归实现 7) 归并插入8) 快速排序随机基准点处理重复值 9) 计数排序10) 桶排序11) 基数排序 排序…