200-Study | Python学习 | 爬虫项目 | JD商品评论 | 小牛电动车-01

news/2024/10/19 13:34:19/

项目需求

  • 收集京东平台小牛电动车的用户评价,不含其它周边类似配件的用户评价。

步骤

  1. 获取小牛电动车各个型号的产品列表及对应的产品页链接
  2. 按照各个型号给出的产品页链接,爬取每个产品的商品评价

selenium爬取

# 京东评论 爬取
from selenium import webdriver
import time
import numpy as np
import pandas as pd
from selenium.common.exceptions import NoSuchElementExceptionchromeOptions = webdriver.ChromeOptions()
chromeOptions.add_argument('--proxy-server=127.0.0.1:8118')# 京东的反爬虫机制是对疑似爬虫用户禁封IP的形式,所以访问时注意设置代理IP# 如果所需的爬虫较多,需要设置休息时间
browser = webdriver.Chrome(options=chromeOptions)#browser = webdriver.Chrome()
browser.get('https://mall.jd.com/view_search-625118.html')
browser.maximize_window()
# 找到五个产品分类
category = browser.find_elements_by_partial_link_text('小牛电动')[:5]
category_name = [cate.text for cate in category]
category_links = [cate.get_attribute('href') for cate in category]
time.sleep(np.random.randint(0,5))  # 京东的反爬虫机制是对疑似爬虫用户禁封IP的形式。 

Requests爬取

requests爬取是对selenium爬取的一次升级,在对网页交互进行分析的基础上,我们可以直接访问到某个商品评论的json。这种方式显然是快于用selenium直接访问每页评论的。

网页分析

chrome的inspect
如上图所示,我们用chrome的检查工具中网络分析来寻找有用的信息。
定位回传的json信息
这个请求的返回结果正好是我们想寻找的商品评论json。

接下的来的操作可以移步[京东评论爬取]。(https://blog.csdn.net/Minervar/article/details/89080119)


http://www.ppmy.cn/news/775060.html

相关文章

李一男狱后3个月离开小牛电动车,再次当起投资人

点击上方“程序员大咖”,选择“置顶公众号” 关键时刻,第一时间送达! 出狱 3 个月后的原牛电科技创始人兼 CEO 李一男,近期被曝已加盟梅花天使创投担任合伙人,将负责旗下成长基金投资业务,且已辞去牛电科技…

小牛电动Q2财报:国外不乐观,国内狂下沉

配图来自Canva 8月17日,小牛电动发布了2020年第二季度财报。回看一季度的小牛电动,由于国内疫情影响,线下门店一段时间内大量闭店,销量直接腰斩,净利润由正到负,业绩着实有些狼狈。 二季度国内疫情基本平…

十、HTML中的浮动

1、浮动 1、浮动 块级元素 独占一行 若块级元素宽度较少时,导致后续是空白 布局 先整体,后局部 先简单,再复杂 复杂再划分 整体布局 局部 2、float属性 浮动飘 float属性 让网页元素按照标准文档流方式显示 自上到下,…

微信小程序使用vant时间选择器二次封装成自定义区间时间选择

目录 1.引入vant组件库 2.wxml页面 3.js页面 1.引入vant组件库 1.安装vant # 通过 npm 安装 npm i vant/weapp -S --production # 通过 yarn 安装 yarn add vant/weapp --production # 安装 0.x 版本 npm i vant-weapp -S --production 2.将 app.json 中的 "style&quo…

win10亮度怎么调_笔记本屏幕亮度怎么调

大家好,今天分享一篇来自装机吧官网(zhuangjiba.com)的图文教程。许多网民发现,当他们的计算机在办公室时,计算机屏幕的亮度会变暗,其中一些代表了计算机电量不足的问题,或者存在计算机没有设置亮度的问题。虽然计算机…

笔记本运行linux亮度低,关于笔记本linux亮度调节

Laptop安装linux系统后,开机默认亮度是最大,每次开机都很刺眼,开机后调节好亮度后,重启又恢复了。现在介绍可以永久设置屏幕亮度的方法,这样就不用每次开机都设置亮度那么麻烦。 调节亮度的方法是:Fn+左右键 首先查看自己的显卡亮度控制文件是哪种 ls /sys/class/backlig…

内核是如何接收到网络包的

文章目录 一、实际相关问题二、数据是如何从网卡到协议栈的1、Linux网络收包总览2、Linux启动1)创建ksotfirqd内核线程2)网络子系统初始化3)协议栈注册4)网卡驱动初始化5)网卡启动 3、迎接数据的到来1)硬中…

Linux(Ubuntu)+Qt+C++与OpenCV窗体程序使用

程序示例精选 Linux(Ubuntu)QtC与OpenCV窗体程序使用 如需安装运行环境或远程调试&#xff0c;见文章底部个人QQ名片&#xff0c;由专业技术人员远程协助&#xff01; 前言 这篇博客针对<<Linux(Ubuntu)QtC与OpenCV窗体程序使用>>编写代码&#xff0c;代码整洁&am…