Python爬虫基础——案例:爬取豆瓣电影动画排行榜

devtools/2025/1/7 22:31:50/

主要采用了requests模块json模块来实现豆瓣电影动画排行榜的爬取。

python">##############################
##作者:白雪公主的后妈
##时间:2024年1月4日
##主题:Python爬虫基础——案例:爬取豆瓣电影动画排行榜
##############################
import requests
import json
import time
headers = {"user-agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/131.0.0.0 Safari/537.36"}        #浏览器身份验证
url = "https://movie.douban.com/j/chart/top_list"       #请求的地址
params = {"type":"25","interval_id":"100:90","action":" ","start":"0","limit":"163"}     #需要携带的动态参数
response = requests.get(url,headers=headers,params=params)
# print(response)     #判断是否请求成功<Response [200]>
json_data = response.json()       #提取json数据
for i in json_data:Num_data = json.dumps(i,indent=4,ensure_ascii=False,separators=(', ', ': '))#ensure_ascii设置将数据编码后显示的文本内容,separators设置键之间、键和值之间的分隔符,indent设置缩进量# print(Num_data)# break #打印第一条json格式数据进行查看
with open("豆瓣电影动画排行榜.txt","w",encoding="utf-8") as fp:for i in json_data:title = i["title"]source = i["score"]fp.write(title+"  "+source+"\n")
# 输出json_data的个数
print("输出动画个数为:", len(json_data))

运行结果:


http://www.ppmy.cn/devtools/148738.html

相关文章

基于 GPUTasker 的 GPU 使用情况钉钉推送机器人实现

引言 https://github.com/cnstark/gputasker 随着 AI 模型的广泛应用&#xff0c;GPU 成为团队中最重要的资源之一。然而&#xff0c;如何实时监控 GPU 的使用情况并及时通知团队是一个值得关注的问题。为了更好地管理显卡资源&#xff0c;本文基于 GPUTasker&#xff0c;实现了…

使用Node编写服务器接口

1.设置环境 打开终端输入如下命令&#xff1a; mkdir apidemo cd apidemo npm init -y npm install express touch server.js 在server.js输入代码 const express require(express); const app express(); const PORT 3030;// 中间件 - 解析JSON请求体 app.use(expres…

Swift语言的语法糖

Swift语言的语法糖 Swift是一种由苹果公司开发的编程语言&#xff0c;旨在提高开发者的生产力和代码的可读性。自2014年推出以来&#xff0c;Swift逐渐成为iOS和macOS应用开发的主流语言。Swift的设计理念之一是简化和优化代码&#xff0c;特别是通过使用“语法糖”来提高语言…

小米智能哑铃上市,代理 IP 视角下的智能健身新篇

在智能科技与健康生活深度融合的时代&#xff0c;小米以其敏锐的市场洞察力和强大的创新能力&#xff0c;不断拓展智能生态版图。米家智能哑铃的发布&#xff0c;无疑是其在智能健身领域的又一重要举措。而当我们从代理 IP 的独特视角来审视这一产品&#xff0c;会发现其中蕴含…

STM32 拓展 RTC(实时时钟)

RTC简介 RTC(Real Time Clock,实时时钟)。是一个掉电后仍然可以继续运行的独立定时器。 RTC模块拥有一个连续计数的计数器,在相应的软件配置下,可以提供时钟日历的功能。修改计数器的值可以重新设置当前时间和日期 RTC还包含用于管理低功耗模式的自动唤醒单元。 RTC实质…

数据挖掘入门介绍及代码实战

什么是数据挖掘&#xff1f; 数据挖掘&#xff08;Data Mining&#xff09;是从大量数据中通过算法和技术提取有价值知识的过程&#xff0c;常被称为“从数据中发现知识”&#xff08;KDD&#xff0c;Knowledge Discovery in Databases&#xff09;。它包括从数据库中发现隐藏…

Nginx不使用域名如何配置证书

如果你不打算使用域名而是使用 IP 地址来配置 Nginx 的 SSL 证书&#xff0c;你会遇到一个问题&#xff0c;因为 SSL/TLS 证书通常是为特定的域名颁发的&#xff0c;而不是 IP 地址。虽然可以为 IP 地址生成证书&#xff0c;但大多数证书颁发机构&#xff08;CA&#xff09;不支…

Linux菜鸟级常用的基本指令和基础知识

前言:很多Linux初学者都会头疼于指令太多记不住&#xff0c;笔者刚学习Linux时也是如此&#xff0c;学习Linux指令时&#xff0c;学了后面的指令&#xff0c;前面的指令也会忘的差不多了&#xff0c;针对于以上这些情况&#xff0c;笔者今天来分享一篇Linux菜鸟级的常用指令的博…