python爬虫获取豆瓣前top250的标题（简单）

news/2024/12/2 15:31:48/

今天是简略的一篇，简单小实验

import requests
from bs4 import BeautifulSoup# 模拟浏览器的构成（请求头）
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/123.0.0.0 Safari/537.36 Edg/123.0.0.0"
}for start_num in range(0,250,25):# 获取豆瓣top榜上前250部电影的响应内容response = requests.get(f"https://movie.douban.com/top250?start={start_num}", headers=headers)html = response.text# 传入方法，指定解析器为html.parser"soup = BeautifulSoup(html, "html.parser")all_titles=soup.findAll("span",attrs={"class":"title"})for title in all_titles:title_string=title.stringif "/" not in title_string:print(title_string)

读取：
在这里插入图片描述

http://www.ppmy.cn/news/1408947.html

github本地仓库push到远程仓库

1.从远程仓库clone到本地 2.生成SSH秘钥，为push做准备在Ubuntu命令行输入一下内容 [rootlocalhost ~]# ssh-keygen -t rsa < 建立密钥对，-t代表类型，有RSA和DSA两种 Generating public/private rsa key pair. Enter file in whi…

消息中间件之消息通信模型MQ

一，为什么需要MQ？ 应用中，经常需要对庞大的海量数据进行监控，随着网络技术和软件开发技术的不断提高，在实战开发中MQ的使用与日俱增，特别是RabbitMQ在分布式系统中存储转发消息，可以保证数据不…

WordPress建站教程：10步快速搭建个人网站

WordPress是一个广泛使用的内容管理系统（CMS），凭借其用户友好的界面和大量可定制的主题和插件，为WordPress 提供了多功能性和灵活性，可用于创建各种类型的网站，包括个人博客、B2B企业网站、B2C外贸网站等&a…

一、持续集成介绍

持续集成介绍一、什么是持续集成二、持续集成的流程三、持续集成的组成要素四、持续集成的好处一、什么是持续集成持续集成（CI）指的是，频繁地（一天多次）将代码集成到主干。持续集成的目的，就是让产品可…

【C语言自定义类型之----结构体，联合体和枚举】

一.结构体 1.结构体类型的声明 srruct tag {nemer-list;//成员列表 }varible-list;//变量列表结构体在声明的时候，可以不完全声明。例如：描述一个学生 struct stu {char name[20];//名字int age;//年龄char sex[20];//性别 };//分号不能省略2.结构体…

大模型学习笔记八：手撕AutoGPT

文章目录一、功能需求二、演示用例三、核心模块流程图四、代码分析1）Agent类目录创建智能体对象2）开始主流程3）在prompt的main目录输入主prompt和最后prompt4）增加实际的工具集tools（也就是函数）5&#xf…

5. 多重背包问题 II(acwing)

文章目录 5. 多重背包问题 II题目描述动态规划一维数组三重循环（超时）二进制优化（正确代码） 二维数组三重循环（超时）二进制优化（超出内存限制） 5. 多重背包问题 II 题目描述有 N种…

【MySQL核心SQL】

MySQL核心SQL 结构化查询语句SQL SQL是结构化查询语言（Structure Query Language），它是关系型数据库的通用语言。 SQL主要可以划分为以下 3 个类别： DDL（Data Definition Languages）语句数据定义语言&am…

python爬虫获取豆瓣前top250的标题（简单）

相关文章