Python爬取小说

embedded/2024/10/4 17:26:58/

爬取小说大致分三步

1.获取网页

2.分析获取内容

3.保存到文本

具体步骤放代码里了,注释很清晰了。

python"># 爬取小说#requests是一个常用的 HTTP 请求库,可以方便地向网站发送 HTTP 请求,并获取响应结果。
#pip install requests
#lxml是python的一个解析库,支持HTML和XML的解析,支持XPath解析方式
#pip install lxml
from lxml import etree
import requests
#网站地址
url = "https://dldl1.nsbuket.cc/xiaoshuo/douluodalu/1.html"
while True:#伪装用户headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/124.0.0.0 Safari/537.36 Edg/124.0.0.0'}# 发送请求,get方式resp = requests.get(url,headers=headers)#设置编码resp.encoding='utf-8'#响应信息# print(resp.text)# 获取文本e=etree.HTML(resp.text)info='\n'.join(e.xpath('//div[@class="m-post"]/p/text()'))#章节内容title=e.xpath('//h1/text()')[0]#章节标题# print(title)# print(info)# 获取下一章节地址url = f'https://dldl1.nsbuket.cc{e.xpath("//td[2]/a/@href")[0]}'print(title)#保存with open('斗罗大陆.txt','a',encoding='utf-8') as f:f.write(title+'\n\n'+info+'\n\n')#退出循环if url=='https://dldl1.nsbuket.cc/xiaoshuo/douluodalu/217333.html':break


http://www.ppmy.cn/embedded/41369.html

相关文章

Infuse for Mac激活版:高清影音播放软件

对于热爱影音娱乐的Mac用户来说,Infuse for Mac是一个不容错过的选择。它以其简洁的操作界面和强大的播放功能,为用户带来了全新的影音播放体验。 Infuse for Mac支持广泛的音视频格式,无需额外转换,即可轻松播放您喜爱的影片。无…

彩虹聚合DNS管理系统

聚合DNS管理系统可以实现在一个网站内管理多个平台的域名解析,目前已支持的域名平台有:阿里云、腾讯云、华为云、西部数码、CloudFlare。本系统支持多用户,每个用户可分配不同的域名解析权限;支持API接口,支持获取域名…

Java入门之数据类型和变量

1.字面常量 字面常量就是在程序运行中,固定不变的量,例如如下的代码 public class Demo{public static void main(String[] args){System.Out.println("hello world!");System.Out.println(100);System.Out.println(3.14);System.Out.println…

嵌入式学习-通用定时器

简介 框图介绍 时钟选择 计数器部分 输入捕获和输出比较框图 嵌入式学习全文参考(小向是个der)做笔记:https://blog.csdn.net/qq_41954556/article/details/129735708

LVS 负载均衡部署 NAT模式

一、环境准备 配置环境: 负载调度器:配置双网卡 内网:172.168.1.11(ens33) 外网卡:12.0.0.1(ens37)二台WEB服务器集群池:172.168.1.12、172.168.1.13 一台NFS共享服务器:172.168.1.14客户端&#xff…

OpenAI推出新模型GPT-4o:可实时交互,检测人的情绪,支持多模态输出

GPT-4o作为OpenAI新发布的人工智能模型,据官方及媒体报道,是面向全球用户发布的,包括中国在内的用户理论上应该能够通过相应平台和应用访问。不过,实际可用性还需考虑地区政策、网络访问限制以及具体平台是否在中国有本地化服务等…

蓝桥杯第2357题——限高杆(多层图+dijkstra)

问题描述 某市有 𝑛 个路口, 有 𝑚 段道路连接这些路口, 组成了该市的公路系统。其 中一段道路两端一定连接两个不同的路口。道路中间不会穿过路口。 由于各种原因, 在一部分道路的中间设置了一些限高杆, 有限高杆的路段 货车无法通过。 在该市有两个…

【C++风云录】探索食品工艺的新工具:创新你的食谱

食品加工模拟:优化你的营养研究 前言 在科技的推动下,食品科学领域已经逐步引入了智能化工具,以协助研究人员和工业界进行更精细、更深入的研究。本文将详细介绍六款与食品科学紧密相关的软件和库,它们包括FoodCAD, Nutritional…