原标题:用python自动爬取海贼王漫画推送kindle
链接:
之前闲着无聊,想找个项目练练手,这时我看到正在压着泡面的kindle。
就你了,之前一直想在kindle上看漫画,可是想到又得下载资源还得发送到kindle,好麻烦,所以一直没有实现这个愿望,说干就干吧。
kindle推送
首先关于kindle推送的设置,可以参考下面链接设置。
kindle是支持 JPEG (.jpeg, .jpg)、PDF (.pdf)等图片格式的。
这里不推荐使用图片格式,因为漫画有多页,如果用图片推送的话,你会看到kindle上散乱着一堆的图片。
思路整理
1、把漫画下载到电脑
2、将下载好的一话漫画(15-19页)转换为一张pdf格式文件
3、通过邮件推送到kindle
4、定时爬取网站发现漫画更新,立即推送漫画
需要用到的模块挺多的,一共需要这几个模块。
第一、
从网上抓取漫画页
具体哪个网站就不说了,低调。因为此网站为静态网页,结构较简单,所以爬取起来比较容易。
这个函数主要为抓取一话里海贼王的所有图片地址,放到pic_list列表里并返回。
第二、
获取PDF文件
然后定义一个函数(传入图片地址,文件保存地址)用来下载图片,这里是将下载好的图片转化为PDF文件
第三、
通过邮件推送到kindle
PDF文件生成完毕后,就可以通过smtplib邮件服务来推送漫画了。
QQ邮箱的服务器为:
mail_host = "http://smtp.qq.com"
mail_user = "邮箱地址"
mail_pass = "邮箱密码"# qq邮箱一般需要授权码
receivers = [占位] # 这里填上kindle的亚马逊邮箱地址码,可填多个接收邮箱
红色标记的就是kindle邮箱地址
下面贴上代码:
到这里主要功能都已写完,目前追到了最新最新951话,952话还没更新。
运行效果
责任编辑: