python 简单实用的小爬虫(爬动漫图片)

news/2025/2/5 7:00:29/

简简单单爬一个网站, 动漫图片网址里面有很多好看的动漫图片,所以想都下载下来,这个代码是前两页的内容,可以通过修改循环中的range(1,3)来自行选择要下载多少页,还有就是路径在D盘自己创建的爬虫图片里面,第一个代码 是封装的函数,包括请求头,请求格式和请求失败后允许重新请求几次。第二个代码是主体实现代码,主体实现包括一个问题,目前还没想到简单一点的解决方案,因为图片名字也是爬虫爬来的,所以可能原图片姓名会出现特殊字符而无法命名的现象,不过这是极少数情况,希望会的大佬指点一下,或者帮忙完善一下,感激不尽!!!以下是代码和结果截图

#封装函数的代码
#coding = utf-8
import requests
from retrying import retry
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/77.0.3865.90 Safari/537.36"}
@retry(stop_max_attempt_number=3)
def _parse_url(url,method,data,proxies):print("*"*20)if method =="POST":requests.post(url,data=data,headers=headers,proxies=proxies)else:response=requests.get(url,headers=headers,timeout=3,proxies=proxies)assert response.status_code==200  #状态码return response.content.decode()def parse_url(url,method="GET",data=None,proxies={ }):try:html_str = _parse_url(url,method,data,proxies)except:html_str=Nonereturn html_strif __name__ == '__main__':url="https://www.huashi6.com/"print(parse_url(url))

主要代码实现

#coding=utf-8
import  re
import requests
import  datetime #日期
import os
from parse_url import parse_urlfor n in range(1,3):url="https://www.huashi6.com/hot_"+ str(n)#测试代码# n+=1# print(url)html_str=parse_url(url)regex=r'img src="(http:.*?.g)"'#正则表达式图片pa=re.compile(regex)#模型ma=re.findall(pa,html_str)#匹配到的数据a=ma[0:len(ma):2]#切片吧头像去除#以下是输出图片类型内容和长度# print(type(a))# print(a)# print(len(a))#名字同上regex1=r' title="(.*?)" class'#正则表达式名字pa1=re.compile(regex1)name=re.findall(pa1,html_str)# print(name)# print(type(name))# print(len(name))i=0for image in a:image=requests.get(image).contentpath = "D:\\pachongtupian\\"#存放路径# 判断是否存在,不存在就创建if not os.path.exists(path):os.makedirs(path)cur = datetime.datetime.now()  # 获取当前系统时间,因为网站中的图片会存在重名的情况m=cur.microsecond#唯一标识with open(path+str(name[i])+str(cur.month)+str(cur.day)+str(cur.minute)+str(m)+'.jpg','wb') as f:f.write(image)i += 1print(str(i) + '正在保存')print("第%d页保存完毕"%n)n+=1print("全部图片保存完毕")

这是爬下来的图片,执行间隔短的话会出现一样图片不一样名字的现象
在这里插入图片描述

在这里插入图片描述


http://www.ppmy.cn/news/579270.html

相关文章

Opencv实战【4】——图片动漫化处理

博主联系方式: QQ:1540984562 微信:wxid_nz49532kbh9u22 QQ交流群:750313950 目录 动漫化风格的特点处理手段代码实现效果总结 动漫化风格的特点 (1)动漫中的细节相对少; (2)动漫中的…

c语言 图片漫画效果,picsart怎么把图片变成漫画效果

现在的人们在拍完照片之外都习惯性的会用到图片编辑软件修图,picsart就是其中一个,他能够剪切、拼贴图片,还有很多有趣的文字特效和紧跟时尚潮流的贴纸,在使用的过程中如果想让图片变成漫画的效果应该如何操作呢? 修图…

python将图片转换成动漫,python实现图片转换成素描和漫画格式

本文实例为大家分享了python实现图片转换成素描和漫画格式的具体代码,供大家参考,具体内容如下 原图 图片转换后的成果 源码 # -*- coding: utf-8 -*- import cv2 from PIL import Image, ImageOps, ImageFilter # 转换成漫画风格 def toCarttonStyle(picturePath): # 设置输…

图片动漫化处理原理

1. 动漫化风格的特点 要想搞清楚怎么变成动漫化风格,首先就要明白动漫和普通照片的区别。主要的区别有三点: (1)动漫中的细节相对少; (2)动漫中的边缘轮廓更突出; (3&am…

腾讯动漫 漫画图片js解密

为什么80%的码农都做不了架构师?>>> 腾讯动漫http://ac.qq.com/ComicView/index/id/530449/cid/1随便一个动漫直接获取网页源码如下 图 然后下面是js 直接get(这里传进去刚才的加密的字符串) 会返回一段回车符为分隔符的图片地址 function get(p) {var …

视觉特效,图片转成漫画功能

使用最新人工智能技术,提供老照片修复、头像动漫化、头像3D游戏化、人物特效等20多种图片处理技术。 视觉特效 使用最新人工智能技术,提供老照片修复、头像动漫化、头像3D游戏化、人物特效等20多种图片处理技术。 开源的是前端模板,开源的是…

利用Python 自己动手制作动漫效果图片

背景 动漫效果的头像最近比较火,微信里面有大量的朋友都是使用这种风格的头像,在一些软件里面也慢慢开始集成该功能,在手机里面可以直接制作出动漫效果的图片 这种风格的图片是怎么生成的呢,那就不得不说最近这几年大火的AI&#…

从XKCD网站下载自动所有漫画图片---python实现

经常跟新的网站通常有一个首页,其中有最新的帖子,以及一个“前一篇”(或上一页)按钮,用来跳转到以前的帖子。然后那个帖子也有一个“前一篇”的按钮,以此内推。这创建了一条线索,从最近的页面,直到该网站的…