python爬取可爱女生图片

news/2024/11/19 11:46:16/

爬虫学的好,私货少不了

在这里插入图片描述

  • 复习金融学实属无聊,思想开了点小差,巧了,最近正好在学爬虫,很快啊,漂亮小姐姐们嗖嗖嗖的跑到小的地文件夹来啦!
  • 爬取mz图片链接: https://sc.chinaz.com/tupian/xingganmeinvtupian.html
  • 因为临近考试秃头夜,这里就不细说啦,具体看下面代码啦!
import urllib.request
import urllib.parse
from lxml import etree
import time
import osdef handle_request(url, page):# 构造url# 由于第一页和后面的页码规律不一样,所有进行判断if (page == 1) or (page == 0):# 页面位1或0时的链接# https://sc.chinaz.com/tupian/xingganmeinvtupian.htmlurl = url.format('')else:# 其余链接# https://sc.chinaz.com/tupian/xingganmeinvtupian_2.htmlurl = url.format('_' + str(page))# print(url)# ua伪装headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.149 Safari/537.36','Cookie': 'UM_distinctid=172bafc075930f-0b3214295ea2fd-f313f6d-1fa400-172bafc075a521; __gads=ID=7343205fec19267e:T=1592274993:S=ALNI_MZuCx78VBx2WBiIEBOXsKZoldvefg'}# 发起请求request = urllib.request.Request(url=url, headers=headers)return request# 解析内容,下载图片
def parse_content(content):# 将内容转化位xpath能抓取的对象tree = etree.HTML(content)# 抓取图片列表# //*[@id="container"]/div[2]/div/a/imgimage_list = tree.xpath('//div[@id="container"]/div/div/a/img/@src2')  # 懒加载技术  可视区只有那么大,只要图片出现在眼前,就会加载# 实现方式:# <img  src2=<"图片路径"> 通过js代码动态添加<img src = "图片路径",src2="">for image_src in image_list:download_image(image_src)def download_image(image_src):dirpath = '站长美女图片爬取'# 创建文件夹if not os.path.exists(dirpath):os.mkdir(dirpath)# 搞个文件名filename = os.path.basename(image_src)print(filename)# 搞图片路径filepath = os.path.join(dirpath, filename)print(filepath)# 发送请求保存图片headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.149 Safari/537.36','Cookie': 'UM_distinctid=172bafc075930f-0b3214295ea2fd-f313f6d-1fa400-172bafc075a521; __gads=ID=7343205fec19267e:T=1592274993:S=ALNI_MZuCx78VBx2WBiIEBOXsKZoldvefg'}# https://sc.chinaz.com/tupian/201228241995.htm# 进行拼接image_src = 'https:' + image_src# 像美女图片发起请求request = urllib.request.Request(url=image_src, headers=headers)# 获取响应response = urllib.request.urlopen(request)# 以二进制的形式保存下来with open(filepath, 'wb') as fp:print(f'正在爬取{filename}')fp.write(response.read())print(f'{filename}爬取完毕')time.sleep(2)def main():url = 'http://sc.chinaz.com/tupian/xingganmeinvtupian{}.html'start_page = int(input('请输入起始页码:'))end_page = int(input('请输入结束页码:'))for page in range(start_page, end_page + 1):request = handle_request(url, page)print('开始爬取第{}页'.format(page))response = urllib.request.urlopen(request)content = response.read().decode()# print(content)parse_content(content)print('第{}页爬取结束'.format(page))if __name__ == '__main__':start = time.time()main()print('蜘蛛结网完毕,收工')end = time.time()print(f'爬取所有妹子图片用时: {end-start}s')
  • 爬取程序运行部分结果如下所示:

在这里插入图片描述

  • 在这个星球上,你很重要,请珍惜你的珍贵! ~~~夜斗小神社
    在这里插入图片描述

http://www.ppmy.cn/news/431847.html

相关文章

宝宝年龄动态图片

记得以前篱笆网以前是生成动态的生日提醒图片&#xff0c;后来自己决定给自己宝宝做一个。但是一直 都没空去弄&#xff0c;最近比较空所以做了&#xff0c;其实做的时候主要是PNG与图片 (任何格式jpg,gif,bmp)的重叠与文字写入最后生成图片PNG&#xff01;,用到了计算年宝宝生…

怎么把图片做成gif动图

怎么把图片做成gif动图&#xff1f;当我们看到网上有很多非常搞笑又可爱的gif动图&#xff0c;你是不是也想自己做一个属于自己的呢&#xff1f;嗯&#xff0c;有很多的小姐姐&#xff0c;他们就很喜欢做一些小动物或者小宝宝的gif动图。gif动图大家应该都不陌生&#xff0c;我…

如何照顾宝宝

[转]我后悔看晚了啊&#xff01;即将有孩子的和刚有孩子的好好看看 2012-8-6 14:55阅读(9)转载自侯晶 我在美国生了两个孩子&#xff0c;生育前后都有培训班&#xff0c;家庭医生每次洗脑让我受益匪浅&#xff0c;我的两个宝宝在婴儿时期乖巧得好像家里没有小婴儿&#xff0c;…

宝宝照片

星期六乘着太阳出来的那么几个小时给宝宝又拍了些照片!

BabyMaker(预测宝宝未来长相软件) v1.5绿色中文破解版

点击下载来源&#xff1a;BabyMaker(预测宝宝未来长相软件) v1.5绿色中文破解版 BabyMaker是一款非常有意思的预测宝宝未来长相的软件&#xff0c;采用了先进的面部识别功能&#xff0c;为此你只需要将要作为爸爸和妈妈双方的照片添加到软件中&#xff0c;随后BabyMaker即可根…

Qtutu,让可爱图片无处不在

在网上看见了可爱的图片&#xff0c;你有没有一种把它们保存下来的冲动呢&#xff1f;有没有想过&#xff0c;有一种工具&#xff0c;可以把你看见的可爱图片都整理到一起&#xff0c;你可以方便的把它们设定为头像、签名&#xff0c;在文章中引用&#xff0c;甚至下载到手机呢…