selenium爬取猫咪图片并转换为统一尺寸(内附爬取并转换尺寸的的图片下载链接)

news/2024/11/28 17:39:41/

selenium爬取猫咪图片并转换为统一尺寸(内附爬取并转换尺寸的的图片下载链接)

朋友机器学习需要几百张-一千张左右的照片,就简单写了个selenium的自动化操作爬虫,对猫咪的图片进行爬虫并进行尺寸的转换

下面有已经爬取好的5种猫咪每个种类五百多张图片

在这里插入图片描述

爬虫代码

import requests
from lxml import etree
import time
from selenium.webdriver import Chrome
import os# 1.爬取网页
maomi=['德文''布偶''缅因''蓝猫''加菲''暹罗']
for page in maomi:web = Chrome()n = 1web.get('https://cn.bing.com/images/search?q={}&qs=n&form=QBIR&sp=-1&pq=jia%27fei%27m&sc=8-9&cvid=36F2A5142F944DF1921F45FB416B9E46&first=1&tsc=ImageBasicHover'.format(page+"猫"))# 2.分析网页,查找照片链接time.sleep(2)js="var q=document.documentElement.scrollTop=10000"web.maximize_window()time.sleep(2)for i in range(12):web.execute_script(js)time.sleep(2)response=html_source = web.page_sourcelst=etree.HTML(response)# 3.获取照片链接src=lst.xpath("//div[@class='img_cont hoff']/img/@src")for img_page in src:try:try:os.mkdir("猫咪/"+page);print("创建成功!")except:passwith open('猫咪/{}/壁纸{}.jpg'.format(page,n),'wb')as f:f.write(requests.get(img_page).content)print('下载壁纸第{}张完成!'.format(n))n+=1except Exception as e:print(e)print("网页访问失败!")web.quit()

尺寸转换代码

import os
from PIL import Image
import globdef convertImgSize(filename, outdir, width=128, height=128):img = Image.open(filename)try:new = img.resize((width, height), Image.BILINEAR)p = os.path.basename(filename)print(p)new.save(os.path.join(outdir, os.path.basename(filename)))except Exception as e:print(e)if __name__ == '__main__':# 查找给定路径下图片文件,并修改其大小maomi = ['德文''布偶''缅因''蓝猫''加菲''暹罗'] # 加菲for i in maomi:for filename in glob.glob(r'D:/pythonProject1/testurllib/猫咪/{}/*.jpg'.format(i)):print(filename)convertImgSize(filename,'D:/pythonProject1/testurllib/猫咪/{}1'.format(i))

不过如果有需要的朋友记得修改爬虫的路径

下载链接
点击去后github中的图片.zip


http://www.ppmy.cn/news/285280.html

相关文章

大脑神经网络图高清,图神经网络 图像

什么是全连接神经网络?怎么理解“全连接”? 1、全连接神经网络解析:对n-1层和n层而言,n-1层的任意一个节点,都和第n层所有节点有连接。即第n层的每个节点在进行计算的时候,激活函数的输入是n-1层所有节点的…

谷歌出品!机器学习常用术语总结

来源:比特小组,推荐人:杨佳达 转自:Datawhale 机器学习术语表 Google 官方出品的机器学习中英文术语对照表,列出了一般的机器学习术语和 TensorFlow 专用术语的定义。版权归谷歌,本公众号精心编译制作&…

猫鼠游戏之勒索病毒来袭

勒索病毒来袭 昨天夜间,全球近 100 个国家的计算机同时遭到了来自一款名为wana Decrypt0r 2.0 的勒索软件的攻击。几乎同时,国内各大高校中教育网中计算机也遭到了攻击,有不少学生朋友已经中招。中国各地许多高校学生突然发现自己电脑中了一…

C语言GDF中是什么作用,深度解密格力GDF-40X21C怎么样呢?质量好不好?真相揭秘必看...

这款格力(GREE)电饭煲电饭锅4L 智能预约触摸操控多功能电饭煲 家用大容量饭煲GDF-40X21C的确是不错的哟,做工还真挺细腻的,样式很不错,性价比蛮高的,外观多时尚的,整体看着相当大气,说实在话这款格力GDF-40…

家电三巨头的集体突围

中国家电行业,面临着新难关。 据《2022年中国家电行业一季度报告》显示,今年一季度,国内家电行业销售额1540亿元,同比下降12.3%。这主要源于上游供应端的原材料价格上涨,下游的零售端由于房地产市场萎靡、疫情等影响&…

Java第3章的抽象类小测验

1.( public abstract void add(); )正确声明了abstract方法。 2.在源程序中定义类B和类C,编译时得到的结果是( 能够成功编译类B和类C )。 abstract class B{ abstract void show(); } abstract class C ext…

(毕业设计资料)基于51单片机人体追踪智能电风扇控制系统

内容:人体追踪可控的电风扇,该电风扇应具有人体追踪,智能开关,智能调速的功能。 (1)了解单片机、传感器和电机的知识; (2)通过PWM调速的原理来实现风扇随着不同温度自动…

【P54】JMeter 生成概要结果(Generate Summary Results)

文章目录 一、生成概要结果(Generate Summary Results)参数说明二、准备工作三、测试计划设计 一、生成概要结果(Generate Summary Results)参数说明 可以将测试结果在客户端模式下输出,同时能美化压测输出的结果 使…