python爬图片_python爬虫(爬取图片)

news/2025/2/21 6:06:23/

python爬虫爬图片

爬虫爬校花网校花的图片

第一步

载入爬虫模块#载入爬虫模块

import re #载入爬虫模块

import requests #载入爬虫模块

第二步

获得校花网的地址,获得其网页F12内的所有东西#获得校花网的地址,获得其网页F12内的所有东西

import re #载入爬虫模块

import requests #载入爬虫模块

response = requests.get(f'http://www.xiaohuar.com/list-1-0.html')

data = response.text #data就是我们要的校花F12里的东西啦,并用字符串格式保存

第三步

获得校花网的地址,图片的链接#获得校花网的地址,图片的链接

import re #载入爬虫模块

import requests #载入爬虫模块

response = requests.get(f'http://www.xiaohuar.com/list-1-0.html')

data = response.text #data就是我们要的校花F12里的东西啦,并用字符串格式保存

one_list = re.findall('" src="(.*?)" />',data) #其中(.*?)表示我们所要获得的内容

for v in range(len(one_list)): #type:str 这是为了让PYCHARM更快的知道V是字符串格式方便导入内置方法

if one_list[v].startswith('/d'): #这是为了让其中有些保护的图片变成正确的超链接格式

one_list[v] = f'http://www.xiaohuar.com/{one_list[v]}'

第四步

创建文件保存下来#获得校花网的地址,图片的链接

import re #载入爬虫模块

import requests #载入爬虫模块

response = requests.get(f'http://www.xiaohuar.com/list-1-0.html')

data = response.text #data就是我们要的校花F12里的东西啦,并用字符串格式保存

one_list = re.findall('" src="(.*?)" />',data) #其中(.*?)表示我们所要获得的内容

for v in range(len(one_list)): #type:str 这是为了让PYCHARM更快的知道V是字符串格式方便导入内置方法

if one_list[v].startswith('/d'): #这是为了让其中有些保护的图片变成正确的超链接格式

one_list[v] = f'http://www.xiaohuar.com/{one_list[v]}'

for x in one_list: #type:str

name = x.split('/')[-1] #为了自动生成文件名

dd = requests.get(x) #获得图片的信息

dd = dd.content #图片信息装换成机械语言

with open(f'D:\图片\{name}','wb') as fw: #创建文件的路径 , 写入保存

fw.write(dd)

fw.flush()

第五步

获得校花网下一页中的所有能让并且每获取一张打印一次import re #模块

import requests #模块

num = 0 #为了记录爬的照片的次数

for url_name in range(44):

response = requests.get(f'http://www.xiaohuar.com/list-1-{url_name}.html')

data = response.text

# print(data)

one_list = re.findall('" src="(.*?)" />',data)

for v in range(len(one_list)): #type:str

if one_list[v].startswith('/d'):

one_list[v] = f'http://www.xiaohuar.com/{one_list[v]}'

for x in one_list: #type:str

name = x.split('/')[-1]

dd = requests.get(x)

dd = dd.content

with open(f'D:\图片\{name}','wb') as fw:

fw.write(dd)

fw.flush()

num += 1

print(f'爬取{num}张')


http://www.ppmy.cn/news/438758.html

相关文章

迁移学习CNN图像分类模型 - 花朵图片分类

训练一个好的卷积神经网络模型进行图像分类不仅需要计算资源还需要很长的时间。特别是模型比较复杂和数据量比较大的时候。普通的电脑动不动就需要训练几天的时间。为了能够快速地训练好自己的花朵图片分类器,我们可以使用别人已经训练好的模型参数,在此…

通过 Tensorflow 的基础类,构建卷积神经网络,用于花朵图片的分类

实验目的 通过 Tensorflow 的基础类,构建卷积神经网络,用于花朵图片的分类。 实验环境 import tensorflow as tfprint(tf.__version__)output: 2.3.0 实验步骤 (一) 数据获取和预处理 1.1 数据选择 TensorFlow 官方提供的花朵…

CNN实现花卉图片分类识别

CNN实现花卉图片分 前言 本文为一个利用卷积神经网络实现花卉分类的项目,因此不会过多介绍卷积神经网络的基本知识。此项目建立在了解卷积神经网络进行图像分类的原理上进行的。 项目简介 本项目为一个图像识别项目,基于tensorflow,利用C…

抓取花卉图片

对比用request抓取而言,使用selenium库会更简便抓取 话不多说现在开始: 首先我们要配置一下chromedriver: 1、chromedirver 下载网站https://registry.npmmirror.com/binary.html?pathchromedriver/下载与自己对应的谷歌版本 查看谷歌版本 如我自己…

调试厉器addr2line

addr2line: 将地址转换为文件名和行号的命令行工具 在C/C程序的调试过程中,我们通常会使用调试器(如GDB)来定位崩溃或错误的位置。但有时候,我们可能只能获得程序崩溃时的地址,而没有调试器的支持。这时候&#xff0c…

如保查看wifi无线的mac地址

使用命令行,运行ipconfig /all 前提是保证无线网卡未被禁用。 找到无线局域网的物理地址。 以太网的特理地址,是网卡的mac地址。

查看wifi连接路由器的MAC地址

windows连接wifi ,通过cmd运行如下命令,查看 netsh wlan show networks modebssid

更改WLAN的IP地址

网络【右键】–>打开“网络和internet”设置【左键】–>高级网络设置–>更改适配器选项【左键】–>WLAN【右键】–>属性【左键】–>internet协议版本4(TCP/IPV4)【左键双击】–>更改IP地址和DNS服务器–>【确定】