花瓣网爬取美女图片 每次20张

news/2024/11/2 15:29:54/

现在是晚上11点40了,今天是第一天学习爬虫知识,初学者,只是很大概的接触Python的语法,所以今天一下午加晚上学的挺累的。
遇到第一个问题就是Python脚本运行出现语法错误:IndentationError: unindent does not match any outer indentation level
然后一直找原因 卡在这里好几个小时 最后发现平常我的个人习惯是换行后敲三个空格 然后Sublime的换行习惯是Tab键 无意中发现的 这个可能是自己摸索学习最大的困难了吧,对于明白人一瞬间的事情,我们需要好久好久。
第二个就是看了下if name == “main“:的用法就是 作为一个模块使用的时候 不引用这个语句块
第三个就是多线程 threading的使用:myThread(threading.Thread)
最后就是JSON的loads和dumps的使用:一个是把字符串转换为字典,一个是把字典转换为字符串。

#/usr/bin/env python
#coding:utf-8import json
import urllib.request
import threading
#导入需要的JSON ,urllib及threading
#定义一个类
class myThread(threading.Thread):def __init__(self,imgurl,filename):threading.Thread.__init__(self)self.imgurl = imgurlself.filename = filenamedef run(self):print ('downloading: ' + self.imgurl)downfile(self.imgurl,self.filename)
#定义一个下载程序
def downfile(imgurl , filename):img_req = urllib.request.Request(imgurl)opener = urllib.request.build_opener()img_resp = opener.open(img_req)try:out = open(filename,'wb')out.write(img_resp.read())out.flush()out.close()except:print('error')if __name__ == "__main__":surl = 'http://huaban.com/pins/1821121555/?jlb0k0ki'#需要爬取的花瓣网美女图片地址hb = urllib.request.Request(surl)#按XHLHttprequest方式请求hb.add_header('X-Requested-With','XMLHttpRequest' )#模拟win10 chrome 浏览器hb.add_header('User-Agent','Mozilla/5.0 (Windows NT 6.1; WOW64; rv:53.0) Gecko/20100101 Firefox/53.0')html = urllib.request.urlopen(hb).read()obj = json.loads( html )#print (obj['pin']['board']['pins'])imgs = obj['pin']['board']['pins']#花瓣网图片需要的网址头preurl = 'http://img.hb.aicdn.com/'for img in imgs :imgurl = preurl + img['file']['key']#print (imgurl)myThread(imgurl,img['file']['key'] + '.jpg').start()

http://www.ppmy.cn/news/687764.html

相关文章

用python爬虫爬取海量高清美女图片,亲测2021年12月20日可用,适合初学者

因为近期在自学python,想着先通过一些项目提升对这个编程语言的兴趣,而且爬虫也是python中对基本功要求较低的项目,就根据所学内容编写了一个爬虫项目爬取某网站的图片。温馨提示:爬虫学得好,牢饭吃到饱,学…

Java爬虫-使用爬虫下载千张美女图片!

目的 爬取搜狗图片上千张美女图片并下载到本地 准备工作 爬取地址:https://pic.sogou.com/pics?query%E7%BE%8E%E5%A5%B3 分析 打开上面的地址,按F12开发者工具 - NetWork - XHR - 页面往下滑动XHR栏出现请求信息如下: Request URL &a…

手把手带你爬取百度美女图片,Python练手项目!

本文纯技术角度出发,教你如何用Python爬虫获取百度美女图片——技术无罪。 目标站点 百度图片使用关键字搜索 小姐姐私房照 https://image.baidu.com/开发环境 系统:Windows10 64位Python版本:Python3.6.5(Python3以上版本即可)IDE&#…

vuex-persistedstate —— 数据持久化

在之前的篇目当中对于 Vuex 中的相关内容都讲得差不多,但是在项目中去使用vuex,虽然数据状态得到管理了,但数据在每一次都需要去重新加载,那么对于数据的持久化vue是没有给解决的,而是通过第三方的工具去进行数据的持久…

【20220819】文献翻译——Deephase:周期性自编码器学习运动相位流形

Deephase:周期性自编码器学习运动相位流形 1. 简介2. 相关工作3. 周期性自动编码器3.1 网络结构3.2 相位流形3.3 网络训练 4. 运动控制器4.1 神经运动控制器4.2 运动匹配 5 实验和评估5.1 学习到的相位流形5.2 神经网络的运动合成5.3 评估 6. 讨论7. 局限性8. 结论和…

HTTP 415

描述 在使用Easy-UI框架请求表单数据的UPDATE操作的时候,报了如下入错:General Request URL: http://localhost:8280/device/instrument/v1/register Request Method: POST Status Code: 415 Remote Address: [::1]:8280 Referrer Policy: no-referrer…

【系统架构】第六章-数据库设计基础知识(数据库设计)

软考-系统架构设计师知识点提炼-系统架构设计师教程(第2版) 第一章-绪论第二章-计算机系统基础知识(一)第二章-计算机系统基础知识(二)第三章-信息系统基础知识第四章-信息安全技术基础知识第五章-软件工程…

python log函数

python log函数 语法: import math math.log(x[, base])注意:log()是不能直接访问的,需要导入 math 模块,通过静态对象调用该方法。 参数: x : 数值表达式base :可选,底数,默认为e 实例 i…