Python多线程爬取7160网站美女图片

news/2024/11/2 13:23:04/

直接上代码

#coding=UTF-8
from urllib.request import urlopen
from pyquery import PyQuery as pq
import re
import pymongo
import threading
client=pymongo.MongoClient(host='localhost',port=27017)
table=client.taobao.mutitry47160
lock=threading.Lock()
i = 1def save_to_mongo(result):try:if table.insert(result):print('存储到Mongo成功')except Exception:print('存储到Mongo失败',result)def download_son(Son_link,l):Sonson_link='https://www.7160.com'+Son_link+'index_'+str(l)+'.html'doc3=pq(Sonson_link,encoding='gbk')image_son=doc3('.picsbox.picsboxcenter p a img').attr('src')title_son=doc3('.picsbox.picsboxcenter p a img').attr('alt')product2={'image':image_son,'title':title_son}print(product2)save_to_mongo(product2)def father_link():lock.acquire()global ii += 1lock.release()url='https://www.7160.com/rentiyishu/list_1_'+str(i)+'.html'print('--------------------------------------'+str(i)+'--------------------------------------')doc=pq(url,encoding='gbk')items=doc('.news_bom-left li').items()for item in items:Son_link=item.find('a').attr('href')doc2=pq('https://www.7160.com'+Son_link,encoding='gbk')image_main=doc2('.picsbox.picsboxcenter p a img').attr('src')title_main=doc2('.picsbox.picsboxcenter p a img').attr('alt')product={'image':image_main,'title':title_main}save_to_mongo(product)#获取页码page_num=doc2('body > div > div.center > div.NEWS > div.picmainer > div.itempage > a:nth-child(1)').text()page_num=re.findall(r"\d+\.?\d*",page_num)try:page_num=int(page_num[0])print('共%d页,开始爬取'%page_num)for l in range(2,page_num+1):r1=threading.Thread(target=download_son,args=(Son_link,l))r1.start()except Exception:pass
def main():for i in range(1,108):t1=threading.Thread(target=father_link)t1.start()if __name__ == '__main__':main()

http://www.ppmy.cn/news/687771.html

相关文章

做一个美女图片大全那种的网站怎么提高网站流量?

摘要: 大家都看到了美女图片大全网站流量是很巨大的,但是不知道怎么入手。其实,百度图库很多是收录来自各个网站里的图片的,你只要在你的网站做好图片,或者在高权重的网站里发布带有你网站图片的内容就比较容易了。 在…

python爬虫实践之爬取美女图片

目录 概述 准备 所需模块 涉及知识点 运行效果 完成爬虫 1. 分析网页 2. 爬虫代码 概述 爬取妹子图网的美女图片。 准备 所需模块 timerequestslxml 涉及知识点 python基础requests模块基础xpath表达式基础 运行效果 控制台打印: 电脑本地文件&…

Python3 大型网络爬虫实战 003 — scrapy 大型静态图片网站爬虫项目实战 — 实战:爬取 169美女图片网 高清图片

原博文链接:http://www.aobosir.com/blog/2016/12/26/python3-large-web-crawler-169bb-com-HD-beautiful-pictures/ 开发环境观察网页 和 网页源代码写程序 下载高清图片 下载 169美女图片网 的所有西洋美女的图片防反爬技术搞定 开发环境 Python第三方库&#x…

爬取福利,搞了一堆美女图片,代码奉上,多张福利

点赞再看,养成习惯 目录 展示成果: 分析网站 总结下: 技术分析 注:图片下载可运行

ModaHub ——向量数据库Milvus特征向量和预写式日志教程

目录 特征向量 什么是特征向量 特征向量的优势 应用领域 预写式日志 数据可靠性 缓冲区设置 旧日志删除 特征向量 什么是特征向量 向量是具有一定大小和方向的量,可以简单理解为一串数字的集合,就像一行多列的矩阵,比如&#xff1a…

【骚操作】Python 教你无损提取视频中的美女图片

前言 人类都是视觉动物,不管是男生还是女生看到漂亮的小姐姐、小哥哥就想截图保存下来。可是截图会对画质会产生损耗,截取的 画面不规整,像素不高等问题。 用 Python 写一个逐帧无损保存视频画面的小脚本大致可以分为三个步骤: …

花瓣网爬取美女图片 每次20张

现在是晚上11点40了,今天是第一天学习爬虫知识,初学者,只是很大概的接触Python的语法,所以今天一下午加晚上学的挺累的。 遇到第一个问题就是Python脚本运行出现语法错误:IndentationError: unindent does not match …

用python爬虫爬取海量高清美女图片,亲测2021年12月20日可用,适合初学者

因为近期在自学python,想着先通过一些项目提升对这个编程语言的兴趣,而且爬虫也是python中对基本功要求较低的项目,就根据所学内容编写了一个爬虫项目爬取某网站的图片。温馨提示:爬虫学得好,牢饭吃到饱,学…