完整原文(含源码):Github
(转载请注明出处,仅供分享学习,严禁用于商业用途)
声明
- 在你心中是否有一个默默关注的小姐姐?
- 你是否想知道在遇见她之前在她身边的一切?
- 确认过眼神,让你总在对的时间遇上对的人
- 写这个插件纯粹是出于学习目的,此博文主要作用是功能展示
- 之后**会围绕这个插件,写一个系列的爬虫教程**
- 请勿使用此软件做不可描述的事情
- 未经允许禁止出于商用目的使用此插件,违者列入授权黑名单并公开示众,所带来的一切后果自负
运行环境
软件介绍
此插件主要用于QQ空间,主要功能包括:
- 模拟QQ登陆
- 爬取目标QQ空间的【相册数据】,根据相册专辑分类,自动下载高清原图、以及图片描述等
- 爬取目标QQ空间的【说说数据】,根据说说页数分类,自动下载高清原图、以及说说内容等
- 自动整理所下载的【相册/说说数据】
运行界面展示
※ 登陆QQ空间
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-kcAUgzzl-1578219482733)(https://raw.githubusercontent.com/lyy289065406/pyzone-crawler/master/doc/%E8%BF%90%E8%A1%8C%E6%88%AA%E5%9B%BE/01-%E7%99%BB%E9%99%86QQ%E7%A9%BA%E9%97%B4.png)]
※ 爬取QQ空间相册
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-rtMROaoj-1578219482733)(https://raw.githubusercontent.com/lyy289065406/pyzone-crawler/master/doc/%E8%BF%90%E8%A1%8C%E6%88%AA%E5%9B%BE/02-%E7%88%AC%E5%8F%96QQ%E7%A9%BA%E9%97%B4%E7%9B%B8%E5%86%8C.png)]
※ 爬取QQ空间说说
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-SnFU3beL-1578219482733)(https://raw.githubusercontent.com/lyy289065406/pyzone-crawler/master/doc/%E8%BF%90%E8%A1%8C%E6%88%AA%E5%9B%BE/03-%E7%88%AC%E5%8F%96QQ%E7%A9%BA%E9%97%B4%E8%AF%B4%E8%AF%B4.png)]
※ 分类整理所下载的图文数据
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-v9Iqi7Z2-1578219482734)(https://raw.githubusercontent.com/lyy289065406/pyzone-crawler/master/doc/%E8%BF%90%E8%A1%8C%E6%88%AA%E5%9B%BE/04-%E6%95%B0%E6%8D%AE%E5%AD%98%E5%82%A8%E7%9B%AE%E5%BD%95%E7%BB%93%E6%9E%84.png)]
安装与使用
- 01. 安装Python环境【python-3.5.2-amd64.exe】
- 02. 导入
pyzone-crawler
项目源码并运行 - 03. 根据命令行提示,选择【爬取相册数据】或【爬取说说数据】,即可自动批量下载
图片及其相关信息
- 04. 所下载的数据会自动整理到程序根目录下的
data
文件夹:
○ 不同的QQ空间数据,存储在对应的 [QQ号文件夹] 内
○ [album] 文件夹下保存了目标QQ的每一个相册(非加密相册)的 [相册信息]、[照片]、[照片信息]
○ [mood] 文件夹下保存了目标QQ的所有说说的 [图文信息]
○ [mood/content] 文件夹根据页数保存了该页内所有说说的 [图文信息]
○ [mood/photos] 文件夹汇总了所有说说的图片
注:
此程序需要授权才能使用(防止恶意使用),请加QQ群209442488申请
此程序不包含盗号后门,若不放心请勿使用
此程序不包含破解功能,请确保登陆的QQ号有访问对方QQ空间和相册的权限
升级记录
v1.1版本 (2018-09-15) :
- 01. 修正因QQ空间升级导致xhr协议失效问题
v1.0版本 (2018-05-26) :
- 01. 从Java平台移植
版权声明
- Site: http://exp-blog.com
- Mail: 289065406@qq.com