【暗恋不可耻但无用】QQ空间爬虫-Java版(jzone-crawler)

news/2024/10/31 3:27:58/

完整原文(含源码):Github
(转载请注明出处,仅供分享学习,严禁用于商业用途)


声明

  • 在你心中是否有一个默默关注的小姐姐?
  • 你是否想知道在遇见她之前在她身边的一切?
  • 确认过眼神,让你总在对的时间遇上对的人

  • 写这个插件纯粹是出于学习目的,此博文主要作用是功能展示
  • 之后**会围绕这个插件,写一个系列的爬虫教程**
  • 请勿使用此软件做不可描述的事情
  • 未经允许禁止出于商用目的使用此插件,违者列入授权黑名单并公开示众,所带来的一切后果自负

运行环境


软件介绍

此插件主要用于QQ空间,主要功能包括:

  • 模拟QQ登陆
  • 爬取目标QQ空间的【相册数据】,根据相册专辑分类,自动下载高清原图、以及图片描述等
  • 爬取目标QQ空间的【说说数据】,根据说说页数分类,自动下载高清原图、以及说说内容等
  • 自动整理所下载的【相册/说说数据】
  • 支持两种爬取数据的模式:
      【xhr】 默认模式,用于发布版,爬取速度快,但QQ空间协议经常变动,需定期更新协议避免失效
      【selenium-phantomjs】 仿真模式,仅限开发版,爬取速度慢,但能确保在QQ空间协议变动不大时依然有效

运行界面展示

※ 登陆界面
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-XjRbVecJ-1578219531775)(https://raw.githubusercontent.com/lyy289065406/jzone-crawler/master/doc/%E8%BF%90%E8%A1%8C%E6%88%AA%E5%9B%BE/01-%E7%99%BB%E9%99%86QQ%E7%A9%BA%E9%97%B4.png)]


※ 爬取QQ空间相册
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-mzEGnnfQ-1578219531776)(https://raw.githubusercontent.com/lyy289065406/jzone-crawler/master/doc/%E8%BF%90%E8%A1%8C%E6%88%AA%E5%9B%BE/02-%E7%88%AC%E5%8F%96QQ%E7%A9%BA%E9%97%B4%E7%9B%B8%E5%86%8C.png)]


※ 爬取QQ空间说说
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ApM7u3q9-1578219531776)(https://raw.githubusercontent.com/lyy289065406/jzone-crawler/master/doc/%E8%BF%90%E8%A1%8C%E6%88%AA%E5%9B%BE/03-%E7%88%AC%E5%8F%96QQ%E7%A9%BA%E9%97%B4%E8%AF%B4%E8%AF%B4.png)]


※ 分类整理所下载的图文数据
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-5NeqHtuu-1578219531776)(https://raw.githubusercontent.com/lyy289065406/jzone-crawler/master/doc/%E8%BF%90%E8%A1%8C%E6%88%AA%E5%9B%BE/04-%E6%95%B0%E6%8D%AE%E5%AD%98%E5%82%A8%E7%9B%AE%E5%BD%95%E7%BB%93%E6%9E%84.png)]


安装与使用

  • 01. 安装JDK环境【jdk-7u72-windows-x64.exe】,一直 下一步 到完成即可(无需修改安装路径)
  • 02. 解压并运行【QQ空间爬虫.exe】
  • 03. 选择【爬取相册数据】或【爬取说说数据】即可自动批量下载 图片及其相关信息
  • 04. 所下载的数据会自动整理到程序根目录下的 data 文件夹:
      ○ 不同的QQ空间数据,存储在对应的 [QQ号文件夹] 内
      ○ [album] 文件夹下保存了目标QQ的每一个相册(非加密相册)的 [相册信息]、[照片]、[照片信息]
      ○ [mood] 文件夹下保存了目标QQ的所有说说的 [图文信息]
      ○ [mood/content] 文件夹根据页数保存了该页内所有说说的 [图文信息]
      ○ [mood/photos] 文件夹汇总了所有说说的图片

注:
 此程序需要授权才能使用(防止恶意使用),请加QQ群209442488申请
 此程序不包含盗号后门,若不放心请勿使用
 此程序不包含破解功能,请确保登陆的QQ号有访问对方QQ空间和相册的权限


升级记录


v2.2版本 (2018-09-15) :

  • 01. 更新软件授权通道为SSL协议
  • 02. 修正因QQ空间升级导致xhr协议失效问题


v2.1版本 (2018-08-06) :

  • 01. 修正软件授权校验接口


v2.0版本 (2018-05-27) :

  • 01. 增加自动升级功能


v1.1版本 (2018-05-26) :

  • 01. 相册爬取
  • 02. 优化相册和说说的爬取模式为XHR
  • 03. 同时支持前后端爬虫
  • 04. 增加软件授权校验


v1.0版本 (2016-06-09) :

  • 01. 支持说说图文爬取

版权声明

Copyright (C) 2016-2018 By EXP License: GPL v3

  • Site: http://exp-blog.com
  • Mail: 289065406@qq.com


http://www.ppmy.cn/news/266977.html

相关文章

文件权限管理

1 文件权限概念 文件权限就是文件的访问控制权限,即哪些用户和组群可以访问文件以及可以执行什么样的操作。 Unix/Linux系统是一个典型的多用户系统,不同的用户处于不同的地位,对文件和目录有不同的访问权限。为了保护系统的安全性&#xf…

【超详细】QQ空间说说爬取教程(看看你的女神在想什么~

【超详细】QQ空间说说爬取教程 文章目录 【超详细】QQ空间说说爬取教程环境selenium模拟登录说说内容获取破解g_tk 说说的评论获取说说的点赞人获取url参数构成 好友列表获取数据库的存储如何加速ps 暑假闲来无事,研究了一下QQ空间的爬取,以下是一些记录…

【暗恋不可耻但无用】QQ空间爬虫-Python版(pyzone-crawler)

完整原文(含源码):Github (转载请注明出处,仅供分享学习,严禁用于商业用途) 声明 在你心中是否有一个默默关注的小姐姐?你是否想知道在遇见她之前在她身边的一切?确认过…

java实现QQ空间日志列表获取

可以下载任意QQ用户的日志&#xff0c;以html文档形势保存。&#xff08;该用户必须开放所有用户访问权限&#xff09; 效果如图&#xff1a; /*** 日志下载修正版核心功能类* * author wensefu.jerry.Ling<br/>* wrote on 2011-1-26*/public class Kernel {pri…

ipv6无网络访问权限可行解决方案

原文地址&#xff1a;http://www.xitongtiandi.net/wenzhang/win10/12654.html Win10专业版下ipv6无网络访问权限解决方案&#xff08;只在win10专业版下做了测试&#xff0c;win7和win8.1待测试&#xff09; 1、首先打开 https://support.microsoft.com/en-us/kb/929852 选择…

QQ空间爬虫分享(2016年11月18日更新)

前言&#xff1a; 上一篇文章&#xff1a;《QQ空间爬虫分享&#xff08;一天可抓取 400 万条数据&#xff09;》 Github地址&#xff1a;QQSpider Q群讨论&#xff1a; 很抱歉QQSpider这个爬虫过了这么久才作更新&#xff0c;同时也很感谢各位同学的肯定和支持&#xff01;…

公开说说别人看不到_空间设置了权限说说所有人可见

说说设置为所有人可见,但是空间设置有权限的人才可进,那说说是不是所有人可以见? 不是,有权限的人才可以看到,因为说说设置的所有可见是针对可以访问你空间的所有人,不是说别人也可以看到 空间说说怎么设置所有人可见 1、登录QQ空间,进入QQ空间主页面2、把鼠标放在说说的…

html显示空间图片,qq空间显示不出来 为什么QQ空间有些图片显示不了

为什么QQ空间发表的说说 别人看不到 怎么显示不出详情请查看视频回答 QQ空间图标为什么显示不出来 是不是隐藏掉了 你点自己的资料 点图标最右边的图片管理看看 或者 你根本就没申请Q空间 点你自己资料的灰暗的空间图标申请一下把 我可以打开QQ空间&#xff0c;而且一进去的个人…