2024 一键批量下载微博内容/图片/视频/评论/转发数据,导出excel和pdf

news/2024/9/19 18:08:27/ 标签: excel, pdf

以李健的微博为例,抓取2010-2024年所有的微博数据excel,包含微博链接,微博内容,发布时间,点赞数,转发数,评论数,话题等。

每个月的微博转评赞总数曲线,2015年是高峰。

微博原创与转发量曲线,2013年大量转发。

平常主要用iPad和网页版发微博。

微博内容生成的词云图效果:

抓取微博评论以这条微博为例 2024 批量下载微博内容/图片/视频/评论/转发数据,导出excelpdf

这条微博下5000多条评论微博图床又搞事情不能用了,盘它,我顺便写了个微博图片/视频/内容/文章批量下载工具 ,导出的excel数据包含微博昵称,微博uid,评论时间,评论内容,评论地区,回复数,点赞数等,大家都在义愤填膺的声讨狗主人。

来自广东的评论最多:

还有抓取微博转发,以这条微博为例 ,抓取的4000多条转发微博excel数据,包含微博昵称,微博uid,转发时间,转发地区,转发来源,转发内容,点赞数,转发数,评论数等。

来自江苏的转发最多:

用iPhone客户端转发的微博最多:

转发微博生成的词云图:

顺便再说下新浪博客下载GitHub - junyiz/dature: 新浪博客批量备份工具 ,以古天乐的新浪博客为例,没想到他居然是日更博客,从2008年一直更新到2024年,近6000条博客。

打开命令行执行 dature.cmd -u 1191258123 -c "cookie"

导出的效果如图,左侧为文章标题,右侧为文章内容:

我的知识星球

2023 更新版:苏生不惑开发过的那些原创工具和脚本

再次更新:2023批量下载公众号文章内容/话题/图片/封面/视频/音频,导出文章pdf,文章数据含阅读数/点赞数/在看数/留言数

微博图床又搞事情不能用了,盘它,我顺便写了个微博图片/视频/内容/文章批量下载工具

再次更新,2024 批量下载知乎回答/文章/想法/专栏/视频导出 excelpdf

2024批量下载公众号文章内容/话题/图片/封面/视频/音频,导出excelpdf,文章数据包含阅读数/点赞数/分享数/留言数


http://www.ppmy.cn/news/1462733.html

相关文章

opencv--形态学(开运算、闭运算、形态学梯度、顶帽、黑帽)

开运算 先腐蚀再膨胀,消除细小点、毛刺、连接点等等情况 闭运算 先膨胀再腐蚀,填充孔洞、增强连接点等等情况,或者大家说的增加明亮度 形态学梯度 使用膨胀的图减去腐蚀的图,简单理解就是二值化后形状膨胀后会使得物体变大&am…

APP广告变现怎么实现的,背后逻辑是什么?

广告变现的实现主要基于以下几个关键步骤和逻辑: 用户获取与留存:首先,APP需要吸引足够的用户并确保他们的留存率。只有拥有庞大且活跃的用户基础,APP才能吸引广告商投放广告。因此,开发者需要通过优化APP质量、提升用…

[实例] Unity Shader 逐像素漫反射与半兰伯特光照

漫反射光照是Unity中最基本最简单的光照模型,本篇将会介绍在片元着色器中实现反射效果,并会采用半兰伯特光照技术对其进行改进。 1. 逐顶点光照与逐像素光照 在Unity Shader中,我们可以有两个地方可以用来计算光照:在顶点着色器…

后端雪花算法主键ID传到前端变了

Mybatis Plus 的主键策略: /*** id*/TableId(type IdType.ASSIGN_ID)private Long id; 这个主键策略会用雪花算法生成一个 19位的ID,比如 1791006670084734978 现象 后端生成的 id 是正常的,通过 swagger 文档此时获取到的 id 也和数据库中…

GitHub的原理及应用详解(四)

本系列文章简介: GitHub是一个基于Git版本控制系统的代码托管平台,为开发者提供了一个方便的协作和版本管理的工具。它广泛应用于软件开发项目中,包括但不限于代码托管、协作开发、版本控制、错误追踪、持续集成等方面。 GitHub的原理可以简单…

RabbitMQ(二)七种工作模式

文章目录 概述:工作模式(七种)1. "Hello World!"2. Work Queues(工作队列模式)3. Publish/Subscribe(发布订阅模式)4. Routing5. Topics6. RPC7. Publisher Confirms 详细1. "Hello World!&…

哈醉咯最狠

3、通过命令行安装aptitude sudo apt-get install aptitude4、通过命令行利用aptitude 安装fcitx、qtsudo aptitude install fcitx-bin fcitx-table fcitx-config-gtk fcitx-config-gtk2 fcitx-frontend-allsudo aptitude install qt5-default qtcreator qml-module-qtquick-co…

Linux(centos)常用命令

Linux(Centos)常用命令使用说明文档 切换到/home目录下 使用cd命令切换目录,例如: cd /home列出/home目录下的所有文件 使用ls命令列出目录下的文件和子目录,例如: ls /home新建目录dir1 使用mkdir命…

Linux数组

目录 一.概念 (一)什么是数组? (二)数组的表现方式 (三)数组的数据类型 二.运用数组查看、修改、删除相关信息 (1)查看数组的元素列表 (2)查…

物联网应用开发--STM32与机智云通信(ESP8266 Wi-Fi+手机APP+LED+蜂鸣器+SHT20温湿度传感器)

实现目标 1、熟悉机智云平台,会下载APP 2、熟悉新云平台创建产品,项目虚拟调试 3、掌握云平台生成MCU代码,并移植。机智云透传固件的下载 4、具体目标:(1)注册机智云平台;(2&…

自动驾驶---Tesla的自动驾驶技术进化史(PerceptionPlanning)

1 前言 笔者在专栏《自动驾驶Planning模块》中已经详细讲解了传统自动驾驶Planning模块的内容:包括行车的Behavior Planning和Motion Planning,以及低速记忆泊车的Planning(最开始有15篇,目前逐渐更新到17篇)。读者对整…

【微信小程序开发】小程序前后端交互--发送网络请求实战解析

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,…

python写的五个小游戏___浔川python社

一: 猜词游戏 # 猜词游戏 import random words [apple, , orange, pear] word random.choice(words) mixed_word list(word) random.shuffle(mixed_word) mixed_word .join(mixed_word) print(猜词游戏开始!) print(打乱后的词是:, mixed_word) while True:gue…

Android 屏保开关

设置-显示-屏保, 打开关闭 设置代码在 ./packages/apps/Settings/src/com/android/settings/dream/DreamMainSwitchPreferenceController.java , Overridepublic boolean isChecked() {return mBackend.isEnabled();}Overridepublic boolean setChecke…

[Vulnhub] KVM3 (ht编辑器权限提升)

Vulnhub 报告 信息获取 系统 IP:192.168.8.100 服务枚举 Server IP AddressPorts Open192.168.8.100TCP 22,80 使用 Nmap 扫描: $ nmap -p- -sV -sC 192.168.8.100 --min-rate 1000 结果: Starting Nmap 7.94SVN ( https://nmap.org ) at 2024-05-18 04:35 EDT Nmap sc…

Python | Leetcode Python题解之第110题平衡二叉树

题目: 题解: class Solution:def isBalanced(self, root: TreeNode) -> bool:def height(root: TreeNode) -> int:if not root:return 0leftHeight height(root.left)rightHeight height(root.right)if leftHeight -1 or rightHeight -1 or a…

Softing工业将亮相2024年阿赫玛展会——提供过程自动化的连接解决方案

您可于2024年6月10日至14日前往美因河畔法兰克福11.0号馆,Softing将在C25展位展出,欢迎莅临! 作为工业应用中数据交换领域公认的专家,Softing工业致力于帮助各行各业的客户部署网络自动化和优化生产流程。 使用Softing产品&…

JVM学习-堆空间(二)

年轻代与老年代 存储在JVM中的Java对象被划分为两类 一类是生命周期较短的瞬时对象,这类对象的创建和消亡都非常迅速一类对象的生命周期很长,在某些极端情况下还能够与JVM的生命周期保持一致 Java堆区进一步细分的话,分为年轻代(YoungGen)和…

hcip—VLAN实验

目录 实验拓扑: 实验目的: 实验思路: 实验步骤: 1.创建VLAN 2.将接口放进相应VLAN当中,并配置接口类型(hybrid口配置撕tag表) 3.配置路由器接口 4.配置DHCP服务 pc1 ping pc4的过程分析…