开源项目推荐 【SkyEyeSystem】

news/2024/11/17 0:31:59/

大家好,今天向大家推荐一个开源项目——SkyEyeSystem。

这是一个基于Spring Boot的全网热点爬虫项目,旨在提供全面而准确的全网热搜数据。

关于项目

SkyEyeSystem通过定时任务间隔10min爬取全网热搜数据。目前包括的平台有:

  • 微博热搜
  • B站热搜
  • CSDN热搜
  • 知乎热搜
  • 今日头条
  • 百度热搜
  • 掘金
  • 36氪
  • 腾讯新闻
  • 少数派等。

在获取到数据后

SkyEyeSystem会将原始数据存入MySQL

进行词频统计后存入Redis,

以便开发者们能够更方便地分析和利用这些热搜数据。

同时会以页面的形式展示出所有平台的数据。

页面

自定义爬虫平台

当然 也可以自定义自己希望爬取的平台,作者提供了非常清晰的教程,只需要提供对应的平台类,自定义处理爬虫逻辑即可。

  1. 首先在 平台表 hot_platform 中新增对应对平台记录。举例如下。
INSERT INTO sky_eye_system.hot_platform 
VALUES (2, '微博','https://ts3.cn.mm.bing.net/th?id=ODLS.05d45f55-2151-4d66-83e5-d10018607094&w=32&h=32&qlt=90&pcl=fffffa&o=6&pid=1.2','随时随地发现新鲜事!微博带你欣赏世界上每一个精彩瞬间,了解每一个幕后故事。分享你想表达的,让全世界都能听到你的心声!','https://weibo.com', '随时随地发现新鲜事!', '王志东', null, null, 0);
  1. 在 [src/main/java/cn/shoxiongdu/SkyEyeSystem/task/hotspot/crawl/impl] 下新增对应的平台类,并实现接口 HotDataCrawler
public class XXXCrawler implements HotDataCrawler {// 平台表中的id private static final Long PLATFORM_ID = ${platformId};private PlatformMapper platformMapper;@Overridepublic List<HotSpot> crawlHotSpotData() {// 执行自定义爬虫逻辑 返回的HotSpot列表。return hotSpotList;}@Overridepublic Platform getPlatform() {return platformMapper.selectById(PLATFORM_ID);}
}
  1. 实现crawlHotSpotData方法,执行自定义的数据爬取逻辑,将爬取的数据封装为HotSpot的List并返回。

  2. 将常量PLATFORM_ID的值改为您的对应的平台表中的id。

  3. 将实现类添加到Spring容器中。( @Component/@Service )

  4. 完成。此时,定时任务会执行您的爬取逻辑并入库。同时首页会展示相对应的数据。

项目地址

https://github.com/shaoxiongdu/SkyEye


http://www.ppmy.cn/news/754223.html

相关文章

【Redis】缓存穿透、缓存击穿、缓存雪崩的原因及解决方案

文章目录 一、缓存穿透1.1 产生原因1.2 解决方法接口校验对空值进行缓存使用布隆过滤器实时监控 二、缓存雪崩2.2 解决方法将失效时间分散开给业务添加多级缓存构建缓存高可用集群使用锁或者队列的方式设置缓存标记 三、缓存击穿3.2 解决方法使用互斥锁”提前“使用互斥锁 / 逻…

电商扣减库存_电商后台产品经理宝典

作者:清水红牙搬运 by A小蚊子丨ID:xiaowenzileyuan想了解更多,欢迎关注公众号“A小蚊子(xiaowenzileyuan)”,更多精彩内容、知识大礼包等你发现。欢迎将此文分享给更多朋友,大家共同精进电商架构 电商架构(图电商核心模块(图商品中心 管理SKU:最小库存单位管理SPU:…

Kotlin之类型系统

Kotlin之类型系统 可空类型 在任何类型后加“?”表示该变量可为空。val a: Int? null。 安全的调用 使用“?.”进行安全调用。实现方式&#xff1a;仍旧使用if判空。student?.name。 合并运算符 使用“?:”运算符。 val result a ?: 1 非空断言 使用“!!”操作…

是德频谱仪N9020A维修报错维修-安泰维修

近期&#xff0c;有客户送来一台是德N9020A频谱仪&#xff0c;故障表现为报错。工程师接到仪器后&#xff0c;对其进行故障检测。 经过工程师检查后&#xff0c;开机发现自检失败&#xff0c;报错LO Unlock&#xff0c;无基线。 经检测&#xff0c;仪器前端板损坏&#xff0c;造…

【维修类别】

需求分析 维修类别功能界面如下&#xff1a; 维修类别大致就是故障种类&#xff0c;它是丛属班组的&#xff0c;目前系统中在用的班组只有两个【电仪和设备】 除了从属于班组&#xff0c;维修类别还和具体的设备种类有关&#xff0c;&#xff08;比如加弹机&#xff0c;染色机…

维修行业迫切需要O2O?“报修一站通”寻遍上海为各类水货、无主、超保产品对接维修网点

以下文章转自 36氪 http://www.36kr.com/p/205702.html&#xff0c; 同时也可以向一直关心我的朋友解释下过去一年多我的去向。&#xff1a;&#xff09; 城市发展给我们带来了现代化的生活&#xff0c;同时也带来了某些不便。过去手机坏了、冰箱需要加氟时&#xff0c;一出家…

售后服务系统预约工单方便客户报修?

随着生活水平的不断提高&#xff0c;人们的生活方式也在发生着改变&#xff0c;越来越多人喜欢使用电脑或者手机等数码产品。而当遇到故障需要维修的时候&#xff0c;许多人都是通过电话或者网上联系相关维修公司&#xff0c;但因为缺乏经验和能力&#xff0c;有时因为遇到故障…

免费4s店汽车保养维修记录查询的方式

二手车已经越来越多的走进大家的视野&#xff0c;年轻人也不局限于购买新车&#xff0c;反而对性价比更高的二手车情有独钟。那么二手车和汽车4S维修保养记录有什么关系呢&#xff1f;我作为一个多年经验的二手车商来和大家透露一点小秘密。下图&#xff0c;一般的保养记录差不…