AGI系列(8)零门槛信息抓取利器打造,免费自动化抓取推特上的热点内容

embedded/2024/9/23 1:49:24/

应该大家都或多或少的听说过 X/Twitter。它可不只是个普通的社交平台!它还是个信息宝库,里面有各种有趣的内容,比如:想知道最新热点?想和全世界的人聊天?Twitter都能搞定!它的搜索功能特别厉害,你想找什么主题、趋势或者人,分分钟就能搞定。

不过,面对这么多信息,怎么找到真正有用的东西,这可是个大问题。

要玩转Twitter,你得学点小技巧。比如用高级搜索,关注热门话题标签,关注一些厉害的人,还可以用一些工具来帮你整理信息。这样一来,你就能从Twitter这个信息海洋里淘到金子了!不管你是想做市场调研,还是想了解最新趋势,或者就是想学点新知识,Twitter都能帮到你。

那么问题来了,我们到底该怎么从Twitter上挖掘出有价值的信息呢?这个问题值得我们好好研究一下!

【阅读本文,你能学到什么】

Tweet Hunter Agent 介绍

Tweet Hunter 是在 COZE 中搭建的一个智能体机器人。它可以根据用户输入的内容解析出来关键词,并根据这个关键词去做高级搜索,返回该关键词下面最新的,点赞数超过 50 的推特内容,并通过大模型二次整理并返回出来。

用到的 Prompt:

# Character
You are a proficient Twitter Content Expert capable of leveraging bespoke tools based on user inputs.## Skills
### Skill 1: Search content on Twitter
- You're proficient at analyzing user's input, deciphering the key terms they're interested in searching.
- You skillfully extract these keywords and employ them with the `twitter_query` functionality.## Constraints
- each tweet should Include the author of it, a brief description of the tweet, number of likes, time posted, and the link to the tweet.
- should show the image if this tweet item inclue one.
- Please translate the content into the same language as the user input.

我们在 Constraints 部分限制了返回中需要遵循的限制,这个限制非常重要,直接影响了输出的内容:

  • 一条 tweet 需要包含用户名,简单介绍,喜欢数,发布时间以及 tweet 的链接;
  • 如果原始 tweet 中包含图片清尽可能显示出来;
  • 并同时翻译为和用户输入一样的语言。

Twitter Search workflow 介绍

整个 workflow 包含两个关键节点:query 拼接节点 和 twitter 搜索节点。
在这里插入图片描述

Query 拼接节点

Query 整理节点节点比较简单,接受用户输入 query 并整理为 twitter 高级搜索需要的 query。

async function main({ params }: Args): Promise<Output> {const querys = params.queryconst count =  params.count || 10const query = querys.join(' OR ')const str = `(${query}) min_faves:50 -filter:replies`const ret = {"query": str,"count": count};return ret;
}

这里需要说明:

  • 多个关键词需要使用 OR 进行拼接,比如查询 lumalumaai 的 query 就是:(luma OR lumaai)
  • 只选选取点赞超过 50 的内容, min_faves:50
  • 需要过滤掉评论类的内容, -filter:replies

你可以在这里查看更多Twitter 高级搜索玩法并尝试。https://sites.google.com/view/twittercn/twitter-advanced-search

Twitter 搜索节点

Coze 上提供了很多原本收费的 API,其中 twitter plugin 就是一个,twitter api 是非常贵的,$100/月的订阅费挡住了很多开发者,感谢 Coze 提供的 twitter plugin

在这里插入图片描述

这里的用法很简单,我们把 Query 拼接节点输出的 query 给到 Twitter 搜索就可以了。

运行起来的效果:

在这里插入图片描述

其他拓展玩法

1、你可以订阅某些热点,自动同步到飞书或者 notion 中;

2、订阅某个人的内容定期发送到邮件中。

最后

Tweet Hunter 为使用者提供了一种便捷的方式来获取和整理 Twitter 上的热门信息。

通过结合高级搜索技巧和智能机器人,我们可以更有效地从这个庞大的社交平台中筛选出有价值的内容。无论是用于市场研究、趋势分析还是个人学习,这都是一个强大而实用的工具。

希望本文的介绍能够帮助你更好地利用 Twitter 这个信息宝库,挖掘出对你有用的内容。


http://www.ppmy.cn/embedded/101672.html

相关文章

【手写数据库内核组件】0303 数据缓存池(二) 缓存块使用前需要固定,缓存加载与无效,无锁的替换算法

0303 数据缓存池(二) ​专栏内容: postgresql使用入门基础手写数据库toadb并发编程个人主页:我的主页 管理社区:开源数据库 座右铭:天行健,君子以自强不息;地势坤,君子以厚德载物. 文章目录 0303 数据缓存池(二)一、概述 二、缓存块操作原理 2.1 缓存块的读写访问 2.2 无…

【ragflow】查看Docker >= 24.0.0 Docker Compose >= v2.26.1是否满足

系统安装了docker还安装了containerdDocker >= 24.0.0 & Docker Compose >= v2.26.1 root@k8s-master-pfsrv:/home/zhangbin/perfwork# docker --version Docker version 27.1.2, build d01f264 root@k8s-master-pfsrv:/home/zhangbin/perfwork# docker-compose --ve…

【C++ Primer Plus习题】5.6

问题: 解答: #include <iostream> using namespace std;#define MONTHSCOUNT 12 #define YEARS 3int main() {string months[MONTHSCOUNT] { "January","February","March","April","May","June","J…

二叉搜索树:数据结构之美

目录 引言基础知识 定义性质操作详解 插入节点删除节点查找节点遍历 前序遍历中序遍历后序遍历高级主题 平衡问题AVL树简介应用案例总结 引言 二叉搜索树(Binary Search Tree, BST)是一种特殊的二叉树&#xff0c;它的每个节点具有以下性质&#xff1a;左子树上的所有节点的键…

MySql 忘记 Root 密码

停止 mysql 服务 linux 安装时&#xff0c;使用 $> mysqld_safe --usermysql & 启动&#xff0c;所以关闭时&#xff0c;直接 ps 查询进程&#xff0c;并关闭该进程即可 使用如下命令查询进程号&#xff0c;把 mysql 对应的进程都关闭即可 $> ps -ef | grep mysql …

Thread类的基本用法(详解版)

什么是线程&#xff1f; 线程是操作系统能够进行调度的最小单位&#xff0c;通常被视为轻量级的进程。线程在同一进程中共享进程的资源&#xff08;如内存&#xff0c;打开的文件&#xff0c;网络等&#xff09;&#xff0c;但每一个线程都有自己的执行栈、程序计数器和局部变…

使用Jmeter进行接口压力测试

Jmeter是一款压力测试工具&#xff0c;广泛应用于测试后台接口在高并发情况下的响应耗时&#xff0c;这篇文章记录使用Jmeter测试后端接口的步骤 创建测试计划 点击name&#xff0c;修改名称&#xff0c;代表测试项目 配置线程组 点击 order-service - Add – Threads(Users…

深度学习-11-为什么AI需要GPU

几十年前,CPU 作为通用处理器几乎处理所有计算任务,那个时代的显卡有助于加快应用程序中图形的绘制速度。但在今天ChatGPT引爆的人工智能iPhone时刻,GPU成为了整个行业最具主导地位的芯片之一。大家都在抢购GPU,龙头企业英伟达也因此赚的盆满钵满。 服务器中有处理器、内存…