Deepseek+扣子实现xhs内容自动采集

news/2025/3/20 6:20:45/

效果展示

先看看演示效果

  • 复制小红书链接,点击导入多维表格

  • 之后就能在多维表格上自动拆解小红书的内容并记录了

Coze工作流搭建步骤

页面搭建

访问网站

地址:https://www.coze.cn/home

登录网站

创建应用

  • 点击创建应用

  • 点击创建空白应用

  • 创建应用

填写应用名称,之后确认

用户界面创建

容器创建

拖入后,调整容器的高度和宽度

表单创建

  • 拖入表单

  • 调整表单宽度和高度

  • 标题调整

这个样式就不再细说了,自己根据情况进行调整

之后将没用的样式进行删除,并调整文本的内容和位置即可

这里主要是保留一个输入框和按钮

工作流搭建

首先可以看看最终的工作流的样子如下:

创建工作流

  • 创建成功后如下:

开始节点

这里主要是为了让工作流的参数更便于理解,当然如果不修改也是没有问题的

  • 修改input为url

链接分析节点

鼠标靠近开始节点的右边的紫色的点,则会变成+号

长按+号右移,就会出现很多可以选择的节点选项

我们这里选择“插件”,点击后,跳转到该页面

搜素link_analyzer,可以看到下面的内容

之后点击该插件,可以看到“添加”按钮,点击

就可以看见,该插件已经插入到节点上了

  • 参数配置

内容分析节点

  • 插入“大模型”节点

  • 添加大模型

点击大模型节点

  • 内容配置

这里可以选择deepseek-R1,分析得到的结果可能会更加好,不过缺点就是会比较慢

也可以选择豆包,也有响应的结果,但是可能会造成一些内容的丢失

输入参数配置

选择link_analyzer的 parsed_result

  • 系统提示词配置

提示词如下

# 内容解析
按下面的格式提取内容# 内容提取summary: 摘要
author:作者
keyword:关键词
time:文章发布时间计算的毫秒数
status:状态
minutes:预估阅读时长
text:标题
link:文章链接
url:标题# 限制
原始输出和最终输出要求一样
  • 用户提示语

对{{input}}进行处理,并最终输出
  • 输出配置

格式转换节点

格式转换,这个目的是为了将参数匹配为多维表格的列名

  • 创建大模型

  • 系统提示词
# 角色
你是xhs_read,负责对输入结果 {{input}} 进行格式转换。## 技能
### 技能1: 格式转换
仔细分析输入结果{{input}},从中准确提取相应属性,并将输入结果按照以下格式进行转换:
[{"fields": {"作者": "{{input.author}}","关键词": "{{input.keyword}}","摘要": "{{input.summary}}","标题": "{{input.url}}","链接": "{{input.text}}"}
}]## 限制
- 仅专注于对输入结果进行格式转换,不涉及其他无关任务。
- 输出必须严格遵循给定的格式要求,不得擅自更改结构。
- 要确保准确获取并填充input内的各个属性到对应的位置。  
  • 输出格式

加入多维表格节点

  • 添加插件

  • 添加飞书多维表格 add_records

  • 创建多维表格

  • 修改列名

按照"格式转换"节点的提示词的格式作为列的标题

  • 删除没用的行,否则会新建的数据 会在最下面

  • 复制链接,填写app_token

这里注意,执行如果失败的时候,可能要进行授权,按照提示和操作进行授权即可。

结束节点处理

最后

将add_records节点和结束节点连接起来

然后将输出值ouput选择add_records->code

这样子,工作流节点就ok了。

验证

  • 点击试运行

运行之后,可以看到报错

多维表格授权
  • 点击授权

  • 点击授权

之后就ok了

重新验证

重新点击试运行,进行验证

之后,可以看到数据插入多维表格了~

关联用户界面和工作流

  • 配置按钮点击事件

  • 输入值

之后点击确定

  • loading和禁用态设置

这个主要是为了在调用工作流的过程中,按钮禁用和加载中,内容设置为工作流.loading

这样子就ok了

验证

最后就差验证了~

  • 点击预览按钮

  • 输入链接

可以看到按钮变成灰色和加载中的状态

  • 多维表格结果

写在最后

最后:我是Walker,一个热爱分享编程知识的程序员,希望能够帮助到你!


http://www.ppmy.cn/news/1580524.html

相关文章

Spring Boot集成JWT:打造安全的RESTful API

Spring Boot集成JWT:打造安全的RESTful API 1. JWT简介 JWT(JSON Web Token) 是一种开放标准(RFC 7519),用于在各方之间安全传输信息。它广泛应用于身份认证和授权场景,尤其适合无状态的RESTfu…

华为云在工业数字化方面的优势

华为云在工业数字化领域展现出全方位的优势,为制造业的转型升级提供了强大的助力。 一、专业的数字化诊断治理服务 华为云的数字化诊断治理专家服务为企业提供全面的深度诊断、成熟度评估、产业升级分析、创新治理和专家咨询等服务。其诊断模型参考国际国内标准&a…

系统思考:恶性循环

去年,我给一家知名人力资源公司交付了两个项目——一个在6月,另一个在8月,至今半年多了依然没有收到课酬。催促多次,得到的答复却各式各样:销售说老板卡了额度,老板说具体情况还需了解。每一次的推诿&#…

[贪心算法]-最大数(lambda 表达式的补充)

1.解析 我们一般使用的排序比较大小都是 a>b 那么a在b的前面 ab 无所谓 a<b a在b的后面 本题的排序则是 ab>ba 那么a在b的前面 abba 无所谓 ab<ba a在b的后面 2.代码 class Solution { public:string largestNumber(vector<int>& nums) {//1.先把所有…

Deepseek本地部署指南:在linux服务器部署,在mac远程web-ui访问

DeepSeek本地部署指南&#xff0c;特别是在Linux服务器上部署并在Mac上实现远程Web-UI访问&#xff0c;可以按照以下步骤进行&#xff1a; 一、在Linux服务器上部署DeepSeek模型 安装Ollama 使用命令curl -sSfL https://ollama.com/install.sh | sh来安装Ollama。安装完成后&a…

利用knn算法实现手写数字分类

利用knn算法实现手写数字分类 1.作者介绍2.KNN算法2.1KNN&#xff08;K-Nearest Neighbors&#xff09;算法核心思想2.2KNN算法的工作流程2.3优缺点2.4 KNN算法图示介绍 3.实验过程3.1安装所需库3.2 MNIST数据集3.3 导入手写数字图像进行分类3.4 完整代码3.5 实验结果 1.作者介…

处理变长的时间序列

pytorch中torch.nn.utils.rnn相关sequence的pad和pack操作 官网…torch.nn.utils.rnn.pack_padded_sequence 知乎pack_padded_sequence 和 pad_packed_sequence 结论 ✅ pack_padded_sequence 是最好的方法&#xff08;避免无效计算&#xff0c;提升性能&#xff09; &#x…

C语言:编程设计猜数游戏

先由计算机想一个数给用户猜&#xff0c;如果猜对了&#xff0c;提示“right&#xff01;”&#xff0c;猜错了&#xff0c;提示“wrong&#xff01;及大小” 思路&#xff1a;用随机函数rand&#xff08;&#xff09;取到计算机想的数 代码&#xff1a; #include <stdio.…