基于云部署DeepSeek自动分析整合Dou音爆款视频数据

devtools/2025/3/6 3:23:09/

大家好,我是小黄。

上期我们介绍了基于云部署的deepseek自动分析整合xiaoHongShu的低粉爆款视频数据。那么很多小伙伴都来问我能不能出一个Dou音版本的。Dou音因为他的反爬做得比较好,所以小黄现在还没有获取到粉丝数量的功能。

我们先看看效果。我们根据控制台的输出调试可以看出,作品和作者的数据基本一致。

因为近段时间的DeepSeek的官网还是很容易繁忙,所以我们今天老样子,还是使用自己部署到云平台的deepSeek来实现。

一.注册登录云平台

1.填写注册的基本信息后登录云平台

平台直达:https://cloud.lanyun.net/#/registerPage?promoterCode=490396da6b

 

2.点击选择应用市场。

 3.选择对应的DeepSeek模型。

4.选择模型对应的显卡配置 

 5.成功部署后启动应用 

 

 之后我们就可以正常询问了:

我们本次需要使用到篡改猴插件。

大家不会安装的可以自行搜索安装一下,我们本次重点介绍采集的脚本。

我们基于某dou音的数据采集,效果如下:在页面友上角创建一个按钮,采集完成的数据会生成一个excel表格。我们可以根据表格快速找到我们想要参考的数据。

最终部分脚本:完整的脚本大家可以关注小黄回复:dou音爆款获取

主要逻辑:我们通过油猴脚本去获取作品超过50000点赞的爆款视频,并把符合条件的视频数据导出,包括作者,作品的点赞数量,作品的连接等。

// ==UserScript==
// @name         抖音低粉爆款视频采集
// @namespace    http://tampermonkey.net/
// @version      1.6
// @description  点击按钮采集抖音点赞数大于50000视频数据,支持超时检测和错误处理
// @author       XiaoHuangCodeing
// @match        https://www.douyin.com/*
// @grant        GM_xmlhttpRequest
// @grant        GM_addStyle
// @require      https://cdn.jsdelivr.net/npm/xlsx@0.18.5/dist/xlsx.full.min.js
// ==/UserScript==(function () {'use strict';// 存储采集到的视频数据let videoData = [];// 存储符合条件到的视频数据let targetData = [];// 存储粉丝数据let fansData = [];let exportout = false; // 是否导出数据// 定义筛选条件const MIN_LIKES = 500000; // 最小点赞数const MAX_FOLLOWERS = 3000; // 最大粉丝数未成功const MAX_NUM = 40; // 最大采集数量let seratchNum = 0; // 采集数量// 定义超时时间(单位:毫秒)const TIMEOUT_DURATION = 10000; // 10 秒// 添加按钮样式GM_addStyle(`#collect-button {position: fixed;top: 20px;right: 20px;z-index: 1000;padding: 10px 20px;background-color: #ff2442;color: white;border: none;border-radius: 5px;cursor: pointer;font-size: 14px;}#collect-button:hover {background-color: #e0213a;}`);// 添加按钮到页面const button = document.createElement('button');button.id = 'collect-button';button.innerText = '开始采集';document.body.appendChild(button);// 按钮点击事件button.addEventListener('click', () => {button.innerText = '采集中...';button.disabled = true;exportout = true;videoData = []; // 重置数据targetData = [];fansData = [];seratchNum = 0;getVideoInfo();setTimeout(() => {if (videoData.some(item => item.粉丝数 === '加载中...')) {console.log('采集超时,导出已采集的数据');exportToExcel(targetData);button.innerText = '开始采集';button.disabled = false;}}, TIMEOUT_DURATION);});// 获取视频信息function getVideoInfo() {const videoItems = document.querySelectorAll('.Xyhun5Yc'); // 获取所有视频项videoItems.forEach((video, index) => {const title = video.querySelector('.bWzvoR9D')?.innerText || '未知标题'; // 标题const author = video.querySelector('.i1udsuGn')?.innerText || '未知作者'; // 作者const likesText = video.querySelector('.x7P__y2r span:nth-child(2)')?.innerText || '0'; // 点赞数文本(第二个 span)const likes = parseCount(likesText); // 解析点赞数const cover = video.querySelector('.DSeU7aaq')?.style.backgroundImage.replace(/url\(['"]?(.*?)['"]?\)/, '$1') || '未知封面'; // 封面图链接const link = video.querySelector('a')?.href || '未知链接'; // 视频链接const authorLink = video.querySelector('.uz1VJwFY')?.href || '未知作者链接'; // 作者主页链接// 将数据存储到数组中videoData.push({标题: title,作者: author,点赞数: likes,封面图: cover,链接: link,作者主页: authorLink,粉丝数: '加载中...' // 初始占位符});// 获取粉丝数if (authorLink && authorLink !== '未知作者链接') {getFollowerCount(authorLink, index);}});// 如果没有视频数据if (videoData.length === 0) {alert('未找到视频数据');button.innerText = '开始采集';button.disabled = false;}}

导出excel效果:

 

 

好了,今天的分享就到这里了,认知易,行动难,大家快去体验一下吧!体验网址: https://cloud.lanyun.net/#/registerPage?promoterCode=490396da6b


http://www.ppmy.cn/devtools/164893.html

相关文章

Redis的主要数据类型及其应用场景

Redis 是一种高性能的键值存储系统,支持多种数据类型,每种类型针对不同的应用场景设计。以下是 Redis 主要数据类型及其应用场景的详细说明: 1. String(字符串) 数据结构:二进制安全的字符串,可…

Llama 2中的Margin Loss:为何更高的Margin导致更大的Loss和梯度?

Llama 2中的Margin Loss:为何更高的Margin导致更大的Loss和梯度? 在《Llama 2: Open Foundation and Fine-Tuned Chat Models》论文中,作者在强化学习与人类反馈(RLHF)的Reward Model训练中引入了Margin Loss的概念&a…

Starrocks 写入报错 primary key memory usage exceeds the limit

背景 本文基于 StarRocks 3.3.5 单个Starrocks BE配置是 16CU 32GB 在Flink Yaml CDC 任务往 Starrocks写数据的过程中,突然遇到了primary key memory usage exceeds the limit 问题,具体如下: java.lang.RuntimeException: com.starrocks.…

Highcharts 配置语法详解

Highcharts 配置语法详解 引言 Highcharts 是一个功能强大的图表库,广泛应用于数据可视化领域。本文将详细介绍 Highcharts 的配置语法,帮助您快速上手并制作出精美、实用的图表。 高级配置结构 Highcharts 的配置对象通常包含以下几部分&#xff1a…

GPU/CUDA 发展编年史:从 3D 渲染到 AI 大模型时代(上)

目录 文章目录 目录1960s~1999:GPU 的诞生:光栅化(Rasterization)3D 渲染算法的硬件化实现之路学术界算法研究历程工业界产品研发历程光栅化技术原理光栅化技术的软件实现:OpenGL 3D 渲染管线设计1. 顶点处理&#xff…

加油站小程序实战教程06地图多站点显示

目录 引言功能设计与开发步骤第一步:初始化项目与地图第二步:动态切换城市地图第三步:标记加油站位置第四步:获取用户位置并计算最近加油站第五步:城市名称解析完整代码总结 引言 在上一篇《加油站小程序实战05&#…

【Elasticsearch】数据管理(Data Management)

Elasticsearch 的数据管理(Data Management)是其核心功能之一,旨在帮助用户高效地存储、维护和查询不同类型的数据,同时优化性能和成本。以下是结合原文内容对 Elasticsearch 数据管理的详细阐述: 1.数据类型 Elasti…

maven高级-03.继承与聚合-版本锁定

一.版本锁定 在maven中&#xff0c;父工程的pom文件中通过<dependencyManagement>来统一管理依赖的版本。 注意&#xff1a; <dependencyManagement>仅仅管理依赖的版本号&#xff0c;并不进行依赖的注入。如果要进行依赖注入还是要使用<dependencies>注解。…