自动化爬虫工具:you-get安装与使用

server/2024/11/23 20:23:04/

Windows下的安装命令:

python">pip install you-get

linux下的安装命令:

python">pip3 install you-get

下载完成后,我们可以看到如下的警告,意思就是这个工具并未被添加到环境变量中,如果我们想在命令行中直接调用,需要将路径添加到环境变量

下面是添加环境变量的方法:

新建,然后把路径填入,重启电脑即可

在命令行中输入you-get,您将看到以下输入

一般形式:

you-get 视频地址 [-i] [-o] [-c]

-i:显示爬取视频的信息,清晰度等

-o:指定爬取下来的视频保存的位置

-c:指定cookies文件

火狐的cookies文件一般在如下位置:

大家可以复制到桌面上

另外有一点是,爬下来的视频是音视频分离的,可以用这个工具来合并

https://github.com/BtbN/FFmpeg-Builds/releases/download/latest/ffmpeg-n7.0-latest-win64-gpl-7.0.zip

下面将以爬取B站视频为例:

如果大家遇到了报错情况,可以参考官方的文档解决

https://github.com/soimort/you-get/wiki/Known-Bugs

最后附上项目的所有爬虫源码的地址:

https://github.com/soimort/you-get/tree/develop/src/you_get/extractors


http://www.ppmy.cn/server/20898.html

相关文章

MySQL-多表查询

多表查询 多表查询简介 笛卡尔乘积 笛卡尔乘积的形成,当: 一个连接条件被遗漏时 一个连接条件不正确时 在第一个表中的所有行被连接到第二个表的所有行时 为了避免笛卡尔乘积的形成,在WHERE子句中应当总是包含正确的连接条件 笛卡尔乘积 &#xf…

机器学习中的 SVM(支持向量机)和随机森林及其优缺点

SVM(支持向量机)和随机森林是机器学习中常用的两种算法。 支持向量机是一种监督学习算法,主要用于二分类问题。其基本原理是通过在数据集中找到一个超平面,将两个不同的类别分隔开来。SVM的核心思想是尽可能将超平面与两个类别的…

力扣HOT100 - 124. 二叉树中的最大路径和

解题思路: class Solution {int max Integer.MIN_VALUE;public int maxPathSum(TreeNode root) {maxGain(root);return max;}public int maxGain(TreeNode node) {if (node null) return 0;int leftGain Math.max(maxGain(node.left), 0);int rightGain Math.ma…

ETL中元数据处理的方式

ETLCloud平台是用于处理从数据抽取、转换、加载到持续数据捕获等一系列数据管理活动。除此之外还支持微服务治理与快速开发,并且具备数据库监听功能,能够以不同的方式监听并同步源数据库表数据到目标系统,比如直接传输、通过ETL流程处理或者传…

深入剖析Tomcat(四) 剖析Tomcat的默认连接器

上篇文章已经实现了一个简易版的连接器,理解了那个连接器,再看Tomcat的默认连接器就会轻松很多,本章中的默认连接器指的是Tomcat4的默认连接器,尽管该连接器已经被弃用了,被另一个运行速度更快的连接器 Coyote 取代&am…

深度学习-线性代数

目录 标量向量矩阵特殊矩阵特征向量和特征值 标量由只有一个元素的张量表示将向量视为标量值组成的列表通过张量的索引来访问任一元素访问张量的长度只有一个轴的张量,形状只有一个元素通过指定两个分量m和n来创建一个形状为mn的矩阵矩阵的转置对称矩阵的转置逻辑运…

主题乐园私域精细化运营

主题乐园私域精细化运营是指在细分用户群体的基础上,通过个性化、精准的运营方式,为用户提供定制化服务和体验。以下是一些常见的主题乐园私域精细化运营玩法: 会员制度和会员专属服务:建立完善的会员制度,为会员提供专…

Linux 环境变量的增删改

写在前面: 本文章旨在总结备份、方便以后查询,由于是个人总结,如有不对,欢迎指正;另外,内容大部分来自网络、书籍、和各类手册,如若侵权请告知,马上删帖致歉。 目录 shell 和 bash获…