如何使用Python下载哔哩哔哩(Bilibili)视频字幕

embedded/2024/9/24 18:30:03/

在本文中,我将向大家展示如何使用Python下载哔哩哔哩(Bilibili)视频的字幕。通过这个方法,你可以轻松地获取你喜欢的视频的字幕文件,方便学习和交流。

准备工作

在开始之前,我们需要安装一些必要的库,确保你已经安装了requestsjson库,如果没有安装,可以使用以下命令安装:

pip install requests

下载字幕

下面是一个Python脚本,可以帮助你下载指定哔哩哔哩视频的字幕。你只需要将视频的BV号(BV号是Bilibili视频的唯一标识符)替换到代码中的BVID变量中,运行脚本即可下载字幕文件。

"""下载哔哩哔哩 字幕
"""
import math
import os
import time
import requests
import jsondef download_subtitle_json(bvid: str):"""下载字幕"""sub_dir = f'./{bvid}'if not os.path.isdir(sub_dir):os.mkdir(f'./{bvid}')headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:125.0) Gecko/20100101 Firefox/125.0','Accept': 'application/json, text/plain, */*','Accept-Language': 'en-US,en;q=0.5','Referer': f'https://www.bilibili.com/video/{bvid}/?p=1','Origin': 'https://www.bilibili.com','Connection': 'keep-alive','Cookie': "xxxxxxxx",'Sec-Fetch-Dest': 'empty','Sec-Fetch-Mode': 'cors','Sec-Fetch-Site': 'same-site',}resp = requests.get(f'https://www.bilibili.com/video/{bvid}/', headers=headers)text = resp.textaid = text[text.find('"aid"') + 6:]aid = aid[:aid.find(',')]cid_back = requests.get("http://api.bilibili.com/x/player/pagelist?bvid={}".format(bvid), headers=headers)if cid_back.status_code != 200:print('获取 playlist 失败')cid_json = json.loads(cid_back.content)for item in cid_json['data']:cid = item['cid']title = item['part'] + '.json'params = {'aid': aid,'cid': cid,'isGaiaAvoided': 'false','web_location': '1315873','w_rid': '364cdf378b75ef6a0cee77484ce29dbb','wts': int(time.time()),}wbi_resp = requests.get('https://api.bilibili.com/x/player/wbi/v2', params=params, headers=headers)if wbi_resp.status_code != 200:print('获取 字幕链接 失败')subtitle_links = wbi_resp.json()['data']["subtitle"]['subtitles']if subtitle_links:# 默认下载第一个字幕subtitle_url = "https:" + subtitle_links[0]['subtitle_url']subtitle_resp = requests.get(subtitle_url, headers=headers)open(os.path.join(sub_dir, title), 'w', encoding='utf-8').write(subtitle_resp.text)if __name__ == '__main__':BVID = 'BV11T42117FY'download_subtitle_json(BVID)
# 请将视频的BV号替换为你想要下载字幕的视频BV号
BVID = 'BV11T42117FY'
download_subtitle_json(BVID)

运行结果:

 

感谢大家的阅读!如果你有任何问题或建议,欢迎在评论区留言。谢谢!


http://www.ppmy.cn/embedded/37773.html

相关文章

Photoshop中图像编辑的基本操作

Photoshop中图像编辑的基本操作 Photoshop中调整图像窗口大小Photoshop中辅助工具的使用网格的使用标尺的使用注释工具的使用 Photoshop中置入嵌入式对象Photoshop中图像与画布的调整画布大小的修改画布的旋转图像尺寸的修改 Photoshop中撤销与还原采用快捷键进行撤销与还原采用…

WP All Import Pro插件下载 - 一键导入,无限可能

在当今快节奏的数字时代,网站内容的更新和管理是每个网站管理员和开发者的日常工作。但是,传统的手动更新方法不仅耗时,而且容易出错。现在,有了WP All Import Pro,这一切都将改变。 WP All Import Pro 是一款专为Wor…

MQTT对比HTTP

吞吐量:根据3G网络的测量结果,MQTT的吞吐量比HTTP快93倍。这意味着在相同的网络条件下,MQTT能够更有效地传输数据,从而在处理大量数据或实时数据传输时具有更高的效率。架构与模式:MQTT基于发布/订阅模型,提…

STM32F4xx开发学习_SysTick

SysTick系统定时器 SysTick属于CM4内核外设,有关寄存器的定义和部分库函数都在core_cm4.h这个头文件中实现,可用于操作系统,提供必要的时钟节拍 SysTick简介 SysTick是一个 24 位向下定时器,属于CM4内核中的一个外设,…

【算法】基础算法004之前缀和

👀樊梓慕:个人主页 🎥个人专栏:《C语言》《数据结构》《蓝桥杯试题》《LeetCode刷题笔记》《实训项目》《C》《Linux》《算法》 🌝每一个不曾起舞的日子,都是对生命的辜负 前言 本篇文章为大家带来前缀和…

seo伪原创文章工具,批量生成文章效率更高

在seo优化工作中,网站更新文章是每个seo人员必做的工作,每天定时定点的更新文章有利于网站的排名,但是长期需要写文章也会让seo人员陷入写作困境,如是,很多seo人员也都有自己的解决方法,他们会选择用seo伪原…

拓扑排序——数据结构

拓扑排序是对有向无环图(DAG)的顶点进行线性排序的方法。关键在于每个顶点代表了一个任务,而每条有向边代表了任务间的先后依赖关系。这个排序保证了每个任务只在它依赖的任务完成后才开始。 拓扑排序的本质是这样的:你有一堆任务…

【Linux 基础 IO】文件系统

文章目录 1.初步理解文件2.C语言环境下的文件操作2.1 C库中 fopen、fwrite 的讲解2.2 C文件操作的实例 3.系统调用接口的讲解 1.初步理解文件 🐧① 打开文件: 本质是进程打开文件,只有程序运行起来文件才被打开; 🐧②文…