弹幕有点逗比,用 Python 爬下来看看《民国奇探》的弹幕

news/2024/12/2 11:26:27/

 

前言

文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。

PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取http://t.cn/A6Zvjdun

电视剧《民国奇探》是一部充斥着逗比风的探案剧,剧中主要角色:三土、四爷、白小姐,三土这个角色类似于《名侦探柯南》中的柯南但带有搞笑属性,四爷则类似于毛利小五郎但有大哥范且武功高强,三土尚文四爷尚武,白小姐大多时候扮演着傻白甜的角色。

因为该剧目前大多数时候都处于爱奇艺电视剧的榜首位置,所以自己也看了几集,总的来说剧情紧凑,剧风逗比,当然最令我印象深刻的还是网友们逗比的弹幕,所以我决定用 Python 将弹幕爬下来大家一起瞧瞧。

数据爬取

现在开始我们的爬取工作,先用浏览器打开电视剧的网页,地址为:https://www.iqiyi.com/v_19rx2un304.html?vfrm=pcw_home&vfrmblk=B&vfrmrst=fcs_0_t12,我们使用开发者工具的 Network 功能,进到 Network 控制台后,我们先使用 Ctrl+R 命令重新加载一下网页,然后再通过过滤器搜索 bullet,如下图所示:

这里的弹幕数据是以 .z 形式的压缩文件存在的,如下图所示:

我们可以看出压缩文件命名规则为 tvid_300_n.z,所以我们先来获取 tvid 列表,代码实现如下所示:

 

获取到 tvid 列表后,我们就可以根据 tvid 获取弹幕的压缩文件了,然后再对其进行解压及存储,实现代码如下所示:

文件存储到本地之后,我们先获取每一个文件的全路径名,实现代码如下所示:

获取到所有文件全路径名后,我们再根据全路径名获取文件并解析弹幕文本信息,实现代码如下所示:

最后,我们可以将整个弹幕字符串信息保存起来,因为我本次爬取的弹幕信息并不是特别多,所有就先存到 txt 文件中吧,实现代码如下所示:

词云展示

数据保存完了之后,我们再来个词云展示吧,代码实现如下所示:

看一下效果:

 


http://www.ppmy.cn/news/208589.html

相关文章

爬虫学习之04-request模块获取糗事百科一张热图

"""获取糗事百科一张热图:https://pic.qiushibaike.com/system/pictures/12311/123110600/medium/3ZOJEG74FO8RH0QY.jpgdate:2020-05-25 """import requests if __name__ __main__:url https://pic.qiushibaike.com/system/pictures/12311/123…

DNS详解

2.4 DNS:因特网的目录服务 我们首先要了解域名和IP地址的区别。IP地址是互联网上计算机唯一的逻辑地址,通过IP地址实现不同计算机之间的相互通信,每台联网计算机都需要通过IP地址来互相联系和分别。 但由于IP地址是由一串容易混淆的数字串构成…

前端开发职业规划指南:如何做好职业规划与发展

引言 前端开发是目前互联网行业中最火热的职业之一,也是非常具有发展前景的职业之一。随着互联网技术的不断更新和发展,前端开发的职业规划也在不断地发生变化。本文将从几个方面来探讨前端开发的职业规划。 一、职业发展路径 1.前端初级工程师 前端初…

Lecture 5 Part of Speech Tagging

目录 POS application: Information Extraction 词性应用:信息提取 POS Open Class 开放类词性Problem of word classes: Ambiguity 词类问题:模糊性Tagsets 标记集Penn Treebank Tags:Derived Tags: 衍生标签Tagged Text Example 标记文本示例Reasons f…

android数据线接口分类,安卓手机数据线接口类型

大家好,我是时间财富网智能客服时间君,上述问题将由我为大家进行解答。 安卓手机数据线接口类型有: 1、安卓mini接口的数据线,现在多用于按键功能手机、老年手机。分为只充电和数据充电两种。 2、安卓micro usb数据线,…

Lecture 7 Deep Learning for NLP: Feedforward Networks

目录 Deep LearningFeedforward Neural Network 前馈神经网络Neuron 神经元Output Layer 输出层OptimizationRegularization 正则化Topic Classification 主题分类Language Model as Classifiers 语言模型作为分类器Word Embeddings 词嵌入Training a Feed-Forward Neural Netw…

android 怎么看架构,怎么查看手机设备架构

手机设备架构怎么样呢,呢?有什么方法可以查看手机设备架构?下面是小编收集整理的,希望对大家有帮助~~ 查看手机设备架构的方法 工具/原料 安卓手机一台 超级终端软件 准备步骤 1在某些情况下,我们必须要对手机的设备架构进行了解&#xff0…

给十年前手机刷Linux,一台十年前的手机,竟然能刷遍市面上所有的手机操作系统 zt...

说到每一位真正的搞机者,一直以拥有一台HTC HD2为荣,以刷过、体验过无数的操作系统为荣。就像每一位搞机法老,也许不为真正能体验多好的性能,但能够看着刚刷完的HTC HD2,在不同系统开机画面亮屏的那一刻,那…