python爬虫--爬取9某1看剧网电视剧

news/2024/11/9 3:10:08/

文章目录

  • python爬虫--爬取91看剧网电视剧
    • 爬取视频必备知识
    • 思路
    • 代码
    • 合并视频

python爬虫–爬取91看剧网电视剧

爬取视频必备知识

https://www.91kanju.com/vod-play/54812-1-2.html

思路

查看网页源代码;发现m3u8的URL
在这里插入图片描述
在这里插入图片描述
找到ts文件存在的位置:
在这里插入图片描述

代码

import requests
import re
#
# obj = re.compile(r"url: '(?P<url>.*?)',",re.S)
# url = 'https://www.91kanju.com/vod-play/54812-1-2.html'
#
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.105 Safari/537.36'}
#
# resp = requests.get(url=url,headers=headers).text
#
# m3u8_url = obj.search(resp).group("url")
#
# print(m3u8_url)
#
# #下载m3u8文件
#
# resp2 = requests.get(url=m3u8_url,headers=headers)
# with open("哲仁王后.m3u8",mode='wb') as fp:
#     fp.write(resp2.content)
#本地缓存到m3u8文件后将上面注释掉
n = 1
with open("哲仁王后.m3u8",mode='r',encoding='utf-8') as fp:for line in fp:line = line.strip()if line.startswith("#"):continueif n<10:temp = '0' + '0' + str(n)elif 10<=n<100:temp = '0' + str(n)resp3 = requests.get(url=line,headers=headers)f = open(f"video/{temp}.ts",mode='wb')f.write(resp3.content)f.close()resp3.close()n+=1print(temp)

在这里插入图片描述
在这里插入图片描述

合并视频

可以使用第三方软件。片段少的话可以使用window自带的合并功能。
打开CMD

例子:
copy/b D:\video\*.ts  D:\new.mp4

http://www.ppmy.cn/news/468828.html

相关文章

网站制作流程

时刻记住&#xff0c;大多数&#xff08;不是全部&#xff09;页面会使用一些相同的元素&#xff0c;例如导航菜单以及页脚内容。若网站为商业站点&#xff0c;不妨在所有页面的页脚都加上联系方式。请记录这些对所有页面都通用的内容&#xff1a; 接下来&#xff0c;可为页面…

Ubuntu apt install / update错误前因后果: 连接失败 [IP: 91.189.91.* 80]

同时更新Ubuntu系统和升级Python3.10时&#xff0c;期间命令删除"sudo apt remove Python3*"包&#xff0c;以为由此引发一系列问题&#xff0c;且最终的系统崩溃无法登陆。启动系统提示&#xff1a;“ /dev/sdb1 clean&#xff0c; 209690/3129344 files, 3875572/…

跟着团子学SAP PS:项目模版搭建 CJ91/CJ92/CJ93/CN01/CN02/CN03/CN11/CN12/CN13

项目结构是整个PS模块最为核心的主数据&#xff0c;因为项目结构的搭建体现了企业管理项目的思路&#xff08;按什么维度分解WBS等&#xff09;以及颗粒度&#xff08;WBS的层级&#xff0c;活动的多少等&#xff09;&#xff0c;而最终基于企业项目型管理及分析需求设计出的项…

资源网站整理合集--adding

资源寻找 综合导航- 阿虚同学http://axutongxue.com/ 好网站不私藏https://www.207788.xyz/ 网站导航 爱达杂货铺https://adzhp.cn/ 书签地球https://www.bookmarkearth.com/ 不死鸟https://iao.su/- iMyShare 工具资源导航-https://imyshare.com/ LKS的网站推荐&#xff1a…

以下哪个ip不和10.11.12.91/28处于同一个子网

以下哪个ip不和10.11.12.91/28处于同一个子网 A 10.11.12.85/28 B 10.11.12.88/28 C 10.11.12.94/28 D 10.11.12.97/28 正确答案选D IP地址由网络号和主机号组成&#xff0c;前28位为网络号&#xff0c;所以前28位都相同&#xff0c;可得子网掩码为&#xff08;255.255.255.24…

简书网页劫持分析,网站劫持,利用 CSP 预防劫持

摘要 最近&#xff0c;每天第一次打开简书都会跳转到一个恶意网页&#xff0c;它以浏览器错误问题引导用户下载一个安装包。这个安装包安全性未知。另外打开网页时还会自动向剪贴板中写入一个淘口令&#xff0c;打开淘宝的时候会自动打开一个红包。页面跳转似乎是同一个 IP 每…

在线旅游网站技术讲解

一、项目概述 介绍&#xff1a; 旅游网是一个基于Springboot框架设计的一个毕业设计&#xff0c;主要类似于一个电商系统 登陆方式&#xff1a; 前台&#xff1a; 登陆url&#xff1a;localhost:8080 首先需要注册一个账号才能进行登陆后台&#xff1a; 登陆url&#xff1a…

使用threejs 实现3D物体展示,平移实现类似百度地图功能

为了实现类似百度地图功能 使用threejs 实现3D物体&#xff0c;通过鼠标平移&#xff0c;缩放&#xff0c;键盘箭头按钮左右移动的功能展示。 <!DOCTYPE html><html> <head> <meta charsetutf-8> <title>My first three.js app</title> …