美女小姐姐是你得菜吗~PYTHON采集西瓜小姐姐

news/2024/11/8 3:15:22/

目录标题

      • 前言
      • 第三方模块:
      • 环境介绍:
      • 基本流程:
      • 代码展示
      • 尾语

前言

嗨喽~大家好呀,这里是魔王呐 ❤ ~!

第三方模块:

  • requests >>> pip install requests

第三方模块安装:

win + R 输入cmd 输入安装命令 pip install 模块名 (如果你觉得安装速度比较慢, 你可以切换国内镜像源)

环境介绍:

  • python 3.8 解释器

  • pycharm 编辑器

  • ffmpeg 可能会用到

python资料、源码、教程\福利皆: 点击此处跳转文末名片获取

基本流程:

一. 思路分析

    找到数据 从网站当中找到视频链接中视频平台: 一般情况下会将 视频和音频分割出来进行存储通过network进行网络资源抓包pachong : 模拟成 浏览器 向 服务器 发送网络请求视频链接是属于 动态加载 还是属于 静态加载(网页源代码里面) 的

二. 代码实现

代码展示

import requests     # python当中的一个浏览器 可以用来访问网站
import re
import json
import base64headers = {'Cookie': 'sid_guard=d75c6025dd5f4e3d658be37aad5f91b5%7C1677067151%7C3024000%7CWed%2C+29-Mar-2023+11%3A59%3A11+GMT; odin_tt=5529039b6eb72ae52e2705d0db550fc06655c83bdbe61914be61c42152989c387a55ad2fa056636bfd1f880a86407f88; ixigua-a-s=1; support_webp=true; support_avif=true; csrf_session_id=4aec69b08691b790189c8b248714eeb5; MONITOR_WEB_ID=8d5f04e0-fe22-47a6-a491-b16fa6947d63; s_v_web_id=verify_ljjyg5tm_onV1WDIr_W0td_4OWn_8Dxc_yi4nDyEV00P3; tt_scid=CUye1APb.OrVFVBYP9BhW587ktUuX80p4KzLPp4KB9RC0b4vM1hcyrwh5zEvq-ot29da; ttwid=1%7CiWx9zpr2eLSL5pxwfW7PdpTasAnL2Tszm5jFlS0A_ac%7C1688214212%7Cb22f4e9514377bc454dd02a9262cadc073f14300f54ede490d1b9a528c799694; msToken=zUmUE0heLzj53ENffW0IRXitBj8ZUNxGOjQWmCOZ7ugnhYbHv6RQ99sZb7S0FpGklhOgCaJXOPX7sI_i7hQZDz5QrWCbvNAG1TCoN2PV8JMJN-MoB1PRd5WiKG_Saw==; __ac_nonce=064a0294100c1af6780ef; __ac_signature=_02B4Z6wo00f010CZCwAAAIDCI5PLa7.s4WNAuQ-AALSRXWZ35dr6rDE3nUJMAieLsp4cgaPQ9ZLvZRXO4qPaH2oawPPT15w48KTLYDP83i56VU5eFpN7Zdc1eFrF8V6pKVa1A-9I72R.caDUbb; __ac_referer=https://***7241058661433508387?logTag=234b8549f4f57a8e4564','Referer':'https://*****/7241058661433508387?logTag=234b8549f4f57a8e4564','User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36'
}
url = 'https://*****/7241058661433508387?logTag=234b8549f4f57a8e4564'
# 先访问到网站 并且拿到网页源代码
response = requests.get(url=url, headers=headers)
# 防止中文出现乱码
response.encoding = 'utf-8'
html_data = response.text
# print(html_data)
# 将 window._SSR_HYDRATED_DATA= 和 </script> 中间的所有内容取出来
json_str = re.findall('window._SSR_HYDRATED_DATA=(.*?)</script>', html_data)[0]
json_str = json_str.replace('undefined', 'null')
print(json_str)
# 将json字符串转为python字典
json_dict = json.loads(json_str)
# main_url -> video_4 -> video_list -> normal -> videoResource -> video -> packerData
# gidInformation -> anyVideo
video_url = json_dict['anyVideo']['gidInformation']['packerData']['video']['videoResource']['normal']['video_list']['video_4']['main_url']
# print(video_url)
video_url = base64.b64decode(video_url).decode()
print(video_url)
# 保存视频
video_data = requests.get(video_url, headers=headers).content
open('1.mp4', mode='wb').write(video_data)
print("下载完成")

尾语

感谢你观看我的文章呐~本次航班到这里就结束啦 🛬

希望本篇文章有对你带来帮助 🎉,有学习到一点知识~

躲起来的星星🍥也在努力发光,你也要努力加油(让我们一起努力叭)。

最后,宣传一下呀~👇👇👇更多源码、资料、素材、解答、交流皆点击下方名片获取呀👇👇


http://www.ppmy.cn/news/731953.html

相关文章

(笔记)Mac下耳机左右声道不平衡(左边小右边大或者右边大左边小)的解决方法

1.打开System Preferences 2.点击Soud&#xff08;声音&#xff09; 3.把Balance的进度条拉到中间位置就OK啦&#xff01;&#xff08;Output volume是你当前耳机音量的大小&#xff09;

小米air2se耳机只有一边有声音怎么办_双十一高性价蓝牙耳机排名,500元内真无线蓝牙耳机推荐...

这几年随着蓝牙技术及TWS技术的不断发展和普及&#xff0c;让真无线蓝牙耳机的门槛越来越低&#xff0c;现在蓝牙耳机市场上真无线蓝牙耳机的品牌产品是越来越多&#xff0c;让我们想选择一款心仪、价格又合适的真无线耳机困难重重&#xff0c;所以就在这里整理出了一些市场反响…

dl----pytorch基础知识

1.torch的基础单位tensor torch.function torch.save/torch.sum(a,b) tensor.function tensor.view/a.sum(b) a.add(b) # 加法的结果返回新的tensor a.add_(b) # 加法的结果存在a中 2.创建tensor的操作 import torch a torch.tensor(2) # 创建维度为2乘3的张量 a.tolist() …

golang 结构体struct转map实践

1、反射 type sign struct { Name string json:"name,omitempty" Age int json:"age,omitempty" } var s sign s.Name "csdn" s.Age 18 //方式1 反射 var data make(map[string]interface{}) t : reflect.TypeOf(s) v : …

软件测试停止依据详解

目录 前言&#xff1a; 误区之一&#xff1a;测试输入数据设计方法等同于测试用例设计方法 误区之二&#xff1a;强调测试用例设计得越详细越好 误区之三&#xff1a;追求测试用例设计“一步到位” 误区之四&#xff1a;让测试新人设计测试用例 前言&#xff1a; 在软件测…

【数据结构与算法】将含有n个元素的整数数组A[0…n-1]的元素循环右移1≤m<n)位。要求算法的空间复杂度为O(1)。

题目&#xff1a; Qestion:  设计一个算法 , 将含有 n 个元素的整数数组 A [ 0 … n − 1 ] 的元素循环右移 ( 1 ≤ m < n ) 位。要求算法的空间复杂度为 O ( 1 ) 设计一个算法,将含有n个元素的整数数组A[0…n-1]的元素循环右移(1≤m<n)位。要求算法的空间复杂度为O(1) …

全球与中国N-乙基苯胺市场深度研究分析报告

2020年&#xff0c;全球N-乙基苯胺市场规模达到了 亿元&#xff0c;预计2027年将达到 亿元&#xff0c;年复合增长率(CAGR)为 %。 本报告研究全球与中国市场N-乙基苯胺的产能、产量、销量、销售额、价格及未来趋势。重点分析全球与中国市场的主要厂商产品特点、产品规格、价格、…

50V升压恒流LED驱动芯片

一些屏幕的背光芯片&#xff0c;有的需要50V/200mA左右&#xff0c;会用到升压芯片&#xff0c;下面介绍下BP1808 3V 到 60VDC 输入/输出范围 支持升压、降压、和升降压模式内置 70V/300mΩ 功率 MOSFET 3%输出电流精度 支持 PWM 调光及模拟调光420kHz 固定工作频率 效率可达9…