爬虫案例-爬取某猫的电影数据

爬虫案例-爬取某猫的电影数据

ops/2025/2/27 17:28:54/

文章目录

- - 1.爬取的代码
  - 2.效果图

1.爬取的代码

import requests
import time
import random
import hashlib
import pandas as pdurl = "https://piaofang.maoyan.com/dashboard-ajax?"header= {"user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/133.0.0.0 Safari/537.36 Edg/133.0.0.0"
}
#时间戳
time = str(int(time.time()*1000))
#数字
num = random.randint(1, 1000)
#原始字符串
data = f"method=GET&timeStamp={time}&User-Agent=TW96aWxsYS81LjAgKFdpbmRvd3MgTlQgMTAuMDsgV2luNjQ7IHg2NCkgQXBwbGVXZWJLaXQvNTM3LjM2IChLSFRNTCwgbGlrZSBHZWNrbykgQ2hyb21lLzEzMy4wLjAuMCBTYWZhcmkvNTM3LjM2IEVkZy8xMzMuMC4wLjA=&index={num}&channelId=40009&sVersion=2&key=A013F70DB97834C0A5492378BD76C53A"
#加密计算MD5哈希值
md5_hash = hashlib.md5(data.encode()).hexdigest()param= {"orderType": 0,"uuid": "194fa637589c8-0c3f722a89eccf-4c657b58-1fa400-194fa637589c8","timeStamp": {time},"User-Agent": "TW96aWxsYS81LjAgKFdpbmRvd3MgTlQgMTAuMDsgV2luNjQ7IHg2NCkgQXBwbGVXZWJLaXQvNTM3LjM2IChLSFRNTCwgbGlrZSBHZWNrbykgQ2hyb21lLzEzMy4wLjAuMCBTYWZhcmkvNTM3LjM2IEVkZy8xMzMuMC4wLjA=","index": {num},"channelId": 40009,"sVersion": 2,"signKey": {md5_hash},"WuKongReady": "h5"
}request = requests.get(url,headers=header,params=param)
print(request.json())# 提取电影数据
movie_data = []
for index in request.json()["movieList"]["data"]['list']:movie_info = {"电影名称": index["movieInfo"]["movieName"],"总票房": index["sumBoxDesc"],"上映信息": index["movieInfo"]["releaseInfo"],"票房占比": index["splitBoxRate"],"场次": index["showCount"]}movie_data.append(movie_info)print(movie_data)
# 将数据转换为 DataFrame
df = pd.DataFrame(movie_data)# 保存到 Excel 文件
df.to_excel(r"C:\Users\zzx\Desktop\movie_data2.xlsx", index=False)print("数据已保存到 movie_data.xlsx")

2.效果图

http://www.ppmy.cn/ops/161735.html

相关文章

DeepSeek-R1论文阅读及本地调用

DeepSeek-R1论文阅读及本地调用

前言 DeepSeek已经火了一段时间了，对于这项“国运级”的技术成果，即便研究的不是这个方向，也不免好奇前来看看。本文将先解析一下DeepSeek-R1这篇论文，再对DeepSeek的本地部署使用进行研究配置。论文标题：DeepSeek-…

阅读更多...

一周学会Flask3 Python Web开发-Jinja2模板过滤器使用

一周学会Flask3 Python Web开发-Jinja2模板过滤器使用

锋哥原创的Flask3 Python Web开发 Flask3视频教程： 2025版 Flask3 Python web开发视频教程(无废话版) 玩命更新中~_哔哩哔哩_bilibili 在Jinja2中，过滤器(filter)是一些可以用来修改和过滤变量值的特殊函数，过滤器和变量用一个竖线 | &a…

阅读更多...

Java基础关键_011_ String 类与正则表达式（二）

Java基础关键_011_ String 类与正则表达式（二）

目录一、正则表达式 1.说明 2.应用 3. 相关方法 （1）replace(CharSequence target, CharSequence replacement) （2）replaceAll(String regex, CharSequence replacement) （3）split(String regex) &…

阅读更多...

huggingface部署本地大模型DeepSeek-R1-Distill-Llama-70B使用streamlit构建交互式 Web 应用

huggingface部署本地大模型DeepSeek-R1-Distill-Llama-70B使用streamlit构建交互式 Web 应用

文章目录一、Streamlit介绍二、模型下载三、模型部署四、效果展示一、Streamlit介绍 Streamlit 是一个开源的 Python 库，专门用于快速构建和部署交互式 Web 应用程序，尤其适合数据科学和机器学习领域。以下是关于 Streamlit 的详细介绍： …

阅读更多...

OA办公系统自动渗透测试过程

OA办公系统自动渗透测试过程

目录一、下载环境源码二、部署环境三、测试 XSS漏洞 SQL注入文件上传漏洞一、下载环境源码 OA源码打包地址： https://download.csdn.net/download/weixin_43650289/90434502?spm=1001.2014.3001.5503 二、部署环境

阅读更多...

3DUNet-Pytorch-master环境配置(3dunet)

3DUNet-Pytorch-master环境配置(3dunet)

1. 移除虚拟环境 conda remove --name 3dUnet --all 2. 查看虚拟环境 conda env list 2. 创建虚拟环境的命令 conda create --name 3dunet python3.8 （之前用的 python3.6 因为重装了系统这个版本不能用了） 3. 安装依赖包 pip3 install torch pi…

阅读更多...

DeepSeek回答：AI时代Go语言学习路线

DeepSeek回答：AI时代Go语言学习路线

最近有小伙伴经常会问：**该如何学习入门Go语言？怎样提升Go语言Coding水平？**这篇文章我们就使用DeepSeek来梳理下Go语言在AI时代的学习路线。向DeepSeek提问的问题原文： 你现在是一名资深的Go语言工程师，精通Go语言并…

阅读更多...

硬件工程师入门教程

硬件工程师入门教程

1.欧姆定律测电压并联使用万用表测电流串联使用万用表，红入黑出 2.电阻的阻值识别直插电阻贴片电阻 3.电阻的功率 4.电阻的限流作用限流电阻阻值的计算单位换算关系 5.电阻的分流功能 6.电阻的分压功能 7.电容电容简单来说是两块不连通的导体加上中间的绝…

阅读更多...

最新文章