python获取并解析电影评分Top 250的电影名称、评分和电影类型,并统计分析出哪些电影类型占比居多(最终结果显示剧情类型的电影占比最多)

news/2024/10/18 14:15:24/

一、实现目标

      python编写一个简易的爬虫程序,获取电影有史以来的电影评分最高的前250部电影的名称和评分,获取的数据存储到exce文件中。之后统计分析出哪些电影类型占比居多。


二、实现思路

       1、找到电影评分Top250的页面

        2、分析该网页的数据结构,找到要解析的数据在哪个位置,什么结构

        3、分析每一页数据的url格式,找出规律,从而实现多页的爬取

       4、编程实现,向目标网页发送请求,解析html数据,修改url,多页爬取。最后写入excel文件。

        5、读取excel文件中的电影数据,统计分析出哪种类型占比更多,更受欢迎。


三、代码实现

1、导入需要使用到的库:


http://www.ppmy.cn/news/107228.html

相关文章

linux达梦数据库的安装与卸载

一、安装 创建dmdba用户及用户组 创建安装目录: mkdir -p /dm8 创建组 :groupadd dinstall 创建用户 :useradd -g dinstall dmdba 设置密码 :passwd dmdba 创建文件夹:mkdir /dmdata 更改安装目录所有者: c…

从1万张模板中找的运营知识图谱,超级牛!

运营现在是时下大家都很熟悉的一个行业,我们熟知的有内容运营、用户运营、产品运营、新媒体运营、活动运营 社群运营、电商运营、品牌运营等多种运营方式。 想要做好运营,其实是需要很丰富的知识体系的,今天就给大家分享一些厉害的运营图谱。…

如何在jupyterlab里写mermaid语法支持的graph

可以使用以下步骤在 JupyterLab 中编写 Mermaid 图: 在 JupyterLab 中创建 Markdown 单元格 在 Markdown 单元格中编写 Mermaid 代码,例如: mermaid graph LR A[方形] -- 链接 --> B((圆形)) A --> C{条件1} B -->|条件2| D[方形…

Ubuntu安装python3.8的pip

Ubuntu安装python3.8的pip ubuntu 系统 16.04 版本中,最新版本的 python 是 3.5,从系统源中找不到更新版本的 python,本文介绍一种安装 python3.8 的方法,以及安装对应版本的 pip。 安装 python3.8 执行如下命令增加 ppa 仓库&…

进阶神册,Redis+Nginx+设计模式+Spring全家桶+Dubbo核心技术笔记

最近花了很长的时间去搜罗Java核心技术好文,我把每个Java核心技术的优选文章都整理成了一个又一个的文档。昨天也是终于全部整理好了,今天就把这些东西分享给老铁们,也能为老铁们省去不少麻烦,想学什么技能了,遇到哪方…

IP-Guard客户端上插入加密盘时提示格式化,能否禁止该弹窗?

客户端上插入加密盘时提示格式化,能否禁止该弹窗? 1、当Shell Hardware Detection服务启动时,操作系统检测硬件的速度要快于客户端,而此时操作系统是不能识别加密后的移动盘的,因此认为加密盘异常,提示需要格式化,策略-客户端配置,选择禁止windows7播放功能。配置后不…

1081 Rational Sum(24行代码+超详细注释)

分数 20 全屏浏览题目 切换布局 作者 CHEN, Yue 单位 浙江大学 Given N rational numbers in the form numerator/denominator, you are supposed to calculate their sum. Input Specification: Each input file contains one test case. Each case starts with a posi…

更改测试用例执行顺序的几种自动化方法

前言 在自动化测试中,自动化测试用例设计原则就是执行过程时不能存在依赖顺序,那么如果测试用例需要按照指定顺序执行,这个时候应该怎么做呢?目前单元测试框架中unittest没有办法改变测试用例的执行顺序,但是另一个单…