出租车数据可视化分析-大数据-实训大作业

news/2025/3/19 11:55:01/

第1章  项目绪论

1.1项目的总体说明背景及意义

在纽约,游客们往往把自由女神象、帝国大厦、中央公园等视为纽约的象征, 但穿梭在人海中的出租车也是纽约靓丽的人文景观之一, 是其流动的风景线, 在纽约公共文化中别具魅力。本项目利用之前从seaborn上下载的数据taxi.csv,结合python对数据进行分析。

1.1.1项目背景

在纽约,出租车分为两类:黄色和绿色。黄色出租(Yellow TAXI)车可以在纽约五大区(布朗克斯区、布鲁克林区、曼哈顿、皇后区、斯塔滕岛)内任何地点搭载乘客。绿色出租车(Green TAXI)则被规定只允许在上曼哈顿、布朗克斯区、皇后区和斯塔滕岛接客,这两类出租车均由私人公司经营并受到纽约市出租车和轿车委员会(NYC Taxi and Limousine Commission)的监管。

1.1.2项目意义

这些数据记录了每一趟出租车上下客的时间、出行距离、出行地点、出行费用、支付方式以及司机上报的乘客数量。出租车作为城市发展、社会变迁的见证者,其活动轨迹提供了很好的一扇窗,让我们能够一窥背后的纽约故事。

第2章  项目数据处理

2.1项目数据来源说明

该数据从seaborn数据集 https://github.com/mwaskom/seaborn-data上下载

2.1.1项目数据获取

Python库准备:numpy,pandas,matplotlib,pyecharts,wordcloud

数据集字段说明:

'pickup':'上车时间',

'dropoff':'下车时间',

'passengers':'乘客人数',

'distance':'乘车距离',

'fare':'费用',

'tip':'小费',

'tolls':'过路费',

'total':'总费用',

'color':'出租车颜色',

'payment':'支付方式'

'pickup_zone':'上车地点'

'dropoff_zone':'下车地点'

'pickup_borough':'上车所在城市'

'dropoff_borough':'下车所在城市'

2.2项目数据清洗要求

异常值与缺失值的处理:有一些数据distance(乘车距离)为零而且上下车地点为空,还有些一些数据的payment(支付方式)为空。

2.2.1项目数据清洗方法与过程

(该数据无重复值,不做处理)

清洗好的数据导出并保存

2.3项目数据预处理

2.3.1项目数据预处理的要求与过程

将列名更改成中文

标准化与归一化


第3章  项目数据分析与可视化

3.1项目数据分析说明

1.分析了乘车距离与小费的关系;

2.分析了乘车总费用与乘车距离的关系;

3.分析了乘客偏好使用何种支付手段;

4.分析了乘车费用与乘车人数的关系;

5.分析了乘车费用和小费与出行距离的关系;

6.分析了大多数乘客在纽约的何地乘车;

7.分析了乘车费用与乘客出行的关系;

8.分析了乘车时间与乘客为何选择出租车的原因。

3.1.1项目数据分析效果

1.小费随着乘客乘车距离的增加而增多。

2.乘车费用随着乘客乘车距离的增加而增加。

3.绝大多数乘客选择信用卡支付车费,少部分乘客选择现金支付,有极少部分乘客选择其他支付方式。

4.乘客的乘车费用不会因为乘车人数的增加而增加,大多数乘客搭乘出租车属于短程出行,多人出行时选择出租车比较划算。

5.不管是单人出行还是多人出行,乘车费用以及小费都比较平均,可以分析出大多数乘客的出行距离都差不多。

6.大多数乘客都属于Manhattan市。

7.乘车费用大多在0-25美元内,乘客选择出租车大多为短途出行。

8.大部分订单时间集中在30分钟以内,可以进一步得出大部分人选择出租车出行是要快速的短途出行。

3.2项目数据可视化

3.2.1项目数据可视化效果

1.小费随着乘客乘车距离的增加而增多。

2.乘车费用随着乘客乘车距离的增加而增加。

3.绝大多数乘客选择信用卡支付车费,少部分乘客选择现金支付,有极少部分乘客选择其他支付方式。

4.乘客的乘车费用不会因为乘车人数的增加而增加,大多数乘客搭乘出租车属于短程出行,多人出行时选择出租车比较划算。

5.不管是单人出行还是多人出行,乘车费用以及小费都比较平均,可以分析出大多数乘客的出行距离都差不多。

6.大多数乘客都属于Manhattan市。

7

8.大部分订单时间集中在30分钟以内,可以进一步得出大部分人选择出租车出行是要快速的短途出行。


http://www.ppmy.cn/news/1580310.html

相关文章

基于Asp.net的物流配送管理系统

作者:计算机学姐 开发技术:SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等,“文末源码”。 专栏推荐:前后端分离项目源码、SpringBoot项目源码、Vue项目源码、SSM项目源码、微信小程序源码 精品专栏:…

DeepSeek技术解析:MoE架构实现与代码实战

以下是一篇结合DeepSeek技术解析与代码示例的技术文章,重点展示其核心算法实现与落地应用: DeepSeek技术解析:MoE架构实现与代码实战 作为中国AI领域的创新代表,DeepSeek在混合专家模型(Mixture of Experts, MoE&…

Chat2DB:自然语言生成 SQL 的时代来临,数据库管理更简单

作者:后端小肥肠 目录 1. 前言 2. 数据库管理工具对比 3. Chat2DB安装及实际测评 3.1. Chat2DB安装 3.2. AI功能测评 3.2.1. 自然语言创建表 3.2.2. 自然语言查询 4. 结语 1. 前言 提到数据库管理工具,Navicat 曾经是大家的首选,但随…

【C语言】:学生管理系统(多文件版)

一、文件框架 二、Data data.txt 三、Inc 1. list.h 学生结构体 #ifndef __LIST_H__ #define __LIST_H__#include <stdio.h> #include <stdlib.h> #include <string.h> #include <stdbool.h> #include <time.h>#define MAX_LEN 20// 学生信息…

Nuxt2 vue 给特定的页面 body 设置 background 不影响其他页面

首先认识一下 BODY_ATTRS 他可以在页面单独设置 head () {return {bodyAttrs: {form: form-body}};},设置完效果是只有这个页面会加上 接下来在APP.vue中添加样式

顺序表和链表的对比(一)

前言 今天给小伙伴们分享的是在数据结构中顺序表和链表的对比。它们在计算机科学和软件开发中具有广泛的应用&#xff0c;是理解更复杂数据结构&#xff08;如栈、队列、树、图等&#xff09;的基础。这次将会给大家从定义初始化&#xff0c;以及功能增删查改上进行详细对比&a…

WEB安全--SQL注入--DNSlog外带

一、原理&#xff1a; 访问域名时&#xff0c;dns协议将我们访问的语句解析为ip地址&#xff0c;并将其记录在其日志中&#xff1b;在这个过程中&#xff0c;如果我们在语句中写入SQL注入的语句&#xff0c;那么在dns解析时会执行这些语句并通过concat将结果和域名一起记录在日…

基于RK3588的建筑测量机器人应用解决方案

建筑业作为国民经济的重要组成部分&#xff0c;随着国家政策和建筑行业的智能化需求的增长&#xff0c;建筑测量机器人作为新兴技术代表&#xff0c;正逐步成为提升建筑业生产效率、保障施工安全、降低人工成本的关键力量。 建筑测量机器人具备高精度、智能化、自动化等特点&am…