多元数据直观表示(R语言)

news/2025/3/3 17:01:45/

一、实验目的:

       通过上机试验,掌握R语言实施数据预处理及简单统计分析中的一些基本运算技巧与分析方法,进一步加深对R语言简单统计分析与图形展示的理解。

数据:
链接: https://pan.baidu.com/s/1kMdUWXuGCfZC06lklO5iXA 提取码: g55h

二、实验内容:

bank.csv文件中数据来自1969-1971年美国一家银行的474名职员情况调查。该数据共8个变量,包括:

gender:性别,1代表男性,2代表女性;

educ:受教育年限(单位:年);

jobcat:职位等级,分1,2,3级,1级工作地位最低,3级最高;

salary:当前工资(单位:美元/年);

salbegin:初始工资,指进入银行初始薪酬(单位:美元/年);

jobtime:工作月份,指在银行累计工作时间(单位:月);  

prevexp:以前工作经历,指在其他单位累计工作时间(单位:月);

minority: 是否少数民族,0代表不是,1代表是。

(1)请绘制折线图,展示工资如何随工作时间变化,并对图形进行解读。

(2)请绘制气泡图,展示性别、职位等级与当前工资的关系,并对图形进行解读。

3)(至少有两个分析)自行选择感兴趣的变量与分析目的,利用基本统计分析图形进行直观表示并加以解读。此小题对使用何种图形展示不做严格要求,只需不是折线图及气泡图即可。

三、实验过程与结果:

1)绘制折线图,展示工资如何随工作时间变化,并对图形进行解读:

data<-read.csv("E:/学习资料及作业/2.2多元统计分析R/实验1/bank.csv")datad1<-aggregate(salary~jobtime,data,mean)  #求salary的均值library(ggplot2)ggplot(data=d1,aes(x=jobtime,y=salary))+ # 折线图geom_line(color="green",size=1) #线的颜色、粗细

运行结果:

解读分析:

       从总体上看,工作时间jobtime与工资salary之间不存在线性关系,即使工作时间在小范围内变化,薪资可能波动较大。当工作时间超过90时,总体的薪资会比工作时间小于90的多一点儿,表明工作时间会对薪资有一定的影响,但薪资并不是只由工作时间直接决定的,还存在其他因素对其有影响。

2)绘制气泡图,展示性别、职位等级与当前工资的关系,并对图形进行解读。

d2<-aggregate(x=data$salary,by=list(data$jobcat,data$gender),FUN=mean)d2ggplot(data=d2,aes(x=Group.1, y=Group.2, size=x,col=1)) +geom_point(alpha=0.5) + #调整圆圈透明度scale_size(range = c(1, 10), name="性别、职位等级与当前工资的关系图")+ #图例名称xlab('jobcat') +  # 更改x、y轴名称ylab('gender')

运行结果:

解读分析:

       男性13等级都有分布,女性只有13等级,从男性角度来看,12等级的薪资差别不大,但123等级薪资相差较大,都快相差两倍了;从女性角度来看,等级1与等级3相差巨大。并且男性和女性都为等级1时,男性的薪资与女性的相差较大。

3)自行选择感兴趣的变量与分析目的,利用基本统计分析图形进行直观表示并加以解读。此小题对使用何种图形展示不做严格要求,只需不是折线图及气泡图即可。

分别用箱型图绘制职位等级与受教育年限、职位等级与薪资的关系:

代码:

data$jobcat<-factor(data$jobcat)ggplot(data,aes(x=jobcat,y=educ))+geom_boxplot()+labs(title="职位等级与受教育年限的关系",x="职位等级",y="受教育年限")+theme(plot.title = element_text(hjust=0.5))data$jobcat<-factor(data$jobcat)ggplot(data,aes(x=jobcat,y=salary))+geom_boxplot()+labs(title="职位等级与薪资的关系",x="职位等级",y="薪资")+theme(plot.title = element_text(hjust=0.5))

运行结果:

 

解读分析:

       从均值来看,等级1、2的受教育的年限均值相同,等级3最高,但等级1、2的薪资均值相差不大,等级3的薪资却比等级1、2高得多,从某种程度上可以表明受教育年限越高,其薪资也越高。等级2的薪资较为集中,几乎没什么波动。

受教育年限、以前工作经历与初始工资的关系:

代码:

d3<-aggregate(x=data$salbegin,by=list(data$prevexp,data$educ),FUN=mean)ggplot(data=d3,aes(x=Group.1, y=Group.2, size=x,col=1)) +geom_point(alpha=0.5) + #调整圆圈透明度scale_size(range = c(1, 10), name="受教育年限、以前工作经历与初始工资的关系图")+ #图例名称xlab('prevexp') +  # 更改x、y轴名称ylab('educ')

解读分析:

受教育越高的平均工作时间要比受教育低的少,并且获得的薪酬也相对多一些。

以前的工作经历对初始薪资的影响:

代码:

d4<-aggregate(salbegin~prevexp,data,mean)order<-sort(d4$prevexp,decreasing=T)ggplot(data=d4,aes(prevexp,salbegin))+geom_bar(stat="identity",width=0.8,colour="black",linewidth=0.25,fill="#FC4E07",alpha=1)

运行结果:

解读分析:

        以前的工作经历大多集中在0-120个月,即1-10年,随着工作经历的增加,会出现少数再找工作时,其初始工资很高,但是总体工作经历对其再工作时的初始工资没有什么影响。并且当工作经历达到200个月以上时,再次换工作的人也偏少了,这可能与他们进入中年,追求平稳的生活可能有关。


http://www.ppmy.cn/news/1576332.html

相关文章

避坑!用Docker搞定PHP开发环境搭建(Mac、Docker、Nginx、PHP-FPM、XDebug、PHPStorm、VSCode)

本次更新主要是对环境版本进行了更新&#xff0c;例如php 7.3.7升级到了7.3.8&#xff0c;另外之前的版本有同学踩了坑&#xff0c;主要是官方docker镜像php:7.3.7-fpm和php:7.3.8-fpm使用了不同版本的debian&#xff0c;后面会提到&#xff0c;请各位同学留意。 因为最近换电脑…

【vue-echarts】——01.认识echarts

文章目录 前言一、echarts二、使用步骤1.vue cli创建项目并安装第三方模块echarts2.显示图表总结前言 定制的数据可视化图表。ECharts最初由百度团队开源,并于2018年初捐赠给Apache基金会,成为ASF孵化级项目。2021年1月26日晚,Apache基金会官方宣布ECharts项目正式毕业。 一…

动态内存池设计与环形缓冲区实现详解

一、动态内存池设计 在嵌入式系统中&#xff0c;频繁使用 malloc 和 free 会导致内存碎片和性能问题。动态内存池通过预分配固定大小的内存块&#xff0c;并统一管理分配与释放&#xff0c;显著提高内存使用效率和实时性。 静态内存分配&#xff1a;在编译时确定大小&#xf…

实现dify与docker下载安装

1.先要下载安装wsl &#xff0c;先在任务面板进行一些勾选操作&#xff0c;控制面板快捷键ctrlx 2.下载安装wsl 在cmd中输入 wsl --status&#xff0c;如果报错则进行wsl --update&#xff0c;下载过慢则先按ctrlc终止程序&#xff0c;后输入wsl --update -web download 3.下…

LabVIEW 项目长时间稳定运行注意事项

利用 LabVIEW 开发的上位机显示界面通过网络与数字板实现数据通讯&#xff0c;运行一周左右会出现一次数据掉线&#xff08;数据采集不上来&#xff09;&#xff0c;需重新 Connect 才能恢复的问题。 出现这种情况&#xff0c;可能是以下几方面原因导致&#xff1a; 网络通讯方…

加入二极管的NE555 PWM 电路

只用电阻、电容构成的一般定时电路的占空比无法低于50%&#xff0c;如下图&#xff1a; 电容的充电路径上串联了R1 和R2&#xff0c;而放电路径上只有R2&#xff0c;所以放电的时间不可能比充电长。加入二极管就能解决这个问题&#xff0c;用二极管把充电和放电路径分离开&…

问题修复-后端返给前端的时间展示错误

问题现象&#xff1a; 后端给前端返回的时间展示有问题。 需要按照yyyy-MM-dd HH:mm:ss 的形式展示 两种办法&#xff1a; 第一种 在实体类的属性上添加JsonFormat注解 第二种&#xff08;建议使用&#xff09; 扩展mvc框架中的消息转换器 代码&#xff1a; 因为配置类继…

物联网 智慧园区井盖管理办法和功能介绍

在园区内实现 智慧井盖 的定位、内部气体检测和红外监测等顶级功能&#xff0c;可以显著提升园区的安全管理水平和运维效率。以下是智慧井盖系统的详细设计方案和功能实现&#xff1a; 一、系统架构 智慧井盖系统可以分为以下层次&#xff1a; 1. 感知层 定位模块&#xff1…