【R语言】 文件,vector, matrix,dataframe 的基本操作

devtools/2025/3/19 23:52:03/

1. 文件读取:here(), 以及glimpse的使用

cereal <- read.csv(here("datasets", "Cereal.csv"))
cereal |> glimpse() # ‘ dplyr ’包中的‘ glimpse() ’函数提供了‘ cereal ’数据集的快速

read.csv(here("datasets", "Cereal.csv"))

  • here("datasets", "Cereal.csv"):构建一个文件路径,指向当前工作目录下的 datasets 文件夹中的 Cereal.csv 文件。
  • read.csv():从 Cereal.csv 文件中读取数据,并将其存储为一个数据框(data.frame)。

cereal |> glimpse()

  • glimpse():由 dplyr 包提供的函数,用于查看数据框的结构。与 str() 类似,但 glimpse() 提供了更简洁和易读的输出,可以快速查看数据的列名、类型以及前几个数据值。

2. 读取变量类别

cereal |> class()

3. 读取列名

cereal |> colnames()

4. 读取行数

cereal |> nrow()

5. 读取行列

cereal |> dim()

6. 提取列的三种方法

Cal <- cereal$calories Cal <- cereal |> select(calories)Cal <- cereal |> pull(calories)

7. 提取前xx行

cereal[1:20,] 
cereal |> slice(1:20) 

8. 获取带条件的dataframe

Kelloggs <- cereal |> filter(mfr == "K") 

9. 转换成str

str(cereal)

10. 查看factor的元素

levels(cereal.with.factors$mfr)
nlevels(cereal.with.factors$mfr) # 个数

11. 提取成向量而不是数据框:pull()

cereal.calories <- cereal |> select(calories) |> pull()

select(calories)

  • 这个函数从 cereal 数据框中选择名为 calories 的列。select() 返回的是一个包含所选列的新的数据框。

pull()

  • pull() 用于将选择的列从数据框中提取为一个向量。它会返回一个单独的向量,而不是数据框。

12. 获取长度

length(cereal.calories)

13. 数据框转matrix,并且判断

cereal.matrix <- as.matrix(cereal)
is.matrix(cereal.matrix)

14. matrix删除某列

cereal.removed <- cereal |> select(-c(mfr, name))

15. 描述性统计

summary(cereal$sodium)

16. 计算每个factor的均值

mean.sodiums <- aggregate(sodium ~ mfr, data = cereal, FUN = mean)

http://www.ppmy.cn/devtools/168478.html

相关文章

matlab R2024b下载教程及安装教程(附安装包)

文章目录 前言一、matlab R2024b安装包下载二、matlab R2024b安装教程 前言 为帮助大家顺利安装该版本软件&#xff0c;特准备matlab R2024b下载教程及安装教程&#xff0c;它将以简洁明了的步骤&#xff0c;指导你轻松完成安装&#xff0c;开启 MATLAB R2024 的强大功能之旅。…

Qt之自定义界面组件 一

通过qt中的painter绘图事件绘制一个电池电量图的变化。效果如下图 创建一个基于界面widget工程&#xff0c;在wdiget界面添加一个widget界面,将添加的widget界面的类提升为Tbattery.在Tbattery类中重写painEvent电池电量代码 文件目录结构 主要部分代码 //Tbattery.cpp #inc…

【eNSP实战】使用ACL实现路由器安全

拓图 要求&#xff1a; 允许 10.0.0.0 网段 telent 登录AR1&#xff0c;不允许其他主机telnet登录路由器设置接口如图所示 AR1接口配置 interface GigabitEthernet0/0/0ip address 30.0.0.1 255.255.255.0 # ip route-static 0.0.0.0 0.0.0.0 30.0.0.2AR2接口配置 interf…

使用DeepSeek和墨刀AI,写PRD文档、画原型图的思路、过程及方法

使用DeepSeek和墨刀AI&#xff0c;写PRD文档、画原型图的思路、过程及方法 现在PRD文档要如何写更高效、更清晰、更完整&#xff1f; 还是按以前的思路写PRD&#xff0c;就还是以前的样子。 现在AI这么强大&#xff0c;产品经理如何使用DeepSeek写PRD文档&#xff0c;产品经…

沐数科技数据开发岗笔试题2025

描述性统计 标准差 答案: A 解析: 标准差 衡量数据集中数值变化或离散程度的一种度量。它反映了数据集中的各个数值与数据集的平均值&#xff08;均值&#xff09;之间的偏离程度。标准差越大&#xff0c;表明数据的分布越分散&#xff1b;标准差越小&#xff0c;表明数据…

springBoot中不添加依赖 , 手动生成一个token ,并校验token (使用简单 , 但是安全会低一点)

在 Spring Boot 里&#xff0c;即便不添加额外依赖&#xff0c;也能手动生成和校验 Token。下面以简单的基于时间戳和密钥的方式来生成和校验 Token 为例&#xff0c;介绍具体实现步骤。 实现思路 生成 Token&#xff1a;把用户信息、时间戳等数据组合起来&#xff0c;再用密…

Matlab 单球机器人动力学与LQR控制研究

1、内容简介 Matlab 179-单球机器人动力学与LQR控制研究 可以交流、咨询、答疑 2、内容说明 略单球机器人是一种本征不稳定的动平衡机器人&#xff0c;它与地面单点接触&#xff0c;运动灵活&#xff0c;同时具有多变量、高度非线性、时变等特点&#xff0c;近年来成为轮式机…

Spring中的循环依赖问题是什么?

在使用Spring框架进行开发时&#xff0c;可能会遇到一个比较棘手的问题&#xff0c;那就是循环依赖。说到循环依赖&#xff0c;很多人可能会感到有些困惑&#xff0c;难道这个问题真的有那么复杂吗&#xff1f;其实&#xff0c;理解循环依赖并不是很难。我们可以从Spring的依赖…