【R语言】文件，vector, matrix,dataframe 的基本操作

devtools/2025/3/19 23:52:03/

1. 文件读取：here(), 以及glimpse的使用

cereal <- read.csv(here("datasets", "Cereal.csv"))
cereal |> glimpse() # ‘ dplyr ’包中的‘ glimpse() ’函数提供了‘ cereal ’数据集的快速

read.csv(here("datasets", "Cereal.csv"))

here("datasets", "Cereal.csv")：构建一个文件路径，指向当前工作目录下的 datasets 文件夹中的 Cereal.csv 文件。
read.csv()：从 Cereal.csv 文件中读取数据，并将其存储为一个数据框（data.frame）。

cereal |> glimpse()

glimpse()：由 dplyr 包提供的函数，用于查看数据框的结构。与 str() 类似，但 glimpse() 提供了更简洁和易读的输出，可以快速查看数据的列名、类型以及前几个数据值。

2. 读取变量类别

cereal |> class()

3. 读取列名

cereal |> colnames()

4. 读取行数

cereal |> nrow()

5. 读取行列

cereal |> dim()

6. 提取列的三种方法

Cal <- cereal$calories Cal <- cereal |> select(calories)Cal <- cereal |> pull(calories)

7. 提取前xx行

cereal[1:20,] 
cereal |> slice(1:20)

8. 获取带条件的dataframe

Kelloggs <- cereal |> filter(mfr == "K")

9. 转换成str

str(cereal)

10. 查看factor的元素

levels(cereal.with.factors$mfr)
nlevels(cereal.with.factors$mfr) # 个数

11. 提取成向量而不是数据框：pull()

cereal.calories <- cereal |> select(calories) |> pull()

select(calories)：

这个函数从 cereal 数据框中选择名为 calories 的列。select() 返回的是一个包含所选列的新的数据框。

pull()：

pull() 用于将选择的列从数据框中提取为一个向量。它会返回一个单独的向量，而不是数据框。

12. 获取长度

length(cereal.calories)

13. 数据框转matrix，并且判断

cereal.matrix <- as.matrix(cereal)
is.matrix(cereal.matrix)

14. matrix删除某列

cereal.removed <- cereal |> select(-c(mfr, name))

15. 描述性统计

summary(cereal$sodium)

16. 计算每个factor的均值

mean.sodiums <- aggregate(sodium ~ mfr, data = cereal, FUN = mean)

【R语言】文件，vector, matrix,dataframe 的基本操作

1. 文件读取：here(), 以及glimpse的使用

2. 读取变量类别

3. 读取列名

4. 读取行数

5. 读取行列

6. 提取列的三种方法

7. 提取前xx行

8. 获取带条件的dataframe

9. 转换成str

10. 查看factor的元素

11. 提取成向量而不是数据框：pull()

12. 获取长度

13. 数据框转matrix，并且判断

14. matrix删除某列

15. 描述性统计

16. 计算每个factor的均值

相关文章

matlab R2024b下载教程及安装教程（附安装包）

Qt之自定义界面组件一

【eNSP实战】使用ACL实现路由器安全

使用DeepSeek和墨刀AI，写PRD文档、画原型图的思路、过程及方法

沐数科技数据开发岗笔试题2025

springBoot中不添加依赖 , 手动生成一个token ,并校验token (使用简单 , 但是安全会低一点)

Matlab 单球机器人动力学与LQR控制研究

Spring中的循环依赖问题是什么？

【R语言】 文件，vector, matrix,dataframe 的基本操作

1. 文件读取：here(), 以及glimpse的使用

2. 读取变量类别

3. 读取列名

4. 读取行数

5. 读取行列

6. 提取列的三种方法

7. 提取前xx行

8. 获取带条件的dataframe

9. 转换成str

10. 查看factor的元素

11. 提取成向量而不是数据框：pull()

12. 获取长度

13. 数据框转matrix，并且判断

14. matrix删除某列

15. 描述性统计

16. 计算每个factor的均值

相关文章

【R语言】文件，vector, matrix,dataframe 的基本操作