【R语言】apply函数族

ops/2025/2/11 3:00:16/

在R语言中使用循环操作时是使用自身来实现的,效率较低。所以R语言有一个符合其统计语言出身的特点:向量化。R语言中的向量化运用了底层的C语言,而C语言的效率比高层的R语言的效率高。

apply函数族主要是为了解决数据向量化运算的问题,以提高运行效率

一、apply()函数

它是apply()函数族中最简单的函数,它的作用是将一个函数运用到矩阵或数组的某个维度。

此函数有3个参数:

  1. X:输入的数据,一般是矩阵或数据框;
  2. FUN:需要使用的函数;
  3. GARGIN:指定函数在哪个维度上运行。其中1表示行,2表示列;如果是数组,还可以是更大的数字。

1、apply()函数运用到矩阵 

x <- matrix(1:24, 6, 4)
x
# 计算每一行的最小值
apply(X=x, MARGIN=1, FUN=min)
# 计算每一列的平均值
apply(X=x, MARGIN=2, FUN=mean)

# 将x中的一个元素改为NA,然后计算每一行的最小值
x[2,4] <- NA
apply(X=x, MARGIN=1, FUN=min)
# 使用min()函数中删除缺失值的参数na.rm
apply(X=x, MARGIN=1, FUN=min, na.rm=TRUE)

如下结果所示,当x中有NA时,得到的结果也会是NA。 

 2、apply()函数运用到数组

x <- array(1:24, dim=c(4,3,2))
x
apply(x, MARGIN=3, FUN=mean)

当MARGIN参数为向量时

x <- array(1:24, dim=c(4,3,2))
x
apply(x, MARGIN=c(1,3), FUN=mean)

MARGIN=c(1,3)表示对第1维(行)和第3维(深度/层)进行操作,而保持第2维(列)不变。

借助以下代码辅助理解。 

x <- array(1:24, dim=c(4,3,2))
x
apply(x, MARGIN=c(1,3), FUN=paste, collapse="-")

也可以在apply()函数中使用自定义函数或匿名函数:

apply(x, MARGIN = 3, FUN =function(x){list(range=range(x),mean=mean(x))})

二、lapply()函数

此函数允许输入数据为原子向量或递归向量,并将函数应用于输入数据的每一个元素,输出结果为与输入数据长度相同的列表。

它的参数是X和FUN,意义与apply()函数的一致。

1、输入数据为向量时

x <- 1:5
lapply(x, function(x){x^3})

2、输入数据为矩阵时

lapply()函数会将FUN中的函数应用于每个值,而不是按照列或行进行应用。

y <- matrix(1:4, 2, 2)
y
lapply(y, min)

3、输入数据为列表时

z <- list(x)
z
lapply(z,function(z){z^3}) 

4、输入数据为数据框时

lapply()函数会将FUN中的函数应用于每一列。

a <- data.frame(x=1:4,y=5:8)
a
lapply(a,max)

三、sapply()函数

sapply()函数其实是lapply()函数的灵活版本,除了X和FUN这两个参数外,它还多了simplify和USE.NAMES两个参数。

simplify:默认为TRUE,表示要求输出的结果为向量或矩阵;也可以让其等于array,表示输出结果为数组。

USE.NAMES:默认为TRUE,表示当输入为字符串时,将以字符串为输出命名。

a <- data.frame(x=1:4,y=5:8)
a
# 当simplify和USE.NAMES都默认为TRUE时
sapply(a,max)

当输入为字符串且USE.NAMES为TRUE时:

b = letters[1:5]
sapply(b,function(x) paste(x,"-",x))

当simplify和USE.NAMES都为FALSE时,sapply()函数的输出结果与lapply()函数完全一致。

a
sapply(a,max,simplify=FALSE, USE.NAMES=FALSE)
lapply(a,max)

四、vapply()函数

此函数与sapply()函数类似,仅多了一个FUN.VALUE的参数,此参数表示指定返回值的类型和形状。

x <- list(a=1:4,b=5:8,c=9:13)
x
sapply(x, function(x){x+2})
vapply(x, function(x){x+2}, FUN.VALUE=numeric(4))

通过FUN.VALUE=numeric(4)将返回值的长度设为4,如果其中某个返回值的长度不为4($c),就会报错。 

五、mapply()函数

 mapply()函数是sapply()函数的多变量版本。

在sapply()函数中,FUN参数指定的函数只能同时接受一个向量,而mapply()函数中的FUN参数指定的函数可以同时接受多个向量

如下所示,FUN中指定的函数接受了两个向量:2:6和10:14

mapply(FUN=function(x,y) c(x+y,x*y),2:6,10:14)


http://www.ppmy.cn/ops/157425.html

相关文章

Linux之守护进程,应用层协议

Linux之守护进程&#xff0c;网络版的计算器&#xff0c;HTTP协议 一.守护进程1.1守护进程的概念1.2守护进程的意义1.3实现守护进程 二.应用层协议2.1应用层协议的含义2.1应用层协议的意义 三.模拟实现网络版计算器3.1自己实现的序列化与反序列化3.1json版的序列化与反序列化 一…

DeepSeek从入门到精通:全面掌握AI大模型的核心能力

文章目录 一、DeepSeek是什么&#xff1f;性能对齐OpenAI-o1正式版 二、Deepseek可以做什么&#xff1f;能力图谱文本生成自然语言理解与分析编程与代码相关常规绘图 三、如何使用DeepSeek&#xff1f;四、DeepSeek从入门到精通推理模型推理大模型非推理大模型 快思慢想&#x…

C# base关键字使用

使用base的情况&#xff1a; static void Main(string[] args) {//本文来自 www.LuoFenMing.comAnimal animal new Dog("Dog");animal.SayName();//输出结果&#xff1a; My Name is DogConsole.ReadKey(); } public abstract class Animal {public Animal(string n…

c语言:取绝对值

假设我们有一个 long 类型的变量 l&#xff0c;我们希望恢复其绝对值。以下是两种方法的对比&#xff1a; 方法1&#xff1a;使用条件语句 这个很好理解&#xff0c;负数时取负运算 &#xff0c;用于数值的符号反转。 long abs_value(long l) {if (l < 0) {return -l;} e…

Mac安装配置使用nginx的一系列问题

brew安装nginx https://juejin.cn/post/6986190222241464350 使用brew安装nginx&#xff0c;如下命令所示&#xff1a; brew install nginx 如下图所示&#xff1a; 2.查看nginx的配置信息&#xff0c;如下命令&#xff1a; brew info nginxFrom:xxx 这样的&#xff0c;是n…

Redis - 全局ID生成器 RedisIdWorker

文章目录 Redis - 全局ID生成器 RedisIdWorker一、引言二、实现原理三、代码实现代码说明 四、使用示例示例说明 五、总结 Redis - 全局ID生成器 RedisIdWorker 一、引言 在分布式系统中&#xff0c;生成全局唯一ID是一个常见的需求。传统的自增ID生成方式在分布式环境下容易出…

webpack配置之---上下文

context context 是 Webpack 配置中的一个重要属性&#xff0c;它主要用于确定模块解析时的基础目录。可以理解为是 Webpack 在解析模块时&#xff0c;基于哪个目录作为根路径来查找模块。context 的默认值是 process.cwd()&#xff0c;即当前执行 Webpack 命令时的工作目录。…

RKMPP依赖硬件单元

rkmpp&#xff08;Rockchip Media Process Platform&#xff09;主要依赖瑞芯微&#xff08;Rockchip&#xff09;芯片中的 VPU&#xff08;Video Process Unit&#xff0c;视频处理单元&#xff09; 和 RGA&#xff08;Raster Graphic Acceleration Unit&#xff0c;2D图形加速…