使用源代码编译R包的过程

news/2024/9/22 18:41:41/

R包的安装方式可以归纳为 源代码安装二进制文件安装 两类: 源代码安装 是指从包的源代码进行编译安装。包括:① 通过CRAN安装源代码版本的包(如果没有二进制版本,或者指定了安装源代码)。② 从GitHub、Bioconductor等平台获取源码并安装。③ 本地源码包的安装。 二进制文件安装 是指直接安装编译好的包,无需编译。这种方式通常更快,特别是在Windows和macOS上。包括:① 通过CRAN直接下载并安装预编译的二进制包。② 安装本地的二进制包文件。

安装过程中任意一个环节出错都会安装失败,具体失败原因查看报错内容!!!因此掌握R包安装过程并学会查看报错内容是自己解决环境问题的不二法门。

R__3">R编译流程

R 编译包的过程涉及多个步骤,包括配置、编译源代码、链接库以及安装包。R 包可以包含纯 R 代码、C/C++、Fortran 等多种语言的代码,编译过程视具体情况而定。以下是 R 编译包的具体流程和各个步骤的详细解释:

1. 准备工作

  • 包源代码通常打包成 .tar.gz 格式,包含 DESCRIPTION 文件、R 脚本文件(通常位于 R/ 目录)、文档(man/)、示例代码(tests/examples/)、源代码(src/ 目录)以及其他辅助文件。
  • R 包的源代码可以通过 R CMD build 生成。

R__11">2. R 包安装流程

安装一个 R 包的常见命令是:

R CMD INSTALL <package_name>.tar.gz

R 在安装包时会按照以下步骤进行

RIPTION__19">3. 解压包并检查 DESCRIPTION 文件

  • 解压缩: R 首先解压 .tar.gz 文件,检查 DESCRIPTION 文件中的元数据,例如包名、版本、依赖关系等。
  • 依赖检查: 如果包有依赖项,R 会检查是否满足依赖条件,未满足时会尝试安装所需依赖包。

4. 配置(Configure Phase)

  • R 包可能包含一个 configure 脚本(类似于 GNU 编译工具链),它会在编译前执行,用于检查目标系统上是否有合适的工具链和库(例如 gcc, g++, make,以及其他外部依赖),比如使用 pkg-config 工具去查找库路径、PKG_CFLAGPKG_LIBS等。
  • 如果 configure 脚本找到需要的库或编译工具,它会生成 Makevars 文件,包含库路径、编译选项和标志。
  • 这个阶段允许用户自定义编译选项,例如通过设置 PKG_LIBSPKG_CPPFLAGS 等环境变量来指定头文件和库的路径。
  • 以下为安装rjava包时计算机未安装java导致的配置报错

ERROR: configuration failed for package ‘rJava’
removing ‘/root/anaconda3/envs/myview/lib/R/library/rJava’

5. 编译(Compilation Phase)

  • R 代码: 如果包中只有 R 代码,R 不需要编译,只需检查并解析代码即可。
  • C/C++/Fortran 代码:
    • R 会根据 src/ 目录下的文件,调用系统的编译器(如 gcc, g++, gfortran)来编译源代码。R 使用 Makevars 文件或包中的 Makefile 来控制编译过程。
    • 头文件路径和编译标志通过 PKG_CPPFLAGSPKG_CFLAGS 来指定,例如:
      PKG_CPPFLAGS = -I/usr/local/include
      
    • 链接阶段使用 PKG_LIBS 指定库路径和库名,例如:
      PKG_LIBS = -L/usr/local/lib -lmylib
      
    • 编译器将 .c.cpp 文件编译为目标文件(.o 文件)。

6. 链接(Linking Phase)

  • 编译完成后,R 会调用链接器将生成的目标文件(.o 文件)与外部库进行链接,生成共享对象文件(.so)。
  • 这些 .so 文件是可以被 R 动态加载的,允许 R 通过 .Call().C() 等函数与本地代码进行交互。

7. 安装(Installation Phase)

  • 一旦编译和链接完成,R 会将编译生成的二进制文件、R 脚本文件、文档等按照目录结构安装到用户的 R 库路径中。安装路径通常在 .libPaths() 所列的目录中。
  • 如果包有动态链接的共享库(如 .so 文件),R 会在加载包时通过系统的动态链接器找到并加载这些库。

8. 后续步骤

  • 字节码编译(可选): R 会将 R 脚本字节码编译.rds 文件以加快加载速度。
  • 文档生成: R 还会自动处理包中的文档文件(man/),使用 roxygen2Rd 格式生成帮助文档。
  • Vignettes 编译: 如果包包含 vignettes,R 会调用 Sweave 或 knitr 编译 vignettes 为可读的 PDF 或 HTML 文件。

9. 清理(Optional Clean Up)

  • R 安装包后,临时文件(如中间生成的 .o 文件和未使用的临时文件)会被删除,除非在安装时使用 --no-clean-on-error 选项保留这些文件以便调试。

10. 加载包

  • 完成安装后,用户可以通过 library()require() 加载包,R 会通过动态链接器加载所需的动态库,并运行包中的初始化代码(如果有)。

R__63">举例:一个包含 C 代码的 R编译过程

假设一个包包含 src/ 目录下的 C 代码文件 mylib.c

  1. 解压 .tar.gz 并读取 DESCRIPTION 文件。
  2. 执行 configure,根据需要生成 Makevars 文件,指定编译和链接选项。
  3. 调用 gcc 编译 mylib.cmylib.o
    gcc -I/path/to/R/include -I/usr/local/include -c mylib.c -o mylib.o
    
  4. 链接 mylib.o 生成共享对象文件:
    gcc -shared -o mylib.so mylib.o -L/usr/local/lib -lmylib
    
  5. 将生成的 mylib.so 以及其他文件安装到 R 包库路径中
    完成编译和链接后,R 会将 mylib.so 文件和其他必要的文件(如 R 脚本、文档等)安装到 R 包的库路径中,这个路径通常是 .libPaths() 所列的目录。
  6. 用户通过 library(mypackage) 加载包完成安装后,用户可以通过以下命令加载包:
    library(mypackage)
    

总结

  • R编译过程 包含配置、编译源代码、链接库、安装等多个步骤。每个步骤都依赖于包的内容(是否有 C/C++ 代码、外部库依赖等)。
  • 编译时的控制:通过 PKG_CPPFLAGS 指定头文件路径,通过 PKG_LIBS 指定库文件路径和库名。动态链接器不会在编译时使用 LD_LIBRARY_PATH,它仅用于运行时查找共享库。

http://www.ppmy.cn/news/1528960.html

相关文章

Spark-ShuffleWriter-UnsafeShuffleWriter-钨丝内存分配

一、上下文 《Spark-ShuffleWriter-UnsafeShuffleWriter》中提到在进行Page内存分配时&#xff0c;调用了一行代码 MemoryBlock page memoryManager.tungstenMemoryAllocator().allocate(acquired); 这里就会走MemoryManager的钨丝内存分配&#xff0c;下面我们来详细看下 …

龙蜥8.9系统hadoop3.3.6上spark3.5.2安装(伪分布)

继续接着上篇的环境安装。 1、去清华的镜像源下载相关文件 https://mirrors.tuna.tsinghua.edu.cn/apache/spark/spark-3.5.2/ 2、解压缩 tar zxvf spark-3.5.2-bin-hadoop3.tgz3、移动到适当位置 mv spark-3.5.2-bin-hadoop3 /app/spark-34、下载scala https://www.scala-la…

golang学习笔记2-语法要求,注释与代码风格

注&#xff1a;本人已有C&#xff0c;C,Python基础&#xff0c;只写本人认为的重点。 一、语法要求 1.每个go文件必须有package声明且只能有一个 2.定义过的变量&#xff08;全局变量除外&#xff09;或使用import导入的包在之后必须使用 3.和C/C一样&#xff0c;一个项目只能有…

【django】局域网访问django启动的项目

目录 一、现象 二、django的settings.py配置 三、启动django项目 四、获取本机IP 五、局域网机器访问 前言&#xff1a;本机使用pycharm启动的项目&#xff0c;局域网其他机器访问 一、现象 django开发了接口&#xff0c;想给其他同志访问接口测试&#xff0c;无法通过I…

引入第三方字体图标icon

引入第三方字体图标icon 1.登录阿里巴巴icon库 2.点开ui提供的字体图标并下载 3.解压download 将font_4008950_i6fkbudh8ld文件放置项目中例如&#xff1a;放在assets文件夹下 4.然后再main.js中引入 import ‘/assets/font_4008950_i6fkbudh8ld/iconfont.css’; 5.项目中应…

三种springboot启动时加载方式

三种springboot启动时加载方式一个注解&#xff0c;两个接口&#xff0c;常用于数据预热&#xff1a;PostConstructimplements CommandLineRunnerimplements ApplicationRunnerSlf4j EnableAsync SpringBootApplication public class ApiApplication extends SpringBootServlet…

【Matlab 肌电信号分析】

一、数据预处理 1.1 数据读取 使用matlab从rhd文件中读取原始数据&#xff0c;共64个通道。 1.2 数据滤波 使用 60Hz的Notch filter 和150Hz的高通Butterworth滤波器进行降噪 二、波峰提取 > 每个通道分别根据相应的规则提取出波峰、波谷附近的波形。 三、信号聚类 3.1 降…

计算机网络通关学习(一)

简介 之前我通过王道的考研课进行了计算机网络的学习&#xff0c;但是在秋招准备过程中发现之前的笔记很多不足&#xff0c;学习的知识不够深入和巩固&#xff0c;所以再重新对《图解HTTP》&《图解TCP/IP》进行深度学习后&#xff0c;总结出了此篇博客&#xff0c;由于内容…