视频教程
先上教程视频,B站同步播出:
https://www.bilibili.com/video/BV1miNVeWEkw
完整视频回放可见:R语言入门课回放来啦
"R语言入门课"是我们认为生信小白入门不得不听的一个课程,我们也为这个课程准备了许多干货。在第二节课中,我们给大家详细的介绍了R及Rstudio的安装过程,大家赶紧装起
图文内容
1、R语言安装
R是用于统计分析、绘图的语言和操作环境。R是一款属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。安装路径不可以包含中文名称。
访问下载地址:https://cran.r-project.org/
点击选择合适自己系统的R版本:
Linux中的R与Rstudio安装配置可见:Rstudio-server的安装、配置、维护
第一次安装时需要选择镜像:
如果你是Windows环境,可以点击这里:
下载完成后,你将获得一个.exe结尾的文件:
双击运行,无脑点下一步即可,注意安装路径中不要有中文与特殊字符:
安装成功后,你将会获得一个桌面图标:
双击运行后,即可进入原汁原味的R界面:
2、Rstudio安装
RStudio是一款集成开发环境(IDE)。R自带的环境操作起来可能不是很方便,而Rstudio具有代码编辑、调试、数据查看、集成控制、可视化等功能,支持纯R脚本、Rmarkdown等。安装路径不可以包含中文名称。
下载地址:RStudio Desktop - Posit
Windows点击下载安装包:
下载后同样双击打开安装包:
同样狂点下一步,路径中不要出现中文与特殊字符:
Windows导航栏能够搜到Rstudio即安装成功:
更多教程与辅导可见:
R语言入门课
1、课程简介
生信基地希望能够给大家提供系统性、形成性、规范性的生信教学。前面几次活动中同学们表示希望能够有线下集中学习以及针对性的指导、答疑。所以,此次我们已推出"生信R语言入门课",分为"R介绍"、"R语言数据对象"、"基本数据管理"、"图形初级(ggplot2)"四个模块共12节课。当然,我们也不做生信快餐,本次活动回放已剪辑完毕,方便错过活动的小伙伴加入。后续我们会持续拉群在群里进行课程内容的答疑。
2、R语言介绍
R语言是一种专门为统计分析、数据可视化和计算而设计的编程语言,广泛应用于各个领域。R语言支持各种统计分析方法,如线性回归、方差分析、聚类分析等,同时也能够进行复杂的图形和数据可视化。R语言凭借其开源、免费、工具包丰富、数据处理能力强、可视化丰富的特性在生物信息学中被广泛应用。例如RNA-Seq差异分析常用的DESeq2、edgeR的引用次数多达数万次。我们制作的单细胞教程几乎也全是基于R语言环境。很多同学找我们学习单细胞的时候都表示不想学习R语言,直接学习单细胞分析,不积跬步无以至千里,这显然是不现实的,所以,欢迎大家来参加此次的课程。
资料&课表
目前12节总计5.5h的视频课程回放已剪辑完毕,方便错过直播的同学随时加入学习:
除了学习视频外,还给大家准备了学习资料,包括学习手册、课后习题。大家人手一份资料可以跟着视频联系:
课程目录:
1 、R介绍
1.1 R 下载与安装
1.1.1 RStudio
1.1.2 R的帮助函数
1.1.3 用于管理R工作区的函数
1.2 包(Packages)
1.2.1 包的基本函数
1.2.2 包处理大型数据集的示例展示
2、 R语言数据对象
2.1 理解数据集
2.2 数据结构
2.2.1 向量(vector)
2.2.2 矩阵(matrix)
2.2.3 数组(array)
2.2.4 数据框(data)
2.2.5 因子(factor)
2.2.6 列表(list)
2.3 数据输入
2.3.1 从带分隔符的文本文件导入数据
2.3.2 导入Excel数据
3、基本数据管理
3.1 创建新变量
3.2 变量的重编码(recoding)
3.3 变量的重命名
3.4.缺失值(NA)
3.5 类型判断和转换
3.6 数据排序
3.7 数据集的合并
3.8 选取变量
3.9 选取观测值
3.10 subset()函数选择观测值或变量
3.11 剔除变量
3.12 dplyr包
3.13 使用管道操作符对语句进行串接
4、图形初级(ggplot2)
4.1 使用ggplot2包创建图形
4.1.1 函数ggplot2()
4.1.2 geom()函数
4.1.3 分组
4.1.4 标尺
4.1.5 刻面
4.1.6 标签
4.1.7主题
4.2 ggplot2包的详细信息
4.2.1 放置数据和映射选项
4.2.2 将图形作为对象使用
4.2.3 保存图形