一、数据类型
(重点只有两个,剩下的不看)
1.1 向量(vector)
矩阵(Matrix)
数组(Array)
1.2 数据框(Data frame)
x<- c(1,2,3) #常用的向量写法,c表示concatenate,意为将x定义为由元素1,2,3组成的向量。x
x<- 1:10 #从1-10之间所有的整数x
x<- seq(1,10,by = 0.5) #1-10之间每隔0.5取一个数(注意是逗号不是分号)x
x<- rep(1:3,times=2) #1-3 重复2次x
二、从向量中提取元素
2.1 根据元素位置
x = 1:8
#这里的x是你刚才赋值的变量名,根据自己的情况来修改
x[4] #x第4个元素
x[-4]#排除法,除了第4个元素之外剩余的元素
x[2:4]#第2到4个元素
x[-(2:4)]#除了第2-4个元素
x[c(1,5)] #第1个和第5个元素
2.2 根据值
x[x==10]#等于10的元素
x[x<0]
x[x %in% c(1,2,5)]#存在于向量c(1,2,5)中的元素
三、数据框的读取、导出、查看
3.1读取本地数据
X<-read.csv('doudou.txt')
下图是示例数据。将示例数据放在你的工作目录下(重要),记得用project管理工作目录。
a = read.table(file="huahua.txt", sep="\t", header=T)
运行结果
3.2 查看行名和列名、行数和列数
colnames(a) #查看列名
rownames(a) #查看行名,默认值的行名就是行号,1.2.3.4...
dim(a)#几行几列
3.3 数据框的导出
write.table(a,file = "yu.txt",sep = ",",quote=F) #分隔符改为逗号,字符串不加双引号(默认格式带由双引号)
3.4 变量的保存与重新加载
#这次没有处理完的数据下次想接着用怎么办?--学会保存和重新加载。保存的格式是RData。
save.image(file="bioinfoplanet.RData")#保存当前所有变量
save(a,file="test.RData")#保存其中一个变量
load("test.RData")#再次使用RData时的加载命令
3.5 提取元素
- a[x,y] #第x行第y列
- a[x,] #第x行
- a[,y] #第y列
- a[y] #也是第y列
- a[x:y] #第x列到第y列
- a[c(a,b)] #第a列和第b列
- a$列名 #也可以提取列(优秀写法,支持Tab自动补全哦,不过只能提取一列)
3.6 直接使用数据框中的变量
iris是R语言的内置数据,可以直接使用。提取某两列作散点图:
plot(iris$Sepal.Length, iris$Sepal.Width)
四、 常见问题
一个问题:save(a,file=“test.RData”)这句代码如果报错object a not found,是为什么,应该怎么解决?
a不存在,未定义或者不在该环境中。
最好先打印 a 的数值看一下。