其他
1、NaN值
MATLAB判断数据是否为NaN可以直接使用函数:isnan()
三、数据分析
1、相关性
均值、方差、协方差、标准差、相关系数
mean() %均值
nanmean()%去除NAN值求均值
var() %方差
cov() %协方差
std() %标准差
corrcoef(B,b) %R² 相关系数plot() %绘图
rcoplot(r,rint) %残差个案排序图,详情后见
二维数组中所有非NAN元素的平均值
AA = reshape(A, size(A,1)*size(A,2),1)%将2维转1维
A=nanmean(AA)
1.1 散点图、折线图
绘图详情见后方 :二、绘图
plot(x,y,'*',X,Y,'-')
1.2 协方差及协方差矩阵
协方差用来衡量两个变量的总体误差,如果两个变量的变化趋势一致,协方差就是正值,说明两个变量正相关。如果两个变量的变化趋势相反,协方差就是负值,说明两个变量负相关。如果两个变量相互独立,那么协方差就是0,说明两个变量不相关。
1.3 相关系数
相关系数(Correlation coefficient)是反应变量之间关系密切程度的统计指标,相关系数的取值区间在1到-1之间。1表示两个变量完全线性相关,-1表示两个变量完全负相关,0表示两个变量不相关。数据越趋近于0表示相关关系越弱。
R
R²
标准差
协方差
2、分析测试
2.1 一元回归及多元回归、残差图分析
回归分析(regression analysis)是确定两组或两组以上变量间关系的统计方法。
B=data(:,3);
B=B';
b=data(:,6);
b=b';
X = [ones(length(b),1), B'];%x'表示行向量转置为列向量
Y = b';
%根据输入参数y与X,用最小二乘法求线性回归系数b
[ b,bint,r,rint,stats ] = regress(Y,X);
rcoplot(r,rint) %残差个案排序图
a=b(1)+(b(2))*B
plot(B,Y,'*',B,a,'-') %残差点线图
2.2 显著性水平p值
[r,p]=corr(yy',xx'); %p为显著性水平
%[h,p,ci,stats1] = ttest2(yy,xx);
一、不同格式文件数据的读取、写入、存储
1、常用
1.1 .xls、.xlsx
将p写入表格路径,读取成p,读取xls中字符串
xlswrite ('D:\study\AOD\2020beijing\data.xls', P);
p=xlsread('D:\study\AOD\2020beijing\data.xls');
p=xlsread('D:\study\AOD\2020beijing\data.xls','Sheet1');%sheet1子表格名
[~,~,raw]=xlsread('D:\study\CE-318\a指数550_2021_1.xlsx','Sheet2')%raw获取包括字符串内容
data=raw(:,:);
1.2 .mat
另存为Excel数据
(1)将matlab中mat格式的数据保存为 xls 文件,命令为:
xlswrite('训练_42.xlsx',sounds_y2);
%其中“训练_42.xlsx”为另存为文件的名称,sounds_y2为原mat格式的数据
(2)将Excel数据读入到matlab中,命令为:
testlabel=xlsread('testlabel.xlsx');
2、专业
.tiff、.tif
[A,R] = geotiffread(‘文件路径’)
A:数据
R:属性
[A,R] = geotiffread('D:\study\AOD\AVR\2021002.tif') %%%多波段
filepath='D:\study\AOD\AVR\2021002.tif'; %%图像名称与路径
Info=imfinfo(filepath); %%获取图片信息
Slice=size(Info,1); %%获取图片z向帧数
Width=Info.Width;
Height=Info.Height;
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
Image=zeros(Height,Width,Slice);
for i=1:SliceImage(:,:,i)=imread(filepath,i); %%一层一层的读入图像
end
.hdr
该函数语法规则为:
X = multibandread(filename, size, precision, offset, interleave, byteorder)
filename: 文件名
size:图像尺寸和波段数,size = [ 行数 列数 波段数 ]
precision:读取的图像的数据格式,例如’uint8’,‘uint16’,‘double’等
offset:偏移(这个参数目前我还不是很懂)
interleave:存储的图像的数据格式,有 bsq,bil,bip三种格式
byteorder : 数据存储的字节排列方式,有’ieee-le’(小端),‘ieee-be’(大端)
hdr = read_envihdr('D:\study\AOD\data1\MYD04_L2.A2021001.0900.061.20210_Swath_2D_1_georef.hdr')
Image = multibandread('D:\study\AOD\data1\MYD04_L2.A2021001.0900.061.20210_Swath_2D_1_georef.dat',hdr.size,[hdr.format '=>single'],hdr.header_offset,hdr.interleave,hdr.machine);
% A=Image(:,:,1);
% B=Image(:,:,2);
% C=Image(:,:,3);
A=Image(:,:,4);
.nc
ncFilePath='D:\Alice\研\modis,matlab\data\MYD04_L2.A2020354.0435.061.2020357193838.nc';
%路径
ncdisp(ncFilePath,'/','full');
lon=ncread(ncFilePath,'lon'); %经纬度
lat=ncread(ncFilePath,'lat');%% 显⽰结构
% ncdisp(ncFilePath);%在命令⾏窗⼝中以⽂本形式显⽰ NetCDF 数据源 source 中的所有组、维度、变量定义,以及所有属
性。
% ncdisp(ncFilePath,‘evap’);%显⽰指定变量的内容.
% ncdisp(ncFilePath,’/’,‘min’);%只显⽰⽰例⽂件 example.nc 的组层次结构和变量定义。
% ncdisp(ncFilePath,’/’,‘full’);%全部显⽰所有结构和定义信息
%% 读取变量值
% ncid = netcdf.open(ncFilePath,‘NOWRITE’); %打开nc⽂件返回索引ID
% [ndims,nvars,ngglobalatts,unlimdimid] = netcdf.inq(ncid);%获取维数,变量数,全局属性数量,
% [varname,xtype,dimids,natts] = netcdf.inqVar(ncid,0); %根据变量索引号获取变量的名称
lon=ncread(ncFilePath,‘lon’);%读取经度变量
lat=ncread(ncFilePath,‘lat’);%读取纬度变量
sm_data=ncread(ncFilePath,‘sm’);%读取sm变量
sm_data1=sm_data(1174:1194,240:262);
sm_data1(sm_data10)=[];
aa=sm_data1;
[h,l]=find(aa0);
aa(h,l)=[];
%% 显⽰数据
% pcolor(lat,lon,sm_data);pcolor(X,Y,C) 指定顶点的 x 坐标和 y 坐标,C 的⼤⼩必须与 x-y 坐标⽹格的⼤⼩匹配,例如,如果
X 和 Y 定义⼀个 m×n ⽹格,则 C 必须为 m×n 矩阵.
% [x,y]=meshgrid(lon,lat);%根据经纬度信息产⽣格⽹.
% phandle=pcolor(x,y,sm_data’);%显⽰⼀个矩阵,其中x,y,sm_data的⾏列数必须⼀致。类似surface函数.
% colorbar
% imwrite(sm_data1,‘D:\Alice\研\modis\aa.tif’,‘tif’)
%% 保存为地理栅格tif格式,以便ArcGIS读取.
data=flipud(sm_data1);
R = georasterref(‘RasterSize’, size(data),‘Latlim’, [double(min(lat)) double(max(lat))], ‘Lonlim’,
[double(min(lon)) double(max(lon))]);%地理栅格数据参考对象(类)
geotiffwrite(‘D:\Alice\研\modis\aa.tif’,data,R);
3、批量读取
csv_path= 'D:\study\CE-318\北京-CAMS(39.933牛顿,116.317牛顿)\'; %文件夹路径
path_list = dir(strcat(csv_path,'*.csv'));
%dir 函数 列出当前目录下所有子文件夹和文件%list_num = length(path_list);%%文件数量
for i=1:list_num
%%%%%
end
3.1带字符串csv批量读取
参考:https://blog.csdn.net/qq_41661878/article/details/119330873
uiopen('D:\study\CE-318\beijingN39.977,E116.381\data\20170101_20171231_Beijing.csv',1)
4、批量存储(自定义命名)
xlswrite(strcat(csv_path,yearname,'.xlsx'),DATA);
%自定义命名将DATA写入表格
%csv_path路径yearname名字
二、绘图
1、图形
title('图形名称') %(都放在单引号内)
xlabel('x轴说明')
ylabel('y轴说明')
text(x,y,'图形说明','fontsize',16)
legend('图例1','图例2',)
set(gca,‘XTickLabel’,[1991:1:2009]);%给X轴坐标加标签 (1991-2009间隔1)
xtickangle(50)%更改x轴标签角度
2、坐标控制
axis equal :纵横坐标轴采用等长刻度
axis square:产生正方形坐标系(默认为矩形)
axis auto:使用默认设置
axis off:取消坐标轴
axis on :显示坐标轴
axis([xmin xmax ymin ymax])
命令可以限制二维图像的x和y坐标,此处输入axis([0 2pi -2 2]),限制横坐标为0到2pi,纵坐标为-2到2。
3、图例注释
legend(‘text1‘, ‘text2‘,…)
4、文本注释
在图形中任意位置添加文本注释,用到的函数为text。其调用语法为text(x,y,‘text’),x、y为标注点的坐标位置,text为添加的文本注释。
text(x,y,‘标注名’)或者text(x,y,z,‘标注名’)
Matlab绘图基础——给图像配文字说明(text对象)
5、线型
例 plot(x,y,'k*',x1,y1,'b--')
matlab怎么设置自定义和旋转坐标轴刻度值及标签参考
%设置x轴范围和刻度
set(gca,‘XLim’,[0 10]);%X轴的数据显示范围
set(gca,‘XTick’,[0:1:10]);%设置要显示坐标刻度
set(gca,‘XTickLabel’,[0:1:10]);%给坐标加标签
使用plot()绘制一个图形,如我们在MATLAB命令窗口中输入代码:
a= linspace(-15,0.1,15); %坐标刻度-15~15、间距0.1
b=sin(a);
plot(a,b)
将绘制一个横坐标-15到15的正弦函数曲线图。
使用xticks()函数,xticklabels()函数,以及yticks()函数在指定位置显示横坐标和纵坐标刻度值,间距可以不一致。
xticks([-3pi -2pi -pi 0 pi 2pi 3pi])
xticklabels({‘-3\pi’,‘-2\pi’,‘-\pi’,‘0’,‘\pi’,‘2\pi’,‘3\pi’})
yticks([-1 -0.9 -0.5 0 0.4 0.7 1])
旋转横坐标和纵坐标标签或刻度的角度,使用xtickangle()函数和ytickangle()函数
a= 511rand(1,33);
b=rand(1,33);
scatter(a,b,'r’)
xtickangle(50)
ytickangle(80)