pytorch——线性回归——风速预测

news/2024/10/31 5:35:01/

1.数据获取

数据来源于ECMWF,格式为NETCDF气象数据文件,数据是一个[时间×经度×纬度]的三维矩阵,用以下代码来读取:

dataset = nc.Dataset("data/%d/%d.nc")#文件路径
longitude_nc = dataset.variables["longitude"]
latitude_nc = dataset.variables["latitude"]
time_nc = dataset.variables["time"]
u10_nc = np.array(dataset.variables["u10"])
v10_nc = np.array(dataset.variables["v10"])
v_abs = (v10_nc ** 2 + u10_nc ** 2) ** 0.5#nc文件里的速度数据是分x,y两个方向的,所以取平方和再开根号才是该点的速度

计算出最大风速,最小风速和平均风速,保存为csv文件,将1989-2017年的数据作为训练集,2018年的数据作为测试集,在pycharm里面查看一下:

,year,month,day,speed,max,average,min
0,2018,1,1,7.720214893,12.39827865,6.534754546,1.157438587
1,2018,1,2,6.534754546,9.633524721,5.555451098,1.077857595
2,2018,1,3,5.555451098,12.66565301,7.490290528,1.196667866
3,2018,1,4,7.490290528,10.01959622,5.52125861,0.147818598
4,2018,1,5,5.52125861,13.52008618,7.958868339,1.018520705
5,2018,1,6,7.958868339,12.08335956,5.725355559,0.339679507
6,2018,1,7,5.725355559,12.62008588,6.355550614,0.088038696
7,2018,1,8,6.355550614,15.61926933,9.871182364,0.361438214
8,2018,1,9,9.871182364,12.8674265,8.089844966,1.308905928

这里的speed是前一天的平均风速,希望能和年,月,日一起作为特征进行预测。

2.数据读取与处理

读取数据,因为第一行都是标签,所以去掉,并且把features和labels分开:

train_data = pd.read_csv('data_train.csv')
test_data = pd.read_csv('data_test.csv')
input_features = train_data.loc[1:,['year','month','day','speed']]
input_features = np.array(input_features)#csv里的数据读取出来是dataframe格式,最好先转化成矩阵的形式方便后面处理
test_labels = test_data.loc[1:,['max','average','min']]
labels = train_data.loc[1:,['max','average','min']]
labels = np.array(labels)

打印一下训练集数据和训练集的input_features和labels看看:

 

       那么问题来了,观察input_features可以发现,第一个特征也就是year的数值比另外三个大很多,这样会导致后面的预测结果和其它三个特征的关系不大,所以我们要对特征进行归一化处理,这里用的是sklearn里面的preprocessing函数:

input_features_1 = preprocessing.StandardScaler().fit_transform(input_features)

归一化后的数据如下:

 3.神经网络

接下来开始神经网络的搭建,这里使用一个包含两层隐藏层的线性回归模型,神经网络图如下:

my_nn = torch.nn.Sequential(torch.nn.BatchNorm1d(7),torch.nn.Linear(input_size,hidden_size),torch.nn.ReLU(),torch.nn.Dropout(),torch.nn.BatchNorm1d(hidden_size),torch.nn.Linear(hidden_size,output_size))

另一种写法

class my_module(nn.Module):def __init__(self):super(my_module,self).__init__()self.bn = nn.BatchNorm1d(4)self.linear1 = nn.Linear(4,128)self.RELU = nn.ReLU()self.dropout = nn.Dropout(0.5)self.linear2 = nn.Linear(128,3)def forward(self,x):x1 = self.bn(x)x2 = self.linear1(x1)x3 = self.RELU(x2)x4 = self.dropout(x3)x5 = self.linear2(x4)return x5

使用mse误差和adam优化

cost = torch.nn.MSELoss(reduction='mean')#mse误差
optimizer = torch.optim.Adam(my_nn.parameters(),lr = 1e-2,weight_decay=0.1)#Adam优化器

开始训练

losses = []
for i in range(1000):batch_loss = []for start in range(0,len(x),batch_size):end = start + batch_size if start + batch_size < len(x) else len(x)xx = torch.tensor(x[start:end],dtype=float,requires_grad=True)xx = xx.to(torch.float32)yy = torch.tensor(y[start:end],dtype=float,requires_grad=True)yy = yy.to(torch.float32)prediction = my_nn(xx)loss = cost(prediction,yy)optimizer.zero_grad()#清零loss.backward(retain_graph = True)#反向传播optimizer.step()batch_loss.append(loss.data.numpy())losses.append(np.mean(batch_loss))if i % 100 == 0:#每一百步输出一次losstest_losses =cost(my_nn(x1),test_labels)print(i,np.mean(batch_loss),test_losses)

预测

'预测'
preds = my_nn(x1).data.numpy()
preds_tensor = torch.tensor(preds,dtype=float)
#lss = cost(preds_tensor,test_labels)
print('prediction',preds)
#print('test loss:',lss)'预测数据保存'
df = pd.DataFrame()
df['max'] = preds[:,0]
df['average'] = preds[:,1]
df['min'] = preds[:,2]
df.to_csv('bp.csv')

结果对比

 


http://www.ppmy.cn/news/163578.html

相关文章

i3 10110u 怎么样 相当于什么水平

i3-10110U隶属于移动处理器&#xff0c;只有双核心四线程&#xff0c;因此它的多核性能基本就和Ryzen 3 3200U相同。 i3 10110u怎么样这些点很重要!看完你就知道了 https://list.jd.com/list.html? i3 10110u频率4.3/3.6Ghz 3级缓存6M 内存最高支持2666Hz 核心线程4C8T 不过得…

魅族魅蓝U10详细开启USB调试模式的经验

就在我们使用安卓手机连接电脑的时候&#xff0c;或者使用的有些应用软件比如我们公司营销团队就在使用的应用软件引号精灵&#xff0c;以前的老版本就需要开启usb开发者调试模式下使用&#xff0c;现就在新版本不需要了&#xff0c;如果手机没有开启usb开发者调试模式&#xf…

win10+cuda9.0+cuDNN 7.0+Tensorflow1.5(GPU)安装

2018年初&#xff0c;谷歌在 GitHub 上正式发布了 TensorFlow 的最新版本 1.5.0&#xff0c;并开源了其代码。支持 CUDA 9 和 cuDNN 7 被认为是本次更新的最重要部分。 写在前面&#xff1a;检查GPU是否支持CUDA 先确定下自己的显卡型号&#xff08;不要告诉我你不知道怎么查看…

【cuda安装教程】GTX1050Ti+win10+cuda9.0+cudnn7.4.1安装过程记录

GTX1050tiwin10cuda9.0安装实录 其实之前已经安装过很多次cuda了&#xff0c;但是每次需要用其他功能的时候&#xff0c;总是会忘了一些安装过程中的一些参数设置&#xff0c;所以记录下来提醒自己也可以让大家参考一下。 我电脑显卡是GTX1050ti&#xff0c;系统是win10&…

如何u盘装系统win10 64位?

使用u盘安装windows10系统是大家都想学习的&#xff0c;但是很多小伙伴至今都不知道详细操作方法。那么&#xff0c;如何u盘装系统win10 64位?今天我们一起来聊聊全新安装激活windows10系统的详细操作吧。 一、准备工具&#xff1a; 1、如果电脑没有系统或系统无法启动&#x…

《软件工程》学习记录U10(面向对象分析)

面向对象分析的起源&#xff1a; 面向对象分析方法举例&#xff1a; Peter Coad的面向对象方法&#xff1a; 对象是问题领域中真实存在的实体&#xff0c;有“定义清晰的边界”对象中封装有属性和行为面向对象分析的五个核心概念&#xff1a;对象、属性、结构、服务、主题举例…

vb+access大气污染模型系统

数据模型就是按专业的要求,用数字方式描述自然界的事物或现象以及他们的关系。 我们通过对地区的具体数值和情况的观察,对大气质量状况做出分析,建立一个符合当地情况的大气污染模型,用来测量大气污染浓度,并根据污染浓度评价出当地的空气质量。由于地理信息以及环境的“…