【Matlab智能算法】Elman神经网络-遗传算法(Elman-GA)函数极值寻优——非线性函数求极值

news/2024/11/17 21:27:13/

往期博客👉
【Matlab】BP神经网络遗传算法(BP-GA)函数极值寻优——非线性函数求极值
【Matlab】GRNN神经网络遗传算法(GRNN-GA)函数极值寻优——非线性函数求极值
【Matlab】RBF神经网络遗传算法(RBF-GA)函数极值寻优——非线性函数求极值
本篇博客将主要介绍Elman神经网络,希望能帮助大家快速入门Elman网络。

1.背景条件

要求:对于未知模型(函数表达式未知)求解极值。
条件:已知模型的一些输入输出数据。

程序的示例是根据用神经网络遗传算法寻优非线性函数 y = x 1 2 + x 2 2 y = x_1^2+x_2^2 y=x12+x22 的极值,输入参数有2个,输出参数有1个,易知函数有极小值0,极小值点为(0, 0)。已知的只有一些输入输出数据(用rand函数生成输入,然后代入表达式生成输出):

for i=1:4000input(i,:)=10*rand(1,2)-5;output(i)=input(i,1)^2+input(i,2)^2;
end

2.Elman神经网络函数说明

elmannet

Elman神经网络参数设置函数
函数形式:

net = elmannet(layerdelays,hiddenSizes,trainFcn)

layerdelays: 网络层延迟的行向量,可取的值为0或整数,默认值为1:2;
hiddenSizes: 隐含层的大小,是一个行向量,默认值为10;
trainFcn: 训练函数的字符串,默认值为‘trainlm’。

例如:

net=elmannet(1:2,10)

newelm() 也是创建 Elman 神经网络的函数,不过适用于较低版本的 matlab ,我的 matlab 版本为 R2022b,识别不了这个函数。

3.完整代码

data.m

用于生成神经网络拟合的原始数据。

for i=1:4000input(i,:)=10*rand(1,2)-5;output(i)=input(i,1)^2+input(i,2)^2;
end
output=output';save data input output

Elman.m

用函数输入输出数据训练Elman神经网络,使训练后的网络能够拟合非线性函数输出,保存训练好的网络用于计算个体适应度值。根据非线性函数方程随机得到该函数的4000组输入输出数据,存储于data中,其中input为函数输入数据,output为函数对应输出数据,从中随机抽取3900组训练数据训练网络,100组测试数据测试网络拟合性能。最后保存训练好的网络。

%% 清空环境变量
clctic
%% 训练数据预测数据提取及归一化
%从1到4000间随机排序
k=rand(1,4000);
[m,n]=sort(k);%划分训练数据和预测数据
input_train=input(n(1:3900),:)';
output_train=output(n(1:3900),:)';
input_test=input(n(3901:4000),:)';
output_test=output(n(3901:4000),:)';[inputn,inputps]=mapminmax(input_train);
[outputn,outputps]=mapminmax(output_train);%% Elman网络训练
% 初始化网络结构
net=elmannet(1:2,10); % Elman网络
% elmannet(layerdelays,hiddenSizes,trainFcn)
% layerdelays表示网络层延迟的行向量,可取的值为0或整数,默认值为1:2;
% hiddenSizes为隐含层的大小,是一个行向量,默认值为10;
% trainFcn表示训练函数的字符串,默认值为‘trainlm’。% 设置网络参数:迭代次数、学习率和目标
net.trainParam.epochs=1000; % 最大迭代次数
net.trainParam.lr=0.0001; % 学习率
net.trainParam.goal=1e-5; % 误差容限,达到此误差就可以停止训练
net.trainParam.max_fail=5; % 最多验证失败次数
view(net)%网络训练
net=train(net,inputn,outputn);%% Elman网络预测
%预测数据归一化
inputn_test=mapminmax('apply',input_test,inputps);%网络预测输出
an=sim(net,inputn_test);%网络输出反归一化
Eloutput=mapminmax('reverse',an,outputps);%% 结果分析
error=output_test-Eloutput;
errorsum=sum(abs(error))figure(1);
plot(Eloutput,':og');
hold on
plot(output_test,'-*');
legend('Predictive output','Expected output','fontsize',10);
title('Elman network predictive output','fontsize',12);
xlabel("samples",'fontsize',12);figure(2);
plot(error,'-*');
title('Elman Neural network prediction error');
xlabel("samples",'fontsize',12);figure(3);
plot(100*(output_test-Eloutput)./output_test,'-*');
title('Elman Neural network prediction error percentage (%)');
xlabel("samples",'fontsize',12);tocsave data net inputps outputps

Code.m

编码成染色体。

function ret=Code(lenchrom,bound)
%本函数将变量编码成染色体,用于随机初始化一个种群
% lenchrom   input : 染色体长度
% bound      input : 变量的取值范围
% ret        output: 染色体的编码值
flag=0;
while flag==0pick=rand(1,length(lenchrom));ret=bound(:,1)'+(bound(:,2)-bound(:,1))'.*pick; %线性插值,编码结果以实数向量存入ret中flag=test(lenchrom,bound,ret);     %检验染色体的可行性
end

fun.m

把训练好的Elman神经网络预测输出作为个体适应度值。

function fitness = fun(x)
% 函数功能:计算该个体对应适应度值
% x           input     个体
% fitness     output    个体适应度值%
load data net inputps outputps%数据归一化
x=x';
inputn_test=mapminmax('apply',x,inputps);%网络预测输出
an=sim(net,inputn_test);%网络输出反归一化
fitness=mapminmax('reverse',an,outputps);

对于求极小值的函数,适应度可以设为Elman网络预测结果,如果需要求极大值,可以对适应度取反。

Select.m

选择操作采用轮盘赌法从种群中选择适应度好的个体组成新种群。

function ret=select(individuals,sizepop)
% 本函数对每一代种群中的染色体进行选择,以进行后面的交叉和变异
% individuals input  : 种群信息
% sizepop     input  : 种群规模
% ret         output : 经过选择后的种群fitness1=1./individuals.fitness;
sumfitness=sum(fitness1);
sumf=fitness1./sumfitness;
index=[]; 
for i=1:sizepop   %转sizepop次轮盘pick=rand;while pick==0    pick=rand;        endfor i=1:sizepop    pick=pick-sumf(i);        if pick<0        index=[index i];            break;  %寻找落入的区间,此次转轮盘选中了染色体i,注意:在转sizepop次轮盘的过程中,有可能会重复选择某些染色体endend
end
individuals.chrom=individuals.chrom(index,:);
individuals.fitness=individuals.fitness(index);
ret=individuals;

Cross.m

交叉操作从种群中选择两个个体,按一定概率交叉得到新个体。

function ret=Cross(pcross,lenchrom,chrom,sizepop,bound)
%本函数完成交叉操作
% pcorss                input  : 交叉概率
% lenchrom              input  : 染色体的长度
% chrom     input  : 染色体群
% sizepop               input  : 种群规模
% ret                   output : 交叉后的染色体for i=1:sizepop  %每一轮for循环中,可能会进行一次交叉操作,染色体是随机选择的,交叉位置也是随机选择的,%但该轮for循环中是否进行交叉操作则由交叉概率决定(continue控制)% 随机选择两个染色体进行交叉pick=rand(1,2);while prod(pick)==0pick=rand(1,2);endindex=ceil(pick.*sizepop);% 交叉概率决定是否进行交叉pick=rand;while pick==0pick=rand;endif pick>pcrosscontinue;endflag=0;while flag==0% 随机选择交叉位pick=rand;while pick==0pick=rand;endpos=ceil(pick.*sum(lenchrom)); %随机选择进行交叉的位置,即选择第几个变量进行交叉,注意:两个染色体交叉的位置相同pick=rand; %交叉开始v1=chrom(index(1),pos);v2=chrom(index(2),pos);chrom(index(1),pos)=pick*v2+(1-pick)*v1;chrom(index(2),pos)=pick*v1+(1-pick)*v2; %交叉结束flag1=test(lenchrom,bound,chrom(index(1),:));  %检验染色体1的可行性flag2=test(lenchrom,bound,chrom(index(2),:));  %检验染色体2的可行性if   flag1*flag2==0flag=0;else flag=1;end    %如果两个染色体不是都可行,则重新交叉endend
ret=chrom;

test.m

检验染色体的可行性。

function flag=test(lenchrom,bound,code)
% lenchrom   input : 染色体长度
% bound      input : 变量的取值范围
% code       output: 染色体的编码值x=code; %先解码
flag=1;
if (x(1)<bound(1,1))&&(x(2)<bound(2,1))&&(x(1)>bound(1,2))&&(x(2)>bound(2,2))flag=0;
end

Mutation.m

变异操作从种群中随机选择一个个体,按一定概率变异得到新个体。

function ret=Mutation(pmutation,lenchrom,chrom,sizepop,pop,bound)
% 本函数完成变异操作
% pcorss                input  : 变异概率
% lenchrom              input  : 染色体长度
% chrom     input  : 染色体群
% sizepop               input  : 种群规模
% opts                  input  : 变异方法的选择
% pop                   input  : 当前种群的进化代数和最大的进化代数信息
% ret                   output : 变异后的染色体
for i=1:sizepop   %每一轮for循环中,可能会进行一次变异操作,染色体是随机选择的,变异位置也是随机选择的,%但该轮for循环中是否进行变异操作则由变异概率决定(continue控制)% 随机选择一个染色体进行变异pick=rand;while pick==0pick=rand;endindex=ceil(pick*sizepop);% 变异概率决定该轮循环是否进行变异pick=rand;if pick>pmutationcontinue;endflag=0;while flag==0% 变异位置pick=rand;while pick==0      pick=rand;endpos=ceil(pick*sum(lenchrom));  %随机选择了染色体变异的位置,即选择了第pos个变量进行变异v=chrom(i,pos);        v1=v-bound(pos,1);        v2=bound(pos,2)-v;        pick=rand; %变异开始        if pick>0.5delta=v2*(1-pick^((1-pop(1)/pop(2))^2));chrom(i,pos)=v+delta;elsedelta=v1*(1-pick^((1-pop(1)/pop(2))^2));chrom(i,pos)=v-delta;end   %变异结束flag=test(lenchrom,bound,chrom(i,:));     %检验染色体的可行性end
end
ret=chrom;

Genetic.m

%% 清空环境变量
clc
% clear%% 初始化遗传算法参数
%初始化参数
maxgen=100;                         %进化代数,即迭代次数
sizepop=20;                        %种群规模
pcross=[0.4];                       %交叉概率选择,0和1之间
pmutation=[0.2];                    %变异概率选择,0和1之间lenchrom=[1 1];          %每个变量的字串长度,如果是浮点变量,则长度都为1
bound=[-5 5;-5 5];  %数据范围individuals=struct('fitness',zeros(1,sizepop), 'chrom',[]);  %将种群信息定义为一个结构体
avgfitness=[];                      %每一代种群的平均适应度
bestfitness=[];                     %每一代种群的最佳适应度
bestchrom=[];                       %适应度最好的染色体%% 初始化种群计算适应度值
% 初始化种群
for i=1:sizepop%随机产生一个种群individuals.chrom(i,:)=Code(lenchrom,bound);   x=individuals.chrom(i,:);%计算适应度individuals.fitness(i)=fun(x);   %染色体的适应度
end
%找最好的染色体
[bestfitness bestindex]=min(individuals.fitness);
bestchrom=individuals.chrom(bestindex,:);  %最好的染色体
avgfitness=sum(individuals.fitness)/sizepop; %染色体的平均适应度
% 记录每一代进化中最好的适应度和平均适应度
trace=[avgfitness bestfitness]; %% 迭代寻优
% 进化开始
for i=1:maxgeni% 选择individuals=Select(individuals,sizepop); avgfitness=sum(individuals.fitness)/sizepop;% 交叉individuals.chrom=Cross(pcross,lenchrom,individuals.chrom,sizepop,bound);% 变异individuals.chrom=Mutation(pmutation,lenchrom,individuals.chrom,sizepop,[i maxgen],bound);% 计算适应度 for j=1:sizepopx=individuals.chrom(j,:); %解码individuals.fitness(j)=fun(x);   end%找到最小和最大适应度的染色体及它们在种群中的位置[newbestfitness,newbestindex]=min(individuals.fitness);[worestfitness,worestindex]=max(individuals.fitness);% 代替上一次进化中最好的染色体if bestfitness>newbestfitnessbestfitness=newbestfitness;bestchrom=individuals.chrom(newbestindex,:);endindividuals.chrom(worestindex,:)=bestchrom;individuals.fitness(worestindex)=bestfitness;avgfitness=sum(individuals.fitness)/sizepop;trace=[trace;avgfitness bestfitness]; %记录每一代进化中最好的适应度和平均适应度
end
%进化结束%% 结果分析
[r c]=size(trace);
plot([1:r]',trace(:,2),'r-');
title('适应度曲线','fontsize',12);
xlabel('进化代数','fontsize',12);ylabel('适应度','fontsize',12);
disp('适应度                   变量');
x=bestchrom;
% 窗口显示
disp([bestfitness x]);

4.代码使用说明

上述代码运行顺序

data.m 生成数据(如果已有 input output 数据可跳过),
Elman.m 进行Elman神经网络训练及函数拟合,
Genetic.m(主函数)利用遗传算法求极值。

求最大值的方法

上述代码用于求解最小值,对于求解最大值的需求,可以在适应度函数里面,对适应度计算结果求反,把求解最大值的问题转化为求解最小值的问题。

例如:对于非线性函数 y = − ( x 1 2 + x 2 2 ) + 4 y = -(x_1^2+x_2^2)+4 y=(x12+x22)+4

for i=1:4000input(i,:)=10*rand(1,2)-5;output(i)=-(input(i,1)^2+input(i,2)^2)+4;
end

求最大值时,需要在 fun.m 里面,修改最后一行代码:

fitness=-mapminmax('reverse',an,outputps);

注意:每次运行结果不尽相同。

5.代码运行结果

y = x 1 2 + x 2 2 y = x_1^2+x_2^2 y=x12+x22 求极小值

Elman神经网络拟合

运行Elman.m之后:

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

输出:

errorsum =64.6588历时 4.034772 秒。

注意:每次运行结果不尽相同。

遗传算法寻优

运行主函数 Genetic.m之后:

在这里插入图片描述

输出:

...
i =100适应度                   变量-0.8407    0.6137   -0.0228历时 20.067215 秒。

最终结果最优个体为(0.6137,-0.0228),适应度为 -0.8407。

注意:每次运行结果不尽相同。

参考

《MATLAB神经网络30个案例分析》


http://www.ppmy.cn/news/1028518.html

相关文章

【CTF-web】修改请求头(XFF)

题目链接&#xff1a;https://ctf.bugku.com/challenges/detail/id/79.html 随意输入后可以看到需要本地管理员登录&#xff0c;得知这是一道需要修改XFF头的题。 XFF即X-Forwarded-For&#xff0c;该请求标头是一个事实上的用于标识通过代理服务器连接到 web 服务器的客户端的…

CNN的特性

1、位移不变性 它指的是无论物体在图像中的什么位置&#xff0c;卷积神经网络的识别结果都应该是一样的。 因为CNN就是利用一个kernel在整张图像上不断步进来完成卷积操作的&#xff0c;而且在这个过程中kernel的参数是共享的。换句话说&#xff0c;它其实就是拿了同一张“通…

快速解决IDEA中类的图标变成J,不是C的情况

有时候导入新的项目后&#xff0c;会出现如下情况&#xff0c;类的图标变成J&#xff0c;如图&#xff1a; 直接上解决方法: 找到项目的pom.xml&#xff0c;右键&#xff0c;在靠近最下方的位置找到Add as Maven Project&#xff0c;点击即可。 此时&#xff0c;一般类的图标就…

欧拉公式之证明

首先&#xff0c;我们考虑复数函数的泰勒级数展开式。对于任意一个复数函数f(z)&#xff0c;我们可以将其在za处进行泰勒级数展开&#xff1a; f(z) f(a) f(a)(z-a) f(a)(z-a)^2/2! f(a)(z-a)^3/3! ... 其中f(a)表示f(z)在za处的导数&#xff0c;f(a)表示f(z)在…

分布式事务原子性-TCC

一、分布式事务-原子性 随着数据量不断的变大&#xff0c;单机所能处理的数据总归是有上限的&#xff0c;所以现阶段分布式的应用系统在各个领域中遍地生花。接下来我们就来聊一下分布式系统中非常重 要的特性分布式事务的原子性功能。之前没有了解过分布式相关知识的读者可以…

【golang】字典(map)的操作和约束原理

字典&#xff08;map&#xff09;存储的不是单一值的集合&#xff0c;而是键值对的集合。 什么是键值对&#xff1f;它是从英文key-value pair 直译过来的一个词。顾名思义&#xff0c;一个键值对就代表了一对键值对。 注意&#xff0c;一个"键"和一个"值"…

京东面试曝光:零点秒杀如何防止Redis雪崩崩溃?

大家好&#xff0c;我是你们的小米&#xff01;今天要和大家聊一个超有技术含量的话题&#xff0c;那就是如何应对零点秒杀活动下的Redis雪崩问题。在京东的面试题中&#xff0c;这个问题可是相当有挑战性哦&#xff01;废话不多说&#xff0c;咱们直接进入主题吧。 什么是雪崩…

代码随想录算法训练营第46天|动态规划part08

8.12 周六 139.单词拆分 关于多重背包&#xff0c;你该了解这些&#xff01; 背包问题总结篇&#xff01; 详细布置 139.单词拆分 题目&#xff1a;一个字典&#xff0c;一个字符串&#xff0c;问字符串能否由字典组成 题解&#xff1a; 1、dp[i]表示长度为i的字符串能否…