Python实现BOA蝴蝶优化算法优化LightGBM回归模型(LGBMRegressor算法)项目实战

embedded/2024/10/16 2:25:29/

说明:这是一个机器学习实战项目(附带数据+代码+文档+视频讲解),如需数据+代码+文档+视频讲解可以直接到文章最后获取。

1.项目背景

蝴蝶优化算法(butterfly optimization algorithm, BOA)是Arora 等人于2019年提出的一种元启发式智能算法。该算法受到了蝴蝶觅食和交配行为的启发,蝴蝶接收/感知并分析空气中的气味,以确定食物来源/交配伙伴的潜在方向。

蝴蝶利用它们的嗅觉、视觉、味觉、触觉和听觉来寻找食物和伴侣,这些感觉也有助于它们从一个地方迁徙到另一个地方,逃离捕食者并在合适的地方产卵。在所有感觉中,嗅觉是最重要的,它帮助蝴蝶寻找食物(通常是花蜜)。蝴蝶的嗅觉感受器分散在蝴蝶的身体部位,如触角、腿、触须等。这些感受器实际上是蝴蝶体表的神经细胞,被称为化学感受器。它引导蝴蝶寻找最佳的交配对象,以延续强大的遗传基因。雄性蝴蝶能够通过信息素识别雌性蝴蝶,信息素是雌性蝴蝶发出的气味分泌物,会引起特定的反应。

  通过观察,发现蝴蝶对这些来源的位置有非常准确的判断。此外,它们可以辨识出不同的香味,并感知它们的强度。蝴蝶会产生与其适应度相关的某种强度的香味,即当蝴蝶从一个位置移动到另一个位置时,它的适应度会相应地变化。当蝴蝶感觉到另一只蝴蝶在这个区域散发出更多的香味时,就会去靠近,这个阶段被称为全局搜索。另外一种情况,当蝴蝶不能感知大于它自己的香味时,它会随机移动,这个阶段称为局部搜索。

本项目通过BOA蝴蝶优化算法优化LightGBM回归模型。    

2.数据获取

本次建模数据来源于网络(本项目撰写人整理而成),数据项统计如下:

编号 

变量名称

描述

1

x1

2

x2

3

x3

4

x4

5

x5

6

x6

7

x7

8

x8

9

x9

10

x10

11

y

因变量

数据详情如下(部分展示):

3.数据预处理

3.1 用Pandas工具查看数据

使用Pandas工具的head()方法查看前五行数据:

关键代码:

3.2数据缺失查看

使用Pandas工具的info()方法查看数据信息:

  

从上图可以看到,总共有11个变量,数据中无缺失值,共2000条数据。

关键代码:  

3.3数据描述性统计

通过Pandas工具的describe()方法来查看数据的平均值、标准差、最小值、分位数、最大值。

关键代码如下:   

4.探索性数据分析

4.1 y变量分布直方图

用Matplotlib工具的hist()方法绘制直方图: 

4.2 相关性分析

从上图中可以看到,数值越大相关性越强,正值是正相关、负值是负相关。

5.特征工程

5.1 建立特征数据和标签数据

关键代码如下:

5.2 数据集拆分

通过train_test_split()方法按照80%训练集、20%测试集进行划分,关键代码如下:

6.构建BOA蝴蝶优化算法优化LightGBM回归模型

主要使用BOA蝴蝶优化算法优化LightGBM回归算法,用于目标回归。   

6.1 BOA蝴蝶优化算法寻找最优参数值

最优参数: 

6.2 最优参数值构建模型 

编号

模型名称

参数

1

LightGBM回归模型   

n_estimators=best_n_estimators

2

learning_rate=best_learning_rate

7.模型评估

7.1评估指标及结果 

评估指标主要包括R方、均方误差、解释性方差、绝对误差等等。

模型名称

指标名称

指标值

测试集

LightGBM回归模型    

R方

0.9377

均方误差

1713.2525

解释方差分

0.9377

绝对误差

31.3591 

从上表可以看出,R方分值为0.9377,说明模型效果比较好。 

关键代码如下:  

7.2 真实值与预测值对比图

从上图可以看出真实值和预测值波动基本一致,模型效果良好。   

8.结论与展望

综上所述,本文采用了BOA蝴蝶优化算法寻找LightGBM回归算法的最优参数值来构建回归模型,最终证明了我们提出的模型效果良好。此模型可用于日常产品的预测。 

python"># 本次机器学习项目实战所需的资料,项目资源如下:# 项目说明:# 获取方式一:# 项目实战合集导航:https://docs.qq.com/sheet/DTVd0Y2NNQUlWcmd6?tab=BB08J2# 获取方式二:链接:https://pan.baidu.com/s/1Fea3F4-xdRfgvXDrfIzdSA 
提取码:5uvx

http://www.ppmy.cn/embedded/11258.html

相关文章

记笔记!国内怎么操作好现货白银

国内投资者可以选择的白银投资方式已有不少,而且当中也不乏跟国际市场上现货白银比较类似的品种,投资者可以通过相关交易所的官方APP办理开户的手续,如果想取得更好的效果和收益,直接参与国际市场上的现货白银,应该是更…

网工常用工具——SecureCRT

SecureCRT 是一款强大且高度可定制的终端仿真器和文件传输工具,广泛应用在需要频繁进行远程访问和管理工作、网络文件传输、网络运维调试等工作领域,在网络管理员、开发人员、系统工程师等专业人士是最常见的工具,市面上很多网络工程师刚开始…

docker初识

什么是docker dockers,翻译的意思是码头工人。 它是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可抑制的容器中,然后发布到任何流行的Linux机器上,也可以实现虚拟化。容器完全使用沙盒机制,…

MySQL事务的实现

前言 数据库事务的 ACID 四大特性是事务的基础,了解了 ACID 是如何实现的,我们也就清楚了事务的实现,接下来我们将依次介绍数据库是如何实现这四个特性的。 四大特性 原子性 原子性就是,保证事务就是一系列的操作,…

使用深度卷积神经网络进行 ImageNet 分类

大数据集包括 LabelMe(由数十万张完全分割的图像组成)和 ImageNet(由 22,000 多个类别的超过 1500 万张带标签的高分辨率图像组成) CNN就是这样一类模型,它们的容量可以通过改变深度和广度来控制,并且它们…

12-Makefile_03(续)

使用变量 使用C自动编译成*.o的默认规则有个缺陷,由于没有显式地表示*.o依赖于.h头文件,假如修改了头文件的内容,那么*.o并不会更新,这是不可接受的。并且默认规则使用固定的“cc”进行编译,假如想使用ARM-GCC进行交叉…

PostgreSQL恢复系列:pg_filedump恢复字典构造---惜分飞

pg_filedump是在pg数据库极端情况下直接解析数据库文件的利器,但是由于是开源软件,本身难以实现批量处理,通过对底层基表分析,可以实现批量处理功能分析PostgreSQL库中数据库信息 --数据库查询结果 postgres# select oid,datname,datdba,dattablespace from pg_database; oid…

AUTOCAD输出或打印PDF文件时,如何将图形居中且布满图纸?

AUTOCAD输出或打印PDF文件时,如何将图形居中且布满图纸? 如下图所示,我们打开一份DWG格式的图纸文件,然后点击上方的“打印“图标, 如下图所示, 打印机/绘图仪这里选择“DWG To PDF“; 图纸尺寸:这里以普通的A4纸为例进行说明; 打印比例选择“布满图纸“; 打印偏移…