机器学习-交叉验证

embedded/2025/1/19 22:01:28/

交叉验证 (Cross-Validation) 是一种评估模型性能和选择模型参数的统计学方法,特别是在数据量有限的情况下。它比简单地将数据分成训练集和测试集更加可靠,因为它利用了所有的数据进行训练和测试。

什么是交叉验证?

交叉验证的基本思想是将数据集分成 K 个大小相似的子集(称为“折叠”或“组”,folds)。然后,依次将每个子集作为测试集,其余 K-1 个子集合并作为训练集,训练并测试模型。这个过程重复 K 次,每个子集都会被用作一次测试集。最后,将 K 次测试的结果(例如准确率、误差等)取平均值作为模型的最终性能评估。

最常见的交叉验证类型是 K 折交叉验证 (K-Fold Cross-Validation)。

K 折交叉验证的步骤:

数据分割: 将数据集随机分成 K 个大小相似的子集(通常 K 取 5 或 10)。

迭代训练和测试:

对于每个子集 i (i = 1, 2, …, K):

将子集 i 作为测试集。

将其余 K-1 个子集作为训练集。

使用训练集训练模型。

使用测试集评估模型性能,并记录结果(例如准确率)。

性能评估: 计算 K 次测试结果的平均值,作为模型的最终性能评估指标。

其他类型的交叉验证:

留一交叉验证 (Leave-One-Out Cross-Validation, LOOCV): K 折交叉验证的特例,其中 K 等于样本数量。每次只留下一个样本作为测试集,其余样本作为训练集。计算成本较高,但在样本量较小时比较有用。

分层 K 折交叉验证 (Stratified K-Fold Cross-Validation): 确保每个子集中的类别比例与整个数据集中的类别比例相同。这对于分类问题,特别是类别不平衡的情况非常重要。

如何通过交叉验证选择正则化参数?

交叉验证可以用来选择最佳的正则化参数(例如 L1 或 L2 正则化中的 λ)。以下是具体步骤:

确定参数范围: 为正则化参数 λ 选择一个候选值范围(例如 [0.001, 0.01, 0.1, 1, 10])。

对每个 λ 值执行 K 折交叉验证:

使用选定的 λ 值训练模型。

执行 K 折交叉验证,并记录每个 λ 值对应的平均性能指标(例如平均准确率或平均误差)。

选择最佳 λ 值: 选择在交叉验证中表现最好的 λ 值(例如,具有最高平均准确率或最低平均误差的 λ 值)作为最终模型的正则化参数。

示例:

假设我们使用 L2 正则化 (Ridge Regression) 训练一个线性回归模型,并使用 5 折交叉验证来选择最佳的 λ 值。

我们选择 λ 的候选值范围为 [0.001, 0.01, 0.1, 1, 10]。

对于每个 λ 值(例如 λ = 0.001):

我们将数据分成 5 份。

我们进行 5 次迭代,每次使用 4 份数据进行训练,1 份数据进行测试,并记录测试误差。

我们计算这 5 次测试误差的平均值,作为 λ = 0.001 时的交叉验证误差。

我们对每个 λ 值重复步骤 2,得到每个 λ 值对应的交叉验证误差。

我们选择交叉验证误差最低的 λ 值作为最终模型的正则化参数。

总结:

交叉验证是一种评估模型性能和选择模型参数的强大技术。通过在不同的数据子集上训练和测试模型,交叉验证可以提供对模型泛化能力的更可靠的估计,并帮助我们选择最佳的正则化参数,从而构建更准确、更鲁棒的机器学习模型。 使用交叉验证选择正则化参数可以有效地防止过拟合并提高模型的泛化能力。


http://www.ppmy.cn/embedded/155319.html

相关文章

打家劫舍 打家劫舍II 打家劫舍III

打家劫舍 你是一个专业的小偷,计划偷窃沿街的房屋。每间房内都藏有一定的现金,影响你偷窃的唯一制约因素就是相邻的房屋装有相互连通的防盗系统,如果两间相邻的房屋在同一晚上被小偷闯入,系统会自动报警。 给定一个代表每个房屋…

MySQL第三次实验

一、建库建表 1、创建数据库mydb11_stu并使用数据库 mysql> create database mydb11_stu; Query OK, 1 row affected (0.01 sec)mysql> show databases; -------------------- | Database | -------------------- | information_schema | | mydb10_city …

在 C++ 中实现调试日志输出

在 C 编程中,调试日志对于定位问题和优化代码至关重要。有效的调试日志不仅能帮助我们快速定位错误,还能提供有关程序运行状态的有价值的信息。本文将介绍几种常用的调试日志输出方法,并教你如何在日志中添加时间戳。 1. 使用 #ifdef _DEBUG…

CSS3 动画详解

1.基本概念 CSS3 动画允许您通过定义关键帧和一系列动画属性,在网页上创建动态的视觉效果。与传统的 JavaScript 动画相比,CSS3 动画更易于编写和维护,并且在性能方面也有不错的表现。它可以应用于 HTML 元素,使元素在页面上移动…

vue+arcgis api for js实现地图经纬网格显示

vue代码调用: import { gridLineLatLng } from ./js/mapGrids.jsexport default {mounted(){// 显示经纬网格gridLineLatLng.currentMap this.mapAndView// gridLineLatLng.isGetMapPageXmax falsegridLineLatLng.init()},beforeDestroy() {// 删除经纬网格gridL…

YOLOv11实战行人跌倒识别

本文采用YOLOv11作为核心算法框架,结合PyQt5构建用户界面,使用Python3进行开发。YOLOv11以其高效的实时检测能力,在多个目标检测任务中展现出卓越性能。本研究针对行人跌倒数据集进行训练和优化,该数据集包含丰富的行人跌倒图像样…

BEVFusion论文阅读

1. 简介 融合激光雷达和相机的信息已经变成了3D目标检测的一个标准,当前的方法依赖于激光雷达传感器的点云作为查询,以利用图像空间的特征。然而,人们发现,这种基本假设使得当前的融合框架无法在发生 LiDAR 故障时做出任何预测&a…

【Unity踩坑】Unity中提示缺少Visual Studio组件

问题: 在Unity中选择UWP平台时,提示Visual Studio缺少组件。 Selected Visual Studio is missing required components and may not be able to build the generated project. 解决方案: 在Visual Studio Installer里,安装上&quo…