2025数学建模美赛|C题成品论文|第一问

ops/2025/2/1 22:07:29/

1.模型建立与求解

1.1问题求解思路

为了准确预测奥运会奖牌分布情况,尤其是金牌数和奖牌总数,本研究采用以下步骤:

(1)数据处理与特征工程

从提供的奥运会奖牌历史数据中提取核心信息。

补充外部特征,如国家人口(population)和 GDP(gdp),以增强模型的解释能力。

生成滞后特征(如上一届金牌数 Gold1ag和奖牌总数Total1ag),捕捉时间维度的历史表现。

(2)模型选择与优化

采用随机森林回归模型(Random Forest Regressor),处理输入特征的非线性关系和复杂交互。

利用网格搜索(GridSearchCV)优化模型超参数(如树的数量和最大深度)。

(3)结果评估与分析

1.2 模型求解与分析

(1) 模型求解

数据集划分为训练集(80%)和测试集(20%)。使用优化后的随机森林模型进行训练和预测。

图1 模型输出结果

图2 残差分析

从残差分布图可见,预测误差呈正态分布,且大部分残差集中在[−10,10] 区间内,表明模型预测稳定,未出现显著偏差。

(5) 可视化分析

图3 实际值 vs 预测值散点图

大部分点接近理想的对角线,表明预测值和实际值吻合度较高。

图4 特征重要性图

滞后特征( Gold1ag和Total1ag)的重要性显著高于其他特征。

1.3 求解思路

本问题的目标是预测尚未获得奖牌的国家在 2028 年洛杉矶奥运会上赢得首枚奖牌的可能性,并对预测结果进行概率估算。以下是具体的解决思路:

(1)数据预处理:将数据集中的国家分为已获奖国家(first_medal = 1)和未获奖国家(first_medal = 0)。使用合成少数类过采样技术(SMOTE)对未获奖国家的数据进行数据增强,以平衡类别分布。

1.3 模型求解与分析

(1)模型评估结果:

图5 模型评估结果

准确率(Accuracy):88.9%,表明模型对所有类别的预测能力较为稳定。

ROC AUC:94.8%,说明模型在区分是否获奖国家时有很高的区分能力。

(2)分类报告:

类别 0(未获奖国家)和类别 1(已获奖国家)的预测精度均为 89%,表明类别间的预测能力均衡。

(3)特征重要性分析:

图6 特征重要性分析

(4)ROC 曲线分析:

图7 ROC 曲线分析

模型的 ROC 曲线表明,正类(赢得首枚奖牌)的预测能力较强,AUC 达到 0.95。

1.4求解思路

(1)问题分析:

探讨比赛数量(Event_Count)与国家奖牌数的关系。分析哪些体育项目对不同国家最重要。研究主办国选择的比赛项目对奖牌分布的影响。

(2)建模思路:

结合比赛数量(Event_Count)和类型(不同体育项目)作为特征变量,构建奖牌数预测模型。应用随机森林与 XGBoost 模型,量化特征的重要性,分析主办国效应和体育项目的作用。对主办国效应,通过新增项目和奖牌总数变化进行统计分析。

(3)目标:

构建模型预测国家的奖牌总数。分析比赛数量、体育项目类型和主办国选择的项目对奖牌分布的影响。

1.1.1 1.4模型建立

(1)模型输入与输出:

输入特征:

比赛数量(Event_Count)。

主办国标识(is_host)。

历史奖牌数特征(Gold_lag、Total_lag)。

人口(population)与 GDP(gdp)。

输出目标:

国家奖牌总数(Total)。

1.4 模型求解与分析

(1)模型性能对比:

图8 求解结果

XGBoost 模型的特征重要性分析,表明历史金牌和奖牌总数对预测的关键作用。各模型实际值与预测值的对比散点图,显示 XGBoost 和随机森林模型在拟合能力上优于线性回归。

(2)特征重要性分析:

Gold_lag 的重要性最高,占 65.5%,历史金牌数是奖牌分布的核心预测因素。

Total_lag 占25.0%,历史奖牌总数对预测同样具有显著作用。

Event_Count 的重要性为4.4%,显示比赛数量对奖牌分布的影响有限。

is_host 的重要性几乎为零,表明主办国效应的直接贡献较小。

(3)主办国效应与比赛类型:

主办国在新增比赛项目中更容易获得奖牌。

不同国家核心体育项目:

中国:跳水、体操。

美国:游泳、田径。

日本:柔道、空手道。

主办国通过选择新增项目优化奖牌分布,但传统强项对奖牌总数更为关键。

(4)总结:

比赛数量对奖牌分布的影响较弱,但核心体育项目对国家奖牌表现的提升显著。

主办国效应主要体现在新增项目和传统强项中的奖牌分布,而非直接提升奖牌总数。

模型性能表明历史奖牌数据是奖牌分布预测的最主要依据,而主办国选择新增项目

的策略影响有限。


http://www.ppmy.cn/ops/154870.html

相关文章

网络工程师 (8)存储管理

一、页式存储基本原理 (一)内存划分 页式存储首先将内存物理空间划分成大小相等的存储块,这些块通常被称为“页帧”或“物理页”。每个页帧的大小是固定的,例如常见的页帧大小有4KB、8KB等,这个大小由操作系统决定。同…

【项目集成Husky】

项目集成Husky 安装初始化 Husky在.husky → pre-commit文件中添加想要执行的命令 安装 使用 Husky 可以帮助你在 Git 钩子中运行脚本,例如在提交代码前运行测试或格式化代码pnpm add --save-dev husky初始化 Husky npx husky init这会在项目根目录下创建一个 .hu…

Arcgis国产化替代:Bigemap Pro正式发布

在数字化时代,数据如同新时代的石油,蕴含着巨大的价值。从商业决策到科研探索,从城市规划到环境监测,海量数据的高效处理、精准分析与直观可视化,已成为各行业突破发展瓶颈、实现转型升级的关键所在。历经十年精心打磨…

从替代到覆盖:暴雨信创服务器打开市场新局面

进入2025年,全球局势更加变幻莫测,高科技领域越来越受到全球局势影响。美国前任总统拜登在卸任前,特别颁布限制GPU产品出口法案。新任总统特朗普上任第一天,废除了多项之前法案,但显示技术交流的内容一条没变。 在如此艰难的局面下,我国信创市场的发展显得尤为重要,国家也从政策…

【CSS入门学习】Flex布局设置div水平、垂直分布与居中

水平平均分布 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>Document</title><style>…

【强化学习】Soft Actor-Critic (SAC) 算法

&#x1f4e2;本篇文章是博主强化学习&#xff08;RL&#xff09;领域学习时&#xff0c;用于个人学习、研究或者欣赏使用&#xff0c;并基于博主对相关等领域的一些理解而记录的学习摘录和笔记&#xff0c;若有不当和侵权之处&#xff0c;指出后将会立即改正&#xff0c;还望谅…

详细介绍 React Native 的动画系统。主要包括 Animated 组件的各种用法:

1.基础动画值的创建&#xff1a; import { Animated, Easing } from react-native;// 创建动画值 const fadeAnim new Animated.Value(0); // 透明度动画值&#xff0c;初始值为0 const scaleAnim new Animated.Value(1); // 缩放动画值&#xff0c;初始值为1 const mo…

创建与管理MySQL数据库

数据库是现代应用程序的核心部分,无论是Web开发、数据分析还是企业级应用,数据库的创建与管理是基础且关键的技能。本教程旨在帮助自学编程的学习者掌握如何通过SQL命令创建、管理和操作数据库。通过本教程,可以学会如何创建数据库、查看已有数据库、选择数据库以及删除不再…