2023MathorCup 高校数学建模挑战赛D题思路解析

news/2024/12/23 6:01:19/

如下为MathorCup 高校数学建模挑战赛D题思路解析:

D 题 航空安全风险分析和飞行技术评估问题
飞行安全是民航运输业赖以生存和发展的基础。随着我国民航业的快速发展,针对飞行安全问题的研究显得越来越重要。2022 年 3 月 21 日,“3.21”空难的发生终结了中国民航安全飞行 1 亿零 59 万飞行小时的历史最好安全记录。严重飞行事故的发生,不仅会给航空公司带来巨大的经济损失,更会对乘客造成极大的生命威胁。因而需要聚焦飞行安全问题,强化航空安全研究,综合利用现有数据强化科学管理,通过有针对性、系统性的管控手段有效提升从业人员的素质,监测和预警风险,进而降低飞行事故的发生几率。
航空安全大数据主要包括快速存取记录器(Quick Access Recorder, QAR)数据,该数据主要记录飞机在飞行过程中的各项飞行参数;在飞行品质监控(Flight Operational Quality Assurance,FOQA)中,QAR 中超出人为设定限制值的数据记为超限数据。除此之外,在实际研究过程中,还会涉及到飞行中的舱音数据等。本问题主要涉及的是 QAR 数据,QAR 数据相对比较规范。
背景分析:这一部分点明了本题的主体,说明了QAR数据是什么,即附件内容,后面会写数据集的分析与处理。

在飞行品质监控具体研究和应用方面,目前我国民航业内的研究主要分为两个方面,一是针对超限事件的研究、分析和应用;二是对非超限数据的统计分析和应用。对于超限事件的研究,一般是通过规定飞行参数的集中区域设置超限阈值,将超出阈值部分的飞行记录找出来,进行重点分析,防范潜在隐患造成严重飞行事故。
目前此类分析是飞行品质监控工作的主体,较好地保证了现阶段的安全工作,其不足之处在于缺少对超限原因的分析。由于超限并非全部是人为因素引发,例如许多是由于特殊环境条件造成的,甚至有可能是飞机本身的设计、制造因素所致,因此仅通过单纯的超限分析很难识别出来;如果仅基于超限事件对飞行机组进行管理,很容易误入歧途。QAR 超限可用于航空安全管理和飞行训练的数据支持。目前并不倾向于仅以少量的 QAR 超限数据为依据开展飞行训练工作,因此飞行品质监控工作逐渐衍生出另外一种倾向性,即通过挖掘 QAR 全航段数据开展分析,形成特定人员的飞行品质记录。基于不同飞行机组、飞行航线、机场、特定飞行条件下的飞行记录,通过对数据进行建模、分析,计算评估风险倾向性,开展有针对性的安全管理,排查安全隐患,改进安全绩效。目前类似研究主要是大规模读取飞行数据,并进行存储和分析,形成飞行品质服务平台,为风险评估和趋势分析提供数据基础。G 值是飞机飞行过程中过载情况的直接反应,在着陆安全分析中,G 值通常是描述落地瞬间安全性的重要指标。着陆瞬间 G 值指的是飞机接地瞬间前 2 秒和后5 秒数据的最大 G 值。
背景分析:这一部分主要就是给出了通过对QAR数据挖掘,可以改善飞行品质监控工作,从而改进进安全绩效。


基于以上背景,请你们团队解决以下问题:
问题 1:有些 QAR 数据存在错误,需要对数据进行预处理,去伪存真, 以减少错误数据对研究分析带来的影响。请你们的队伍对附件 1 的数据质量开展可靠性研究,提取与飞行安全相关的部分关键数据项,并对其重要程度进行分析。
问题一分析:问题一可以分为两小问,首先需要进行数据预处理,其中特别的要针对错误数据进行分析,剔除,这个过程也就是提到的可靠性研究。
常见的剔除数据的方法就是使用箱型图剔除异常值,如下是一个简单的箱形图:


将一组数据从大到小排列,分别计算出,
上四分位数 3: 75%分位点所对应的值
中位数 2: 50%分位点对应的值
下四分位数 1: 25%分位点所对应的值
上边缘(须): Q3+1.5(Q3-Q1)
下边缘(须): Q1-1.5(Q3-Q1)
数据 的合理范围为:


和使用3σ准则剔除异常值相比,箱形图不需要数据服从正态分布,能真实直观的表现数据形状;箱线图以四分位数和四分位距作为判断异常值的标准,四分位数具有一定的耐抗性,多达 25%的数据可以变得任意远而不会很大地扰动四分位数,使得异常值无法对数据形状造成巨大影响,因此箱形图识别异常值的结果比较客观。
通过此方法剔除附件1的异常数据,然后题目需要对数据质量进行可靠性研究,这里就分析哪几个指标的数据异常值多,更加分散即可。另外,对于一些离散型数据,比如二值数据等,如果想要检测异常值,只能以其他指标作为输入,当前指标为输出进行预测。查看预测值与真实值的差异来判断,不建议这么做。
针对第一问的第二小问,即提取与飞行安全相关的部分关键数据项,并对其重要程度进行分析,这部分可以使用相关性分析来提取重要程度,这一部分可以使用相关性的热力图进行可视化,即下图这种。根据目标指标的相关性系数排序,来确定重要程度。同样的,这里也可以使用一些其他的评价类算法,比如灰色综合评价法、模糊综合评价法等方式进行重要程度的排序与建模。


在第一问开始前,最好对数据集做一个初步的EDA(探索性数据分析),包括一些数据可视化。包含但不限于:

  • 数据量、特征数量、数据类型
  • 数据分布情况(标准差、分位数、最大最小值)
  • 重复值处理(保留、删除):假如你想发现某个用户的行为模式,该用户在不同的时间点进行相同的操作,那这个重复值是不是能帮助你获取该用户的行为偏好(你的问题),那可以保留
  • 异常值处理(保留、删除):假如你正在做异常检测的任务,那这个信息能帮助你进行有效的数据标注(你的需要)
  • 缺失值处理(删除、填充)

这里推荐的数据可视化方法有:
单变量可视化:查看数据分布-直方图、箱线图
两个变量的可视化:相关性分析-线图、散点图、热力图,比如:


问题 2:飞机在从起飞到着陆的整个飞行过程中,通过一系列的飞行操纵确保飞行安全,这些操纵主要包括横滚操纵、俯仰操纵等。目前,国内航空公司通过超限监控飞行操纵动作,这种监控方法虽然能够快速分辨 出飞机的状态偏差,但是只能告诉安全管理人员发生了什么,而不能立刻 得出发生这种偏差的原因。为此,可以通过操纵杆的过程变化情况来分析 产生这种偏差的原因。根据附件 1,请你们对飞行操纵进行合理量化描述。下图为 3 次着陆过程中的杆位变化曲线,其中红色曲线描述了一次重着陆(着陆 G 值超过给定限制值)过程,该重着陆主要是由于飞行机组在低空有一次不当松杆操纵所致,红色曲线中的接地前 5 秒有一个明显下凸,这就是需要进行量化描述的一次松杆操纵。

问题二(小部分)分析:量化描述可以通过变化率、阈值等进行描述,在判断时同样根据这些指标来分辨,可以在这里设置置信区间等方式。这里可能需要进行算法准确率的分析。有时间,可以使用时间序列分析(比如arima)
这里可以做置信度、置信区间分析。还可以划分训练集、测试集来直接计算精确率。这里还可以可视化ROC曲线等。
1.精确率(precision)
就precision而言有很多版本,各种说法不一,有精确率也有正确率更有甚者把准确率也搞出来了实在受不了,反正咱们看英文precision。

precision是表示预测为正样本中,被实际为正样本的比例。可以看出precision是考虑的正样本被预测正确的比例.根据图1-1可得其计算公式为:P = TP / (TP + FP)
2. 召回率(recall)
召回率是表示实际为正样本中,预测为正样本的比例。可以看出,召回率考虑的是正样本的召回的比例.根据图1-1可得其计算公式为:P = TP / (TP + FN)
3.准确率(accuracy)
准确率表示所有的预测样本中,预测正确的比例.其计算公式为:A = (TP + TN) / (TP + FN + FP + TN)
总结:精确率(accuracy)和召回率(recall)计算公式的分子都是TP也就是正样本被预测为正样本的数量,可知其为正样本的精确率和正样本的召回率.而准确率(accuracy)主要表征的是整体预测正确的比例.


以上仅为第一、二问部分思路(后续完善),剩余部分思路、数据集和其他具体配套代码、参考论文,以及其他题目思路,可以看文末群名片获取


问题 3:导致不同超限发生的原因各不相同,有时是特定机场容易出现特定的超限,有时是特定的天气容易出现特定的超限,有时是特定的飞 行员容易出现特定的超限。请研究附件 2 的数据,对超限的不同情况进行分析,研究不同超限的基本特征,如分析飞机在哪些航线或者在哪些机场 容易出现何种超限等。
问题 4:飞机运行数据的研究一般分为两大类,一类是通过航线运行安全检查(Line Operations Safety Audit,LOSA)获取的飞行员的运行表现, 另外一类是根据相关学者建议,基于飞行参数开展飞行技术评估。根据附

件 3,请你们建立数学模型,探讨一种基于飞行参数的飞行技术评估方法, 分析飞行员的飞行技术,数据表中的“不同资质”代表飞行员的不同技术级 别。

问题 5:随着技术的进步,未来在民航客机上安装实时传输的 QAR 数

据记录系统已成为可能,这种“实时飞行数据”技术,可以在接近实时的情 况下把航班飞行数据传输到地面分析系统,极大地提高风险识别能力和预 防水平。假设飞行数据已能实现陆空实时传输,如果你是该航空公司的安 全管理人员,请建立航空公司实时自动化预警机制,预防可能的安全事故 发生,结合附件 1 的数据,给出仿真结果。

以上仅为第一、二问部分思路(后续完善),剩余部分思路、数据集和其他具体配套代码、参考论文,以及其他题目思路,可以看文末群名片获取

选题建议如下:2023Mathorcup高校数学建模挑战赛ABCD选题建议_DS C君的博客-CSDN博客


http://www.ppmy.cn/news/53601.html

相关文章

Docker-Compose 了解 部署nginx与lnmp

Docker-Compose Docker-compose 简介YAML 文件格式及编写注意事项Docker Compose配置常用字段Docker Compose 常用命令Docker Compose 文件结构部署 composeDocker Compose 环境安装 compose部署nginx(1)准备依赖文件编写配置文件docker-compose.yml com…

Epinio:Kubernetes 的应用程序开发引擎

王海龙,Rancher 中国社区技术经理,Linux Foundation APAC Evangelist,负责 Rancher 中国技术社区的维护和运营。拥有 9 年的云计算领域经验,经历了 OpenStack 到 Kubernetes 的技术变革,无论底层操作系统 Linux&#x…

HTTP 知识点总结

GET 和 POST 的区别有哪些? 区别一:幂等性 由于 GET 是读,POST 是写,所以 GET 是幂等的,POST 不是幂等的 由于 GET 是读,POST 是写,所以用浏览器打开网页会发送 GET 请求,想要 POST…

vue2之echarts的封装 折线图,饼图,大图

目录 vue2之echarts的封装 折线图,饼图,大图折线图,饼图chartPan.vue使用 chartPan.vue 之饼图效果使用 chartPan.vue 之折线图效果展开大图大图组件 maxChart.vue大图效果 vue2之echarts的封装 折线图,饼图,大图 折线…

数据集合注入

集合注入 前面我们已经能完成引入数据类型和简单数据类型的注入,但是还有一种数据类型集合,集合中既可 以装简单数据类型也可以装引用数据类型,对于集合,在Spring中该如何注入呢? 先来回顾下,常见的集合类型有哪些…

JAVA接口的基本测试------JAVA入门基础教程

public class Interface {public static void main(String[] args){System.out.println(Flyable.max_speed);System.out.println(Flyable.min_speed);//类与接口是实现关系Bullet b new Bullet();b.attack();b.fly();Flyable f new Bullet();f.fly();} }interface Flyable {p…

数据包守恒 TCP 拥塞控制

数据包守恒是包括拥塞控制在内的合理利用带宽的方法之基石,它维持了有效网络传输的稳定,过去 40 年是,未来还是。数据包守恒可以描述为: 当带宽恰好满载时,receiver 收到 1 个数据包后 sender 才能发送 1 个数据包。当…

hbase 设置超时参数

一、为什么要设置超时参数 hbase设计的目标是成为一个高可用集群,能够在失败的时候快速响应,当出现网络抖动等偶发情况时,能快速重试,让用户可以快速拿到结果。而不是一直卡着,使得上层应用阻塞等待。 这个功能可以通…