【2023年第十一届泰迪杯数据挖掘挑战赛】A题:新冠疫情防控数据的分析 32页和40页论文及实现代码

news/2024/11/26 1:51:14/

请添加图片描述

【2023年第十一届泰迪杯数据挖掘挑战赛】A题:新冠疫情防控数据的分析 32页和40页论文及实现代码

相关链接

(1)建模方案

【2023年第十一届泰迪杯数据挖掘挑战赛】A题:新冠疫情防控数据的分析 建模方案及python代码详解

(2)相关赛题论文

【2023年第十一届泰迪杯数据挖掘挑战赛】A题:新冠疫情防控数据的分析 32页和40页论文及实现代码

【2023年第十一届泰迪杯数据挖掘挑战赛】B题:产品订单的数据分析与需求预测 23页论文及实现代码

【2023年第十一届泰迪杯数据挖掘挑战赛】C题:泰迪内推平台招聘与求职双向推荐系统构建 27页论文及实现代码

1 题目

一、背景

自2019年底至今,全国各地陆续出现不同程度的新冠病毒感染疫情,如何控制疫情蔓 延、维持社会生活及经济秩序的正常运行是疫情防控的重要课题。大数据分析为疫情的精准 防控提供了高效处置、方便快捷的工具,特别是在人员的分类管理、传播途径追踪、疫情研 判等工作中起到了重要作用,为卫生防疫部门的管理决策提供了可靠依据。疫情数据主要包 括人员信息.csv、场所信息.csv、个人自查上报信息.csv、场所码扫码信息.csv、核酸采样检测信息.csv、疫苗接种信息.csv。本赛题提供了某市新冠疫情防疫系统的相关数据信息,请根据这些数据信息进行综合分 析,主要任务包括数据仓库设计、疫情传播途径追踪、传播指数估计及疫情趋势研判等。

(1)人员信息表:附件2.csv

序号字段名字段说明字段类型默认值
1user_id人员id:人员的唯一标识bigint(20)
2openid微信OpenIDvarchar(64)null
3.gender性别:男、女varchar(2)null
4nation民族varchar(20)null
5age年龄intnull
6birthdate出生日期varchar(20)null
7create_time创建时间timestampnull

(2)场地信息表:附件3.csv

序号字段名字段说明字段类型默认值
1grid_point_id场所id:场所的唯一标识bigint(20)
2name场所名varchar (255)null
3.point_type场所类型varchar (50)nnulnulll
4x_coordinateX坐标(单位:米)decimal(12,2)null
5y_coordinateY坐标(单位:米)decimal(12,2)null
6create_time创建时间timestampnull

(3)个人自查上报信息表:附件4.csv

NO.字段名字段说明字段类型默认值
1sno序列号:自查记录的唯一标 识bigint(20)
2user_id人员ID:对应于"人员信息表"中的user_id . ID长整型数字(20)
3.x_coordinate上报地点的x坐标小数(12,2)null
4y_coordinate上报地点的y坐标小数(12,2)null
5symptom症状:1 发热、2 乏力、3 干 咳、4 鼻塞、5 流涕、6 腹泻、 7 呼吸困难、8 无症状varchar (100)null
6nucleic_acid_result核酸检测结果:0 阴性、1 阳 性、2 未知(非必填)varchar (10)null
7resident_flag是否常住居民:0未知,1是,2否intnull
8dump_time上报时间timestampnull

(4)场所码扫码信息表:附件5.csv

序号字段名字段说明字段类型默认值
1sno序列号:扫码记录的唯一标 识bigint(20)
2grid_point_id场所ID:对应于"场所信息表"中的grid_point_idbigint(20)
3user_id人员ID:对应于"人员信息表"中的user_id . IDbigint(20)
4temperature体温doublenull
5create_time扫码记录时间timestampnull

(5)核酸采样检测信息表:附件6.csv

序号字段名字段说明字段类型默认值
1sno序列号:核酸采样记录的唯 一标识bigint(20)
2user_id人员ID:对应于"人员信息表"中的user_id . IDbigint(20)null
3cysj采样日期和时间timestampnull
4jcsj检测日期和时间timestampnull
5jg检测结果:阴性、阳性、未 知varchar (50)null
6grid_point_id场所ID:对应于"场所信息表"中的grid_point_idbigint(20)

(6)疫苗接种信息表:附件7.csv

序号字段名字段说明字段类型默认值
1sno序列号:疫苗接种记录的唯 一标识bigint(20)
2inject_sn接种流水号varchar(50)
3user_id人员ID:对应于"人员信息表"中的user_id . IDvarchar(50)
4age接种者年龄intnull
5gender性别:1 男、2 女varchar(10)null
6birthdate出生日期varchar(50)null
7inject_date接种日期timestampnull
8inject_times针次:1 第一针、2 第二针、 3 加强针varchar(30)null
9vaccine_type疫苗类型:1 灭活疫苗、2 重 组蛋白疫苗、3 病毒载体疫 苗、4 核酸疫苗、5 减毒疫苗varchar(30)null

二、问题

  1. 根据核酸检测中阳性人员的出行时间与场所追踪密接者,将结果保存到“result1.csv”文件中,文件模板格式如下
序号密接者ID密接日期密接场所ID阳性人员ID
  1. 由问题1的结果,根据密接者的出行时间与场所追踪相应的次密接者,将结果保存到“result2.csv”文件中,文件模板如下。
序号次密接者ID次密接日期次密接场所ID密接者ID
  1. 建立模型,分析接种疫苗对病毒传播指数的影响。

  2. 根据阳性人员的数量及辐射范围,分析确定需要重点管控的场所。

  3. 为了更精准地进行疫情防控和人员管理,你认为还需要收集哪些相关数据。基于这些数据构建模型,分析其精准防控的效果。

注在解决上述问题时,要求结合赛题提供的数据信息表建立数据仓库,实现数据治理的内容,请在论文中明确阐述做了哪些数据治理工作,具体是如何实现的。

2 论文一介绍

新冠疫情防控数据的分析 --基于机器学习算法的大数据分析

摘要

自新冠疫情发生以来,这一感染性极强的病毒在全球呈现爆发式的蔓延和增长,对全球的社会经济和人类的日常生活都造成了极大的影响。因此,对于疫情的防控和治疗措施对于全球而言都是及其重要的一个课题。

本文主要是基于题目所给的自疫情发生以来所记录的部分数据,运用Python对数据进行清洗和处理,确定密接者和次密接者的信息,结果导出在result1.csv和result2.csv文件中,使疫情防控更为精确而有效;其次,根据人员接种疫苗前后的感染情况,运用SEIR传染病模型求解病毒传播指数,运用卡方检验和皮尔逊、斯皮尔曼等级相关系数进行相关性检验,以此求解不同人群在不同场合感染、传播病毒的速率,结果表明,接种疫苗能够减缓病毒传播速度;最后,再根据阳性人员的密集程度将重点防控区域落于公共交通场所,社区住所,以及学校和各大娱乐场所,以便达到更好的疫情防控效果。此外,根据分析我们还发现如果将成年人视为重点防控人员,可以在一定程度上减缓病毒传播的速度,从而达到一定的防控效果。

基于此次数据调查与分析,希望可以给疫情防控带来一定的可行措施,使疫情防控更为精确化,减缓病毒的传播速率;此外,对于机器学习算法在解决现实问题中的运用,可以大大降低人力资源的浪费,更高效的解决实际问题。

**关键字:**机器学习算法, SEIR传染病模型,卡方检验, 皮尔逊、斯皮尔曼等级相关系数

在这里插入图片描述

3 论文二介绍

基于机器学习新冠疫情防控趋势研判

摘要

由于各地陆续出现不同程度的新冠病毒感染疫情,如何控制疫情蔓延、维持社会生活及经济秩序的正常运行是疫情防控的重要课题。基于该背景下,大数据分析为疫情情况的预测和峰值提高重要参照,提高治理效率,降低人员伤亡,出台符合中国国情的疫情应对措施。大数据特别是在人员的分类管理、传播途径追踪、疫情研判等工作中起到了重要作用,为卫生防疫部门的管理决策提供了可靠依据。

本文就新冠疫情防控情趋势研判,提出了创新性的解决方法:使用K-近邻(KNN)机器学习算法来找到与阳性人员有过密切接触的其他人员,且使用 KNN算法来实现次密接者追踪,还引用了机器学习线性回归模型进行分析探究接种疫苗和病毒指数的影响,再根据热力图和机器学习K-Means聚类算法找出阳性人员的数量及辐射范围,分析确定需要重点管控的场所,最后使用时空分析方法分析人员流动的有向图和使用聚类分析算法将地点划分为不同的聚类,再结合数据治理的知识,对疫情防控和人员管理提供更加精准的决策参考。

关键字:

k-近邻(KNN) 线性回归 机器学习 K-Means聚类

在这里插入图片描述

4 获取方式

电脑浏览器打开

(1)第一篇

(2)第二篇


http://www.ppmy.cn/news/61169.html

相关文章

等保各项费用支出明细

等保收费主要依据文件: 等保工作的定级指南文件_luozhonghua2000的博客-CSDN博客 Q7:做等级保护要多少钱? 答:开展等级保护工作主要包含:规划费用、建设或整改费用、运维费用、测评费用等,具体费用因各单位现状、保护对象承载业务功能、重要程度、所在地区等差异较大。 …

Java 17 新特性尝鲜

JDK 17更新了包括14个特性,具体如下表所示: Restore Always-StrictFloating-Point Semantics 恢复始终严格模式(Always-Strict)的浮点语义EnhancedPseudo-Random Number Generators 增强型伪随机数生成器New macOS RenderingPipe…

MySQL_1 数据库的基本操作

目录 一、拾枝杂谈 1.cmd验证MySQL服务 : 2.cmd连接MySQL服务 : 3.MySQL服务 : 二、数据库介绍 1.定义 : 2.SQL语句分类 : 三、数据库操作 1.数据库的创建 : 1 基本语法 2 演示 2.数据库的删除 : 1 基本语法 2 演示 3. 数据库的查询 : 1 基本语法 2 演示 4.数据库的…

itop-3568开发板驱动学习笔记(25)设备树(四)GPIO 实例分析

《【北京迅为】itop-3568开发板驱动开发指南.pdf》 学习笔记 文章目录 GPIO 控制器必要属性其他属性 指定 GPIO 引脚 和时钟类似,GPIO 在设备树中也存在两层定义,首先是 GPIO 控制器,这部分由芯片原厂工程师编写,相当于 GPIO 底层…

sentinel 随笔 2-降级处理

0. 像喝点东西,但不知道喝什么 先来段源码,看一下 我们在dashboard 录入的降级规则,都映射到哪些字段上 package com.alibaba.csp.sentinel.slots.block.degrade;public class DegradeRule extends AbstractRule {public DegradeRule(String…

【Python】贪吃蛇 —— 无聊必备的小项目

作者主页:爱笑的男孩。的博客_CSDN博客-深度学习,活动,YOLO领域博主爱笑的男孩。擅长深度学习,活动,YOLO,等方面的知识,爱笑的男孩。关注算法,python,计算机视觉,图像处理,深度学习,pytorch,神经网络,opencv领域.https://blog.csdn.net/Code_and516?typecollect个人…

鸿蒙Hi3861学习四-Huawei LiteOS介绍

一、什么是LitesOS Huawei LiteOS是华为针对物联网领域推出的轻量级物联网操作系统,是华为物联网战略的重要组成部分,具备轻量级、低功耗、互联互通、组件丰富、快速开发等关键能力。基于物联网领域业务特征打造领域性技术栈,为开发者提供“一…

Vue学习笔记1 - Vue是什么?

1,Vue概念 官网上(简介 | Vue.js) 上说, Vue (发音为 /vjuː/,类似 view) 是一款用于构建用户界面的 JavaScript 框架。 这个还好理解,就是说它是一款前端框架,用于构建 前端界面的。 但是它…