医学数据分析实训 项目一 医学数据采集

devtools/2024/9/19 11:28:47/ 标签: 数据库

项目一 医学数据采集

一、实践目的

  1. 了解医学数据的特点;
  2. 熟悉常见的医学公共数据库的使用方法;
  3. 掌握获取医学数据的方法;

二、实践平台

  1. 操作系统:Windows10 及以上
  2. Python 版本:3.8.x 及以上
  3. PyCharm 或 Anoconda 集成环境

三、实践内容

医学数据采集实验的数据来源广泛,主要包括以下几个方面:

  • 患者数据:通过电子病历系统、患者自主记录等方式收集患者的临床症状、体征、病史、用药情况等信息;
  • 医疗设备数据:利用各种医疗设备(如心电图机、超声仪、CT 扫描仪等)实时监测患者的生理参数和健康状况,生成大量医学图像和数据;
  • 实验室数据:通过实验室检测获取患者的生化指标、遗传学信息、微生物学结果等数据;
  • 外部数据源:包括公共卫生数据库、医学研究数据库等,这些数据库包含了大量的医学研究成果和临床数据,为医学数据采集实验提供了丰富的资源。

1. 熟悉常见医学公共数据库的使用方法

(1)熟悉 Kaplan-Meier Plotter 平台 https://kmplot.com/analysis/ 的使用
  • 操作过程
    • 访问 Kaplan-Meier Plotter 平台首页(图 1)。
      在这里插入图片描述

    • 输入对应参数(图 2),如基因 STAT2 和乳腺癌生存率的相关性。

    • 在这里插入图片描述

    • 生成生存率关系图(图 3),并通过文字对结果进行解释。

    • 在这里插入图片描述
      在这里插入图片描述

解释含义:(fitten code生成)

1 高表达STAT2基因的乳腺癌患者群体的生存率显著高于低表达

2 体这种差异在统计学上是显著的(Log-rank P值为9e-11)

3 STAT2基因的高表达可能与乳腺癌患者更好的生存率相关

(2)熟悉 SEER 数据库 https://seer.cancer.gov/data-software/ 的使用方法
  • 操作过程
    • 在 SEER 数据库中查询癌症数据。

    • 在这里插入图片描述
      在这里插入图片描述

    • 对查询结果(图 4)进行解释。

    • 在这里插入图片描述

解释含义:(fitten code生成)

1 从2000年到2021年,男性和女性的癌症发病率总体上保持稳定,没有显著的变化

2 男性和女性的发病率在2000年至2017年间没有显著的年度百分比变化

3 这张图表明,在2000年至2021年期间,所有癌症部位的年龄调整发病率在男性和女性中都没有显著变化

2. 使用 GEO 数据库 https://www.ncbi.nlm.nih.gov/geo 下载数据集

  • 操作步骤

    • 访问 GEO 页面(图 5)。

    • 在这里插入图片描述

    • 在 GEO 中检索肝癌(HCC)环状 RNA(circRNA)研究数据(图 6)。

    • 在这里插入图片描述

    • 选择并查看检索到的数据集(图 7)。

    • 在这里插入图片描述

    • 查看数据集的详细信息(图 8)。

    • 在这里插入图片描述

    • 下载数据集(图 9)。

    • 在这里插入图片描述

  • 查看下载的数据集文件(图 10),并对该数据集进行解释。

解释含义:(fitten code生成)

在GEO(Gene Expression Omnibus)数据库中,"ID_REF"通常表示基因或探针的标识符。在你提供的数据集中,"ID_REF"后面的数据是基因或探针的表达值,这些值对应于不同的样本(GSM编号)。
这是一个关于肝癌(HCC)环状RNA(circRNA)研究的表达矩阵。每一行代表一个特定的circRNA(由"ID_REF"标识),每一列代表一个样本(由GSM编号标识)。矩阵中的数值表示相应circRNA在相应样本中的表达水平。
例如,第一行数据:

“ASCRP000002” 9.042573151 9.238902276 8.997313248 9.4371723 8.962706649 9.415486133 9.017848355 9.524889458 9.671877122 9.479558558 9.227469787 9.409693079 8.97187312 8.96956744
CopyInsert
表示circRNA "ASCRP000002"在14个不同样本中的表达值。这些值可以用来分析circRNA在不同样本中的表达差异,从而研究其在肝癌发生发展中的作用。

3. 通过 UCI 机器学习库下载数据集

  • 操作步骤
    • 访问 UCI 机器学习库官网(https://archive.ics.uci.edu/ )。

    • 在这里插入图片描述

    • 在数据集中搜索并下载任意两个与医药卫生相关的数据集。

    • 一个是心脏病数据集,另一个是乳腺癌数据集。download the datasets.

    • 在这里插入图片描述

    • 在这里插入图片描述
      在这里插入图片描述
      在这里插入图片描述

在这里插入图片描述

  • 通过文字对数据集进行解释。

解释含义:(fitten code生成)

  • 这个打开数据集,自己看吧。这里举一个例子
  • 在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
- 

http://www.ppmy.cn/devtools/112261.html

相关文章

Python 的分支结构

引言 在前面的课程中,我们已经学习了 Python 的基本输入输出、数据类型及其转换,以及简单的顺序结构程序设计。本课时将介绍 Python 中的分支结构,主要讨论如何使用条件语句 if, elif, else 来根据不同的条件执行不同的代码块。通过两个具体的…

局域网windows下使用Git

windows下如何使用局域网进行git部署 准备工作第一步 ,ip设置设置远程电脑的ip设置,如果不会设置请点击[这里](https://blog.csdn.net/Black_Friend/article/details/142170705?spm1001.2014.3001.5501)设置本地电脑的ip:验证 第二步&#x…

golang学习笔记14——golang性能问题的处理方法

推荐学习文档 基于golang开发的一款超有个性的旅游计划app经历golang实战大纲golang优秀开发常用开源库汇总golang学习笔记01——基本数据类型golang学习笔记02——gin框架及基本原理golang学习笔记03——gin框架的核心数据结构golang学习笔记04——如何真正写好Golang代码&…

文字溢出隐藏及鼠标悬停显示效果

在本文中&#xff0c;我们将学习如何使用 CSS 和 JavaScript 实现一个简单的文字溢出隐藏效果&#xff0c;当鼠标悬停在文本上时显示完整内容。 创建 HTML 页面结构 首先&#xff0c;我们需要创建一个包含文本内容的 HTML 页面。 <!DOCTYPE html> <html lang"…

MySQL从C盘迁移到D盘

文章目录 前言一、停止MySQL服务打开服务&#xff08;方式一&#xff09;打开服务&#xff08;方式二&#xff09;停止MySQL服务 二、找到C盘中的文件文件夹1文件夹2文件夹3 三、修改文件内容1.对应文件夹12.对应文件夹3 四、 修改注册表中文件路径1.打开注册表2. 修改注册表中…

Cargo 入门

文章目录 发现宝藏1. 安装 Cargo2. 创建一个新项目1.1.打开终端1.2. 创建新项目1.3. 进入项目目录1.4. 查看项目结构 3. 构建和运行项目3.1. 构建项目3.2. 运行项目 4. 管理依赖4.1. 编辑 Cargo.toml4.2. 安装依赖4.3. 在代码中使用依赖 5. 运行测试5.1. 编写测试5.2. 运行测试…

一种没有注释的语言

原文&#xff1a;Breck Yunits - 2024.09.05 JSON 是 PLDB&#xff08;A Programming Language Database&#xff09;中唯一不支持注释的流行语言。JSON 既不支持单行注释&#xff0c;也不支持多行注释。 JSON 最初是有注释的 Douglas Crockford 在 2012 年解释了他独特的设计…

设计师私藏的 PDF 转 JPG 利器

你平常会通过扫描来发送文件吗&#xff1f;为了保证图片的清晰度一般都会采用PDF格式来转发&#xff0c;但是要插入到一些文件里的时候PDF格式不是那么好用。这时候就很需要PDF转jpg工具了。今天我就分享几款我用过的PDF转jpg的工具&#xff0c;有兴趣就接着往下看吧。 1.福昕…

【LeetCode 算法笔记】739. 每日温度

目录 问题描述暴力解法栈 问题描述 给定一个整数数组 temperatures &#xff0c;表示每天的温度&#xff0c;返回一个数组 answer &#xff0c;其中 answer[i] 是指对于第 i 天&#xff0c;下一个更高温度出现在几天后。如果气温在这之后都不会升高&#xff0c;请在该位置用 0…

PPT数据可视化:Python-pptx让图表制作变得轻而易举

哈喽,大家好,我是木头左! 安装和配置python-pptx 确保你的Python环境中已经安装了python-pptx库。如果没有,可以通过pip轻松安装: pip install python-pptx安装完成后,你就已经拥有了在PPT中创建图表所需的全部工具。 创建一个简单的柱状图 让从一个基础的例子开始:…

使用python来保存键盘输入情况,可保存到sqlite3数据库

1.代码单次保存最大键盘输入数目是300,全局变量可改 2、在gui界面可以设置单次保存的名字,方便下次查找&#xff0c;录入数据库 3. gui界面有串口选择按钮,需要有硬件串口转hid模块ch9329的&#xff0c;可以直接发送串口数据来实现模拟键盘输入. 没有硬件的直接注释即可. 好…

PHP智驭未来悦享生活智慧小区物业管理小程序系统源码

智驭未来&#xff0c;悦享生活 —— 探索智慧小区物业管理小程序 一、引言&#xff1a;智慧生活的新篇章 在这个日新月异的时代&#xff0c;科技正以前所未有的速度改变着我们的生活。从智能家居到智慧城市&#xff0c;每一处都闪耀着智慧的光芒。而今天&#xff0c;我要带大家…

基于深度学习的精准农业分析

基于深度学习的精准农业分析利用深度学习技术处理和分析农业中的各种数据源&#xff0c;包括遥感影像、气象数据、土壤信息和作物生长情况&#xff0c;从而优化农业生产&#xff0c;实现资源的精确管理和农业产量的提升。 1. 精准农业的挑战 数据复杂性&#xff1a;精准农业依…

网络安全宣传周的时间,举办活动的方式和意义

网络安全宣传周是中国国家层面为提升公众网络安全意识、普及网络安全知识、推广网络安全技能而设立的一项重要活动。以下是对网络安全宣传周的时间&#xff0c;举办活动的方式和意义的介绍&#xff1a; 时间&#xff1a;国家网络安全宣传周自2014年首次举办以来&#xff0c;每…

ai 回答HFS是什么 HTTP的文件服务器是什么

HFS&#xff08;HTTP File Server&#xff09;是一个基于HTTP协议的文件服务器软件&#xff0c;它允许用户通过浏览器访问和共享计算机上的文件。HFS的特点包括界面简洁直观、易于安装和配置、支持虚拟文件系统、多种权限设置等。用户可以轻松地在本地网络或互联网上共享文件和…

Adobe Acrobat安装(CSDN_20240915)

安装步骤 1. 点击安装执行文件 2. 进入安装界面&#xff0c;点击继续 3. 点击安装 4. 等待安装 5. 安装完成后点击完成 6. 将Crack路径下的文件复制到安装路径 7以管理员身份运行 8输入目标路径 9解压完成后&#xff0c;以管理员身份运行Patch 10点击patch&#xff0c;完成破解…

linux驱动开发-地址映射

地址映射 在Linux驱动开发中&#xff0c; 地址映射是指如何将设备的物理地址映射到虚拟地址空间&#xff0c; 从而使得内核可以通过虚拟地址与设备进行交互。 这一过程在设备的初始化和操作中都是至关重要的&#xff0c; 尤其是在涉及到内存映射I/O时。 1. 地址映射的基本概念…

【YashanDB知识库】archivelog磁盘满导致数据库abnormal

本文转自YashanDB官网&#xff0c;具体内容可见archivelog磁盘满导致数据库abnormal 【问题分类】功能使用 【关键字】磁盘空间满&#xff0c;archivelog日志&#xff0c;archivelog自动清理 【问题描述】数据库状态变更为abnormal&#xff0c;检查V$DIAG_INCIDENT视图&#…

怎么将几个pdf合成为一个?把几个PDF合并成为一个的8种方法

怎么将几个pdf合成为一个&#xff1f;将多个PDF文件合并成一个整体可以显著提高信息整合的效率&#xff0c;并简化文件的管理与传递。例如&#xff0c;将不同章节的电子书合成一本完整的书籍&#xff0c;或者将多个部门的报告整合成一个统一的文档&#xff0c;可以使处理流程变…

公司搬迁至外地:选择新办资质还是迁移资质?

当企业面临搬迁&#xff0c;尤其是跨区域搬迁时&#xff0c;资质管理成为企业运营策略中的一个关键议题。企业需要在新办资质和迁移资质之间做出选择&#xff0c;这关系到企业的合规性、市场竞争力和业务连续性。本文将探讨这两种选择的考量因素&#xff0c;以及如何根据企业的…