DRIVEN|15分的CNN+LightGBM怎么做特征分类,适用于转录组

devtools/2024/10/19 4:21:41/

说在前面

今天分享一篇做深度学习模型的文章,这是一篇软硬结合的研究,排除转换实体产品,我们做生信基础研究的可以学习模仿这个算法,适用且不局限于临床资料转录组数据GWAS数据


今天给大家分享的一篇文章:Towards automatic home-based sleep apnea estimation using deep learning

  • 标题:使用深度学习实现家庭睡眠呼吸暂停的自动评估
  • 期刊名称:npj Digital Medicine
  • 影响因子:15.2
  • JCR分区:Q1
  • 中科院分区:医学1区 Top
  • 小类:卫生保健与服务1区 医学:信息1区

摘要

呼吸暂停和呼吸不足是常见的睡眠障碍,其特征是气道阻塞。多导睡眠图 (PSG) 是一种睡眠研究,通常用于计算呼吸暂停-呼吸不足指数 (AHI),即一个人每小时睡眠中呼吸暂停或某些类型的呼吸不足的次数,并诊断睡眠障碍的严重程度。及早发现和治疗呼吸暂停可以显著降低发病率和死亡率。然而,长期 PSG 监测是不可行的,因为它对患者来说既昂贵又不舒服。为了解决这些问题,我们提出了一种名为 DRIVEN 的方法,通过可穿戴设备在家中估计 AHI,并检测整个晚上何时发生呼吸暂停、呼吸不足和清醒期。因此,该方法可以帮助医生诊断呼吸暂停的严重程度。患者可以佩戴单个传感器或多个传感器组合,这些传感器可以在家中轻松测量:腹部运动、胸部运动或脉搏血氧仪。例如,DRIVEN 仅使用两个传感器,就将 72.4% 的测试患者正确归类到四个 AHI 类别之一,其中 99.3% 的患者要么正确分类,要么被置于与真实类别相差一个类别的位置。这是模型性能和患者舒适度之间的合理权衡。我们使用来自三项大型睡眠研究的公开数据,总共有 14,370 条记录。DRIVEN 由深度卷积神经网络和用于分类光梯度提升机组合而成。它可以用于在无人监督的长期家庭监测系统中自动估计 AHI,从而降低医疗系统成本并改善患者护理。

结果


表1 三个数据集


图 1:DRIVEN 的管道。

  • a数据按通道分离并分割成 30 秒的窗口。
  • b对于每个通道,经过不同训练的深度 CNN 从原始信号(输入)中提取特征(输出)。
  • c提取的特征被连接起来并输入到经过训练的 LightGBM,该 LightGBM 将输入数据分为正常和 AHI 事件(呼吸暂停、呼吸不足 1 型和呼吸不足 2 型)。


图 2:DRIVEN 对 AHI 事件分类的表现。

  • a接收者-操作员特性和 ( b ) 精确召回曲线。请注意胸部和腹部传感器的重叠曲线。
  • c使用两个输入通道(腹部运动和 SpO 2 )时 DRIVEN 的阈值相关性能指标。测试数据集中显示了所有患者的性能结果。准确度、精确度、召回率和 F1 事件分类是单个事件分类的指标。F1-AHI 分类测量在整个睡眠研究中预测 AHI 严重程度类别(健康、轻度、中度、重度)的 F1 分数。


图 3:DRIVEN 对 AHI 估计的表现。

  • a实际与预测 AHI 除以四个 AHI 严重程度组。
  • b混淆矩阵。在考虑阈值 0.79 和两个信号(腹部运动和 SpO 2)组合的情况下,根据测试数据评估性能。


表 2 不同传感器组合的 F1 得分


图 4:使用两个传感器(腹部运动和 SpO 2 )自动标记随机患者的 AHI 事件。

蓝色区域表示真实事件(零表示无事件,一表示 AHI 事件)。DRIVEN 的输出用符号表示,对于每个 30 秒窗口,这些符号表示该窗口被归类为 AHI 事件的概率。窗口根据其分类着色,取决于它们是高于还是低于确定的阈值 0.79。黑色十字代表被归类为清醒的片段,绿色三角形代表被归类为非 AHI 事件的片段,红色星号是被归类为 AHI 事件的窗口。第二张图放大了 1 小时的片段。补充图10将分辨率进一步提高到 15 分钟间隔。补充图11包括按呼吸暂停和不同低通气类型划分的真实标签。

总结

  • 主要是用了CNN深度卷积神经网络,捕捉信号特征,用LightGBM分类器进行检测和事件分类
  • 数据集的主要变量有腹部运动信号、胸部运动信号、血氧饱和度(SpO2)。深度学习模型预测指标就常见的:准确率(Accuracy)、敏感性(Sensitivity)、特异性(Specificity)、F1评分、受试者工作特性曲线下面积(AUC-ROC)。
  • 这套流程同样适用于临床资料,或者我们的转录组数据,变量从传感数据换成了量表队列或基因表达数据而已

http://www.ppmy.cn/devtools/46801.html

相关文章

Mysql——索引

索引的类型 按「数据结构」分类:Btree索引、Hash索引、Full-text索引。按「物理存储」分类:聚簇索引(主键索引)、二级索引(辅助索引)。按「字段特性」分类:主键索引、唯一索引、普通索引、前缀…

React UseMemo源码分析

useMemo useMemo 是 React 提供的内置 Hooks,主要作用就是缓存,如果依赖项没有变化,Memo 方法不会再次执行,计算量比较高的方法可以使用,从而提高用户体验。本文将通过一个例子跟踪 Memo 的创建、更新流程。 App.js …

红米K70 Pro:24G+1TB也降500元,值得入手

目录 一、外观设计:精致与实用并重 二、处理器:性能巅峰的骁龙8 Gen3 三、屏幕方面:沉浸式的视觉盛宴 四、拍照方面:记录生活的每一刻 五、存储方面:海量存储无忧 六、续航方面 红米 K70 Pro 作为Redmi系列中的高…

前端面试题日常练-day54 【面试题】

题目 希望这些选择题能够帮助您进行前端面试的准备,答案在文末 1. 在PHP中,以下哪个函数用于将一个字符串转换为日期时间对象? a) date() b) strtotime() c) datetime() d) time() 2. PHP中的超全局变量$_COOKIE用于存储什么类型的数据&a…

【头歌】计算机网络DHCP服务器配置第四关配置路由器子接口答案

头歌计算机网络DHCP服务器配置第四关配置路由器子接口操作步骤 任务描述 本关任务:配置路由器的子接口。 操作要求 在第一关的拓扑图的基础上,配置路由器及 PC 机,具体要求如下: 1、打开路由器物理接口 F0/0 ; 2、配置…

STM32作业实现(五)温湿度传感器dht11

目录 STM32作业设计 STM32作业实现(一)串口通信 STM32作业实现(二)串口控制led STM32作业实现(三)串口控制有源蜂鸣器 STM32作业实现(四)光敏传感器 STM32作业实现(五)温湿度传感器dht11 STM32作业实现(六)闪存保存数据 STM32作业实现(七)OLED显示数据 STM32作业实现(八)触摸按…

【Linux】Linux工具——gdb

1. gdb 概述 GDB是GNU开源组织发布的一个强大的UNIX下的程序调试工具。或许,各位比较喜欢那种图形界面方式的,像VC、BCB等IDE的调试,但如果你是在 UNIX平台下做软件,你会发现GDB这个调试工具有比VC、BCB的图形化调试器更强大的功能…

java web爬虫

目录 读取本地文件 从网站读取文件 java爬虫 总结 读取本地文件 import java.io.File; import java.io.PrintWriter; import java.util.Scanner;public class ReplaceText {public static void main() throws Ex