GRN前沿:STGRNS:一种基于transformer的可解释方法,用于从单细胞转录组数据推断基因调控网络

news/2025/2/7 22:24:51/

1.论文原名:STGRNS: an interpretable transformer-based method for inferring gene regulatory networks from single-cell transcriptomic data

2.发表日期:2023.4.2

摘要:

动机:单细胞RNA测序(scRNA-seq)技术提供了一个推断细胞特异性基因调控网络(GRNs)的机会,这是系统生物学中的一个重要挑战。尽管已经开发了许多方法来从scRNA-seq数据推断GRNs,但是处理细胞异质性仍然是一个挑战。结果:为了解决这一难题,我们开发了一种可解释的基于转化子的方法,即STGRNS,用于从scRNA-seq数据中推断GRNs。该算法采用基因表达基序技术,将基因对转化为相邻的子向量,作为Transformer编码器的输入。通过避免网络中缺失阶段特异性调控,基因表达基序可以提高不同类型scRNA-seq数据的GRN推断的准确性。为了评估STGRNS的性能,我们在21个静态和27个时间序列scRNAseq数据集上与一些常用的方法进行了对比实验。实验结果表明,STGRNS方法具有较上级的性能.;此外,STGRNS也被证明比“黑箱”深度学习方法更具可解释性,而“黑箱”深度学习方法以难以清晰解释预测而闻名。

1. 研究背景与动机

  • 单细胞RNA测序(scRNA-seq)技术为在单细胞水平上研究基因调控机制提供了可能,但推断细胞特异性的基因调控网络(GRNs)仍然是系统生物学中的一个重要挑战。

  • 现有的GRNs推断方法分为无监督方法和有监督方法,但这些方法在处理单细胞数据的异质性时存在局限性,例如高稀疏性、噪声和dropout事件,限制了其准确性。

2. STGRNS方法框架

STGRNS的整体框架包括四个主要模块:基因表达模式(GEM)模块、位置编码层、Transformer编码器和分类层。以下是各模块的具体功能和实现方式:

1. 基因表达模式(Gene Expression Motif, GEM)模块

功能

GEM模块的核心功能是将基因对的表达数据转换为适合Transformer编码器输入的格式。它通过将基因表达向量分割为连续的子向量,并将同一基因对的子向量拼接成新的向量,从而保留基因表达的同步性特征。

  • 优势

    • 保留基因表达同步性:通过将基因对的子向量拼接,GEM能够保留基因表达的同步性特征,这对于推断基因调控关系至关重要。

    • 提高模型输入效率:将基因对转换为连续的子向量形式,使得Transformer编码器能够更有效地处理输入数据。

2. 位置编码层

功能

位置编码层的目的是在将基因对输入Transformer编码器时,保留基因表达向量的顺序或时间信息。这对于处理时间序列数据或具有伪时间顺序的单细胞数据尤为重要。

  • 优势

    • 保留时间信息:位置编码能够使模型捕捉到基因表达的时间或顺序信息,这对于推断基因调控网络至关重要。

    • 增强模型性能:通过引入位置信息,模型能够更好地理解基因表达的动态变化,从而提高推断的准确性。

3. Transformer编码器

功能

Transformer编码器的主要功能是计算不同子向量之间的相关性,并关注关键子向量。它通过多头自注意力机制和前馈网络来提取基因对的交互信息。

  • 优势

    • 并行处理:Transformer编码器能够并行处理输入数据,提高计算效率。

    • 全局信息捕捉:多头自注意力机制允许模型在多个不同的投影空间中捕捉基因对的交互信息,从而提高推断的准确性。

    • 关注关键特征:通过自注意力机制,模型能够自动关注对基因调控关系推断更为关键的子向量。

4. 分类层

功能

分类层的目的是根据Transformer编码器的输出,对基因对是否具有调控关系进行分类。它将编码器提取的特征用于最终的调控关系预测。

  • 优势

    • 简洁高效:分类层结构简单,但能够有效地将编码器提取的特征用于最终的调控关系预测。

    • 可解释性:通过分析分类层的输出,可以解释模型的预测结果,例如哪些子向量对最终预测结果的影响最大。


http://www.ppmy.cn/news/1570166.html

相关文章

C++多线程编程——基于策略模式、单例模式和简单工厂模式的可扩展智能析构线程

1. thread对象的析构问题 在 C 多线程标准库中,创建 thread 对象后,必须在对象析构前决定是 detach 还是 join。若在 thread 对象销毁时仍未做出决策,程序将会终止。 然而,在创建 thread 对象后、调用 join 前的代码中&#xff…

GD32F4xx系列微控制器中,定时器可以配置为霍尔传感器模式,用于处理霍尔传感器的输出信号

在GD32F4xx系列微控制器中,定时器可以配置为霍尔传感器模式,用于处理霍尔传感器的输出信号。 霍尔传感器通常用于检测磁场变化,广泛应用于电机控制、位置检测等场景。通过定时器的霍尔传感器模式,可以实现对霍尔传感器信号的捕获…

ONLYOFFICE 文档 8.3 已发布:PDF 图章、合并形状、更多格式支持等

ONLYOFFICE 最新版本的在线编辑器已发布,包含约 30 项新功能和多个错误修复。阅读本文,了解所有更新内容。 关于 ONLYOFFICE 文档 ONLYOFFICE 是一个开源项目,专注于高级和安全的文档处理。坐拥全球超过 1500 万用户,ONLYOFFICE …

数据实时推送至前端的主流方法总结

数据实时推送至前端的主流方法总结 引言方案WebSocket(全双工双向通信)Server-Sent Events (SSE)(单向服务器推送)长轮询(Long Polling)第三方库/服务响应式编程(如 Spring WebFlux)…

吴恩达深度学习——卷积神经网络实例分析

内容来自https://www.bilibili.com/video/BV1FT4y1E74V,仅为本人学习所用。 文章目录 LeNet-5AlexNetVGG-16ResNets残差块 1*1卷积 LeNet-5 输入层:输入为一张尺寸是 32 32 1 32321 32321的图像,其中 32 32 3232 3232是图像的长和宽&…

Java 中的 Spring 框架,以及 Spring Boot 和 Spring Cloud 的区别?

Spring框架是一个开源的Java平台,主要用于简化企业级应用程序的开发。 它通过提供一系列的功能模块,帮助开发者解决常见的编程难题,从而提高开发效率和代码质量。 Spring框架的核心思想是“控制反转”(IoC)和“面向切…

vscode中的编辑器、终端、输出、调试控制台(转载)

在vscode中,编辑器、终端、输出和调试控制台是不同的功能区域,各自具有不同的功能和用途: 1.编辑器(Editor):编辑器是用于编写和编辑代码的主要区域。你可以在编辑器中打开、创建和保存代码文件,并进行代码的编写、 修改和格式化等操作。VSCode提供了丰富的功能来提高开发效率,…

inquirer介绍及配合lerna在Vue中使用示例

目录 安装基本用法使用多个提示框动态选择(动态选项)表单式输入配合lerna在Vue中使用示例 Inquirer 是一个用于创建交互式命令行工具的 Node.js 库,常用于收集用户输入。它提供了多种类型的提示框,可以用于创建交互式应用程序&…