由于细胞簇之间存在异质性,细胞对药物的反应也各不相同。因此,识别对药物有反应的细胞簇对于探索药物作用至关重要,但这仍然是一个巨大的挑战。在这里,作者使用 scRank 解决了这个问题,它采用靶标扰动基因调控网络,通过使用未经处理的单细胞转录组(untreated scRNA-seq)数据进行硅基药物扰动来对对药物有反应的细胞簇进行排序。作者在模拟和真实数据集上对 scRank 进行了基准测试,结果显示 scRank 的性能优于现有方法。当scRank应用在髓母细胞瘤(medulloblastoma)和重度抑郁症(major depressive disorder)数据集时,scRank 识别出的对药物有反应的细胞类型与文献一致。此外,scRank 准确地揭示了对丹参酮 IIA (tanshinone IIA)有反应的巨噬细胞亚群(macrophage subpopulation)及其在心肌梗死(myocardial infarction)中的潜在靶标,并进行了实验验证。总之,scRank 能够使用未经处理的单细胞数据推断对药物有反应的细胞类型,从而加速干预策略对细胞状态影响的研究。
Untreated:指在实验中没有接受任何药物或其他干预措施的单细胞数据。
scRank做法:
- 从untreated数据获得细胞类型特定的GRN
- 从GRN中删除Drug相关的target gene
- 量化原来的GRN和更新后的GRN之间的差距,差距越大,该细胞类型越体现药物有反应
- 识别药物有反应细胞类型的应用:找到细胞类型后,可以设计精准的治疗,也可以揭示治疗机制。
来自:scRank infers drug-responsive cell types from untreated scRNA-seq data using a target-perturbed gene regulatory network, Cell Reports Medicine, 2024
目录
- 背景概述
- scRank概述
背景概述
细胞群对药物的反应表现出极大的异质性,这主要归因于细胞群的多样性。在属于不同细胞类型的特定基因网络背景下,与其靶标(例如受体或酶)相互作用的药物会产生不同的效果。例如,由于不同的通路激活,激酶抑制剂可能会阻碍肿瘤细胞增殖,而对正常细胞的影响却微乎其微。传统上,转录组分析仅产生可聚类的表达数据,而掩盖了不同细胞群的不同分子特征。这些不同的分子特征对于介导细胞对治疗的不同反应至关重要。scRNA-seq的最新进展为在单细胞水平上描述细胞异质性提供了机会。这种方法揭示了大量信息,包括细胞类型的识别、细胞的空间分布、细胞间通讯以及理解疾病进展和细胞对药物反应的关键基因调控机制。
因此,药物开发策略已从针对特定factor转变为针对关键细胞类型,这为精准医疗开辟了一条新途径。最近的研究,包括使用治疗簇(therapeutic clusters)识别可用药细胞群和深度学习方法在疾病背景下确定细胞类型的优先级(DEGAS)。此外,将bulk表达数据与 scRNA-seq 分析相结合的工具为确定表型相关细胞簇提供了互补的见解(Scissor和DEGAS)。尽管 scRNA-seq 取得了进展,但识别对药物治疗有反应的关键细胞类型仍然是一项关键挑战,因为它需要了解药效学,包括药物与其靶标的直接相互作用以及随后对细胞通路的级联影响。这些知识对于理解药物在细胞水平上的作用机制和开发副作用更少的精准治疗策略至关重要。之前分析药物反应的大多数努力都集中在预测基因表达或蛋白质活性的显著变化上,但哪种细胞类型对药物治疗的反应性最高的问题尚未得到充分解决。
在这个研究中,细胞类型的药物反应被定义为不同细胞类型在暴露于药物后表现出细胞状态变化的程度。探索细胞类型的药物反应的一种常见分析手段是基于差异表达基因 (DEG) 的数量。最近,一种名为 Augur 的新方法利用高维空间内的可分离性来确定细胞类型的反应优先级。虽然该策略可以量化药物反应,但它们不可避免地忽略了药物靶标的先验知识。此外,由于此类分析需要疾病-治疗配对数据集(disease-treatment paired),因此它们不适合从仅包含缺乏药物干预的疾病数据集推断对药物有反应的细胞类型。并且通常有足够的疾病数据集,但缺乏药物治疗数据集。事实上,随着疾病状态数据越来越丰富,仅从未经治疗的数据集推断对治疗有反应的关键细胞类型具有越来越大的需求。因此,迫切需要一种方法,将药物靶标的知识与患病细胞状态的知识结合起来,以便从未经治疗的数据集中识别对药物有反应的细胞类型。鉴于药物反应在很大程度上取决于给定药物靶标相关的转录程序,基因调控网络 (GRN) 可能是推断细胞药物反应的合理基础。
为此,作者提出了 scRank,一种药物反应细胞类型推断方法,使用靶标扰动 GRN (tpGRN,target-perturbed GRN) 对未处理的 scRNA-seq 数据中的药物扰动进行建模和评分。该工作基于两个假设。首先,不同细胞类型的内在细胞状态可以通过细胞类型特异性 GRN 反映。其次,细胞中的药物(抑制剂)扰动可以建模为 GRN 中药物靶基因节点的删除,从而产生全局和局部效应。scRank 的算法旨在遵循这些假设。首先,scRank 对细胞类型执行网络推断。为了模拟 GRN 中的药物作用,scRank 删除了药物靶基因节点的所有边以创建 tpGRN。为了量化每种细胞类型的 tpGRN 中药物扰动的程度并依次对其进行优先排序,作者使用流形比对算法(manifold alignment algorithm)和网络扩散(network diffusion)评估了全局和局部扰动效应。作者进行了广泛的模拟实验,以评估 scRank 在识别药物反应细胞类型方面的准确性和稳健性。进一步使用未经治疗的 scRNA-seq 数据集验证了 scRank 的性能,这些数据集包括来自一系列复杂疾病(如癌症和糖尿病)的体内和体外数据。实验表明 scRank 可以成功识别药物靶向细胞类型,并且它优于其他现有方法。此外,作者将 scRank 应用于来自心肌梗死小鼠中巨噬细胞的 scRNA 数据集,并确定了丹参酮 IIA 的另一个潜在靶点。简而言之,scRank 能够从未经处理的 scRNA-seq 数据中推断出药物有反应细胞类型,从而加速治疗机制研究。
scRank概述
作者提出了 scRank (https://github.com/ZJUFanLab/scRank),这是一种计算工具(图 1)。药物扰动剂量不仅对单个靶标产生影响,还会影响下游基因。这些与靶标相关的下游基因往往在pathway中共同表达,并且经常协同作用以响应药物治疗。因此,对药物影响的全面评估必须抛弃简单地检查靶基因的表达,应涵盖药物在更广泛的生物网络中的整体影响。scRank 利用网络方法来预测药物对细胞类型的影响程度。假设:
- 化合物扰动对靶标的抑制作用应沿着GRN传播,最终影响网络的整体结构。通过扰动分子网络中药物直接靶基因节点(根据共表达关系从基因表达谱重建),可以捕捉药物对整个系统的影响。
作者将这种扰动效应建模为计算机药物扰动导致的全局网络差异和靶标相关信号内的局部网络扩散的组合。使用 tpGRN 实现这一假设,作者使用扰动分数来评估药物扰动对每种细胞类型的影响并对其进行排序。这种计算机药物扰动允许人们仅基于未处理的数据推断药物反应中的细胞类型优先级。
- A.未经处理的scRNA-seq数据和直接的target gene(先验知识:来自指定药物抑制的target数据库)。B.基于 tpGRN 对药物反应细胞类型进行排序的概念。首先构建细胞类型特定的 GRN。确定target基因后,通过切断target基因节点的所有边来创建 tpGRN。通过比较未治疗GRN和 tpGRN,可以量化药物扰动从而对细胞类型进行排序。C.局部和整体扰动效应相结合,对每种细胞类型进行药物反应的优先排序。
- D.构建 GRN。从 DGIdb 收集的Drug target gene、前 2,000 个 HVG 和 TF gene 被用于构建 GRN。使用主成分回归PCR获得共表达邻接矩阵。对于每种细胞类型,使用同一套基因节点创建特定的 GRN。
- E.通过流形对齐计算全局扰动效应的示意图。
- F.利用网络扩散计算局部扩散扰动效应示意图。
对于 GRN 重建,首先按细胞类型分离未处理的表达数据,以构建一组细胞类型特定的 GRN。在实践中,使用 Seurat、AnimalTFDB 中的转录因子和 DGIdb 中的药物target联合确定 HVG,并将其作为输入基因特征以构建 GRN。受 scTenifoldNet 和 scTenifoldKnk 的启发,采用了基于机器学习的框架来构建网络。在实践中,使用主成分回归算法结合随机抽样策略和张量分解,可以从表达数据中确定基因之间的共表达关系,从而得到一个代表细胞类型GRN的基因-基因邻接矩阵。
为了对药物反应细胞类型进行排序,首先生成tpGRN来模拟抑制剂的效果,方法是将未处理的GRN中target基因的边权重设置为零(图1E)。然后,使用流形比对算法比较未处理和目标扰动的网络。计算在流形空间中共享的不同条件下相同基因节点之间的距离,以测量网络结构方面的差异,这代表了全局扰动。为了考虑局部扩散,即扰动的影响将从target基因通过下游基因沿着共表达edge传播,作者考虑了 2 跳邻域扩散并对该影响进行了评分(图 1F)。然后将网络中的全局和局部效应合并为扰动分数,以量化扰动程度并对细胞类型进行排序。